상세 컨텐츠

본문 제목

데이터 분석 공부 #1

데이터 분석

by jii 2023. 7. 5. 20:49

본문

<csv 파일과 데이터 프레임>

 

-엑셀 vs csv

엑셀: 시각적으로 데이터 파악 편리

csv: 텍스트 파일, 분석 시 사용하는 파일은 csv 형태

       : 레코드(행)/필드(열)

 

-컴퓨터에 다운 받은 csv 파일 불러오기: open()

*만약 encoding='euc-kr'이 없다면??

=>'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte 

open() 함수는 기본적으로 텍스트 파일이 UTF-8 형식으로 저장되어 있다고 가정.
그러나 한글 텍스트는 여전히 완성형 인코딩인 EUC-KR을 사용하는 경우 많음.

즉, 인코딩 형식을 지정하여 해결.

 

-판다스 데이터 프레임

엑셀 파일과 형식 비슷(가상의 테이블)

배열과 차이점: 각 열에 다른 형태의 데이터 올 수 있음

 

-csv 파일을 데이터 프레임으로 읽기: read_csv()

*low_memory=FALSE

판다스에서 csv 파일 읽을 때 파악한 데이터 타입이 달라지면 경고 발생

 

*head()

처음 다섯개 행 확인 가능

 

*인덱스

첫번째 열

 

-데이터 프레임을 csv 파일로: to_csv()

파일 창 디렉터리에 생성된 weather1 확인 가능

'데이터 분석' 카테고리의 다른 글

데이터 분석 공부 #3  (0) 2023.07.09
데이터 분석 공부 #2  (0) 2023.07.06
KBO MVP 예측 프로젝트  (0) 2022.12.29
야구 스탯(BASEBALL STATS)  (0) 2022.11.09
SQL 기초  (0) 2022.10.17

관련글 더보기

댓글 영역