-엑셀 vs csv
엑셀: 시각적으로 데이터 파악 편리
csv: 텍스트 파일, 분석 시 사용하는 파일은 csv 형태
: 레코드(행)/필드(열)
-컴퓨터에 다운 받은 csv 파일 불러오기: open()
*만약 encoding='euc-kr'이 없다면??
=>'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte
open() 함수는 기본적으로 텍스트 파일이 UTF-8 형식으로 저장되어 있다고 가정.
그러나 한글 텍스트는 여전히 완성형 인코딩인 EUC-KR을 사용하는 경우 많음.
즉, 인코딩 형식을 지정하여 해결.
-판다스 데이터 프레임
엑셀 파일과 형식 비슷(가상의 테이블)
배열과 차이점: 각 열에 다른 형태의 데이터 올 수 있음
-csv 파일을 데이터 프레임으로 읽기: read_csv()
*low_memory=FALSE
판다스에서 csv 파일 읽을 때 파악한 데이터 타입이 달라지면 경고 발생
*head()
처음 다섯개 행 확인 가능
*인덱스
첫번째 열
-데이터 프레임을 csv 파일로: to_csv()
데이터 분석 공부 #3 (0) | 2023.07.09 |
---|---|
데이터 분석 공부 #2 (0) | 2023.07.06 |
KBO MVP 예측 프로젝트 (0) | 2022.12.29 |
야구 스탯(BASEBALL STATS) (0) | 2022.11.09 |
SQL 기초 (0) | 2022.10.17 |
댓글 영역