상세 컨텐츠

본문 제목

데이터 분석 공부 #5

데이터 분석

by jii 2023. 7. 11. 15:30

본문

<잘못된 데이터 수정하기(1)>

데이터 프레임 다운로드/확인

데이터 프레임의 요약 정보 확인

 

 

-누락값 처리하기

누락값 개수 확인

=>isna(): 각 행 비어있는지의 여부 불리언 배열 반환

누락값 표시하기(1): none

정수 값이 있는 열에 none 입력하면 누락값으로 인식

판다스에서는 nan값을 실수로 저장함

=>다시 정수형으로 바꾸기 위해 astype() 사용

문자열에서는 none 입력해도 nan으로 표시x

=>np.nan 사용

누락값 표시하기(2):np.nan

누락값 바꾸기(1):loc()

 

isna()는 누락값을 찾아 불리언 배열로 반환

누락값을 빈 문자열로 변환

누락값 바꾸기(2): fillna()

특정 열만 선택해서 fillna() 사용 가능

(여러개의 열 선택 가능)

누락값 바꾸기(3): replace()

바꾸려는 값 여러개일 때

열마다 다른 값으로 바꿀 때

 

-정규 표현식

숫자 찾기

 

패턴 안에 있는 첫번째 괄호로 연도를 표시

=>3,4번째 \d

 

regex 매개변수 true로 설정

=>정규 표현식 사용

 

r문자

=>정규 표현식을 다른 문자열과 구분하기 위해 사용

 

*  \d{2}(\d{2})는 \d\d(\d\d)와 같은 의미

문자 찾기

'데이터 분석' 카테고리의 다른 글

수업 자료(1)  (0) 2023.07.23
프로젝트 준비 #1  (0) 2023.07.14
데이터 분석 공부 #4  (0) 2023.07.10
데이터 분석 공부 #3  (0) 2023.07.09
데이터 분석 공부 #2  (0) 2023.07.06

관련글 더보기

댓글 영역