상세 컨텐츠

본문 제목

데이터 분석 공부 #4

데이터 분석

by jii 2023. 7. 10. 22:32

본문

<불필요한 데이터 삭제하기>

필요한 데이터 다운받기

판다스 데이터 프레임으로 읽기

 

-열 삭제하기:loc(),불리언 배열

번호~등록일자까지의 열 선택(마지막 열 제외)

column의 속성 확인->index 클래스 객체

원소별 비교로 true/false 반환->넘파이 배열

선택된 열만 출력 가능

 

-열 삭제하기:drop()

삭제하고자 하는 열의 이름, axis 매개변수에 1 지정하면 열을 삭제하는 것

ns_book 변수에 저장하지 않고 데이터 프레임을 바로 수정하려면

=>inplace 매개변수를 True로 설정

 

 

-비어있는 값 삭제하기:dropna()

데이터 프레임에서 nan 값 포함된 열 삭제(axis=1)

=>nan값 적어도 하나 있으면 삭제

모든 값이 nan인 열 삭제

=>how 매개변수 all로 지정

 

-행 삭제하기:drop()

처음 2개 행 삭제

 

-행 삭제하기:[]연산자와 슬라이싱

인덱스 0,1인 행 제외 모두 선택

처음 2개 행만 선택

 

-행 선택/삭제하기:[]연산자와 불리언 배열

특정 조건의 행만 선택

변수 사용 없이 조건 설정

 

-중복된 행 찾기:duplicated()

duplicated(): 기본적으로는 모든 열을 기준으로 중복된 행이 있는지 탐색

=>기준을 설정하려면 subset 매개변수 사용

어떤 데이터가 중복인지 확인

keep 매개변수 false=>중복된 모든 행을 true로 표시한 불리언 배열 반환하는 역할

 

-그룹화하기:groupby()

dropna를 false로 설정하면 nan값 있는 행도 포함

중복된 행을 true로 표시

불리언 배열을 반전시켜 고유 행을 true로 표시

고유 행만 선택

중복된 행 있는지 확인

원본 데이터 프레임의 인덱스 설정하기

=>inplace 변수 true로 설정하면 새로운 데이터프레임 필요x

원본 데이터프레임에 다른 데이터 프레임 추가하여 값 업데이트:update()

인덱스 열 해제:reset_index()

원본 데이터 프레임과 새로 만든 데이터 프레임에서 대출건수 기준으로 개수 확인

'데이터 분석' 카테고리의 다른 글

프로젝트 준비 #1  (0) 2023.07.14
데이터 분석 공부 #5  (0) 2023.07.11
데이터 분석 공부 #3  (0) 2023.07.09
데이터 분석 공부 #2  (0) 2023.07.06
데이터 분석 공부 #1  (0) 2023.07.05

관련글 더보기

댓글 영역