필요한 데이터 다운받기
판다스 데이터 프레임으로 읽기
-열 삭제하기:loc(),불리언 배열
번호~등록일자까지의 열 선택(마지막 열 제외)
column의 속성 확인->index 클래스 객체
원소별 비교로 true/false 반환->넘파이 배열
선택된 열만 출력 가능
-열 삭제하기:drop()
삭제하고자 하는 열의 이름, axis 매개변수에 1 지정하면 열을 삭제하는 것
ns_book 변수에 저장하지 않고 데이터 프레임을 바로 수정하려면
=>inplace 매개변수를 True로 설정
-비어있는 값 삭제하기:dropna()
데이터 프레임에서 nan 값 포함된 열 삭제(axis=1)
=>nan값 적어도 하나 있으면 삭제
모든 값이 nan인 열 삭제
=>how 매개변수 all로 지정
-행 삭제하기:drop()
처음 2개 행 삭제
-행 삭제하기:[]연산자와 슬라이싱
인덱스 0,1인 행 제외 모두 선택
처음 2개 행만 선택
-행 선택/삭제하기:[]연산자와 불리언 배열
특정 조건의 행만 선택
변수 사용 없이 조건 설정
-중복된 행 찾기:duplicated()
duplicated(): 기본적으로는 모든 열을 기준으로 중복된 행이 있는지 탐색
=>기준을 설정하려면 subset 매개변수 사용
어떤 데이터가 중복인지 확인
keep 매개변수 false=>중복된 모든 행을 true로 표시한 불리언 배열 반환하는 역할
-그룹화하기:groupby()
dropna를 false로 설정하면 nan값 있는 행도 포함
중복된 행을 true로 표시
불리언 배열을 반전시켜 고유 행을 true로 표시
고유 행만 선택
중복된 행 있는지 확인
원본 데이터 프레임의 인덱스 설정하기
=>inplace 변수 true로 설정하면 새로운 데이터프레임 필요x
원본 데이터프레임에 다른 데이터 프레임 추가하여 값 업데이트:update()
인덱스 열 해제:reset_index()
원본 데이터 프레임과 새로 만든 데이터 프레임에서 대출건수 기준으로 개수 확인
프로젝트 준비 #1 (0) | 2023.07.14 |
---|---|
데이터 분석 공부 #5 (0) | 2023.07.11 |
데이터 분석 공부 #3 (0) | 2023.07.09 |
데이터 분석 공부 #2 (0) | 2023.07.06 |
데이터 분석 공부 #1 (0) | 2023.07.05 |
댓글 영역