데이터 분석 연습

타이타닉호 데이터로 조회, 정렬, 조건필터 연습

devmin67 2024. 7. 8. 13:28

본 문서는 wiki docs의 한 권으로 끝내는 <판다스 노트>를 리뷰하는 문서입니다

출처: https://wikidocs.net/book/4639

 

한 권으로 끝내는 <판다스 노트>

판다스는 파이썬에서 가장 널리 쓰이는 라이브러리 가운데 하나입니다. 데이터 분석 전문가가 파이썬으로 데이터 분석을 한다면, 아마 대부분은 가장 먼저 판다스 라이브러리를 임포트할 …

wikidocs.net

 


pandas에서 사용하는 조회, 정렬, 조건필터에 대해서 알아봅시다.

 

모듈 import
타이타닉 데이터 로드하기

 

- value_counts()

column 별 값의 분포를 확인할 때 사용하고,

남자, 여자, 아이의 데이터 분포를 확인하고 싶다면 다음과 같이 실행합니다.

 


열 각각을 리스트화 해서 정렬하기(기본은 오름차순)



 

tips.loc[tips['day'].isin(['Fri', 'Sat']) & (tips['tip'] < 10), ['total_bill', 'tip', 'smoker', 'time']].head(10)