본문 바로가기
데이터 분석 연습

타이타닉호 데이터를 이용한 통계

by devmin67 2024. 7. 8.

본 문서는 wiki docs의 한 권으로 끝내는 <판다스 노트>를 리뷰하는 문서입니다

출처: https://wikidocs.net/book/4639

 

한 권으로 끝내는 <판다스 노트>

판다스는 파이썬에서 가장 널리 쓰이는 라이브러리 가운데 하나입니다. 데이터 분석 전문가가 파이썬으로 데이터 분석을 한다면, 아마 대부분은 가장 먼저 판다스 라이브러리를 임포트할 …

wikidocs.net


describe() - 요약통계

전반적인 주요 통계를 확인할 수 있습니다.

기본 값으로 수치형(Numerical) 컬럼에 대한 통계표를 보여줍니다.

  • count: 데이터 개수
  • mean: 평균
  • std: 표준편차
  • min: 최솟값
  • max: 최대값

- 타이타닉 데이터를 df변수에 로드하는 코드

 


주어진 데이터프레임에서 성인남성의 평균을 구하는 코드

 

df.loc[df['adult_male'], 'age'].mean()

 

-median() : 데이터를 오름차순으로 정렬한 다음, 중앙값을 출력한다.