데이터 분석 연습
타이타닉호 데이터를 이용한 통계
devmin67
2024. 7. 8. 23:18
본 문서는 wiki docs의 한 권으로 끝내는 <판다스 노트>를 리뷰하는 문서입니다
출처: https://wikidocs.net/book/4639
한 권으로 끝내는 <판다스 노트>
판다스는 파이썬에서 가장 널리 쓰이는 라이브러리 가운데 하나입니다. 데이터 분석 전문가가 파이썬으로 데이터 분석을 한다면, 아마 대부분은 가장 먼저 판다스 라이브러리를 임포트할 …
wikidocs.net
describe() - 요약통계
전반적인 주요 통계를 확인할 수 있습니다.
기본 값으로 수치형(Numerical) 컬럼에 대한 통계표를 보여줍니다.
- count: 데이터 개수
- mean: 평균
- std: 표준편차
- min: 최솟값
- max: 최대값
- 타이타닉 데이터를 df변수에 로드하는 코드
주어진 데이터프레임에서 성인남성의 평균을 구하는 코드
df.loc[df['adult_male'], 'age'].mean()
-median() : 데이터를 오름차순으로 정렬한 다음, 중앙값을 출력한다.