NumPy 기초 문법
- NumPy는 파이썬에서 수치 계산을 위한 핵심 라이브러리입니다. 주로 다차원 배열(array)을 다루는데 사용되며, 고성능 수학 함수를 제공합니다. NumPy는 데이터 과학, 머신러닝, 인공지능 등의 여러 분야에서 널리 사용됩니다.
NumPy의 reshape 메서드는 배열의 모양(Shape)을 변경하는 데 사용됩니다. 즉, 기존 배열의 요소 수는 동일하지만 다른 모양으로 재구성할 수 있습니다. 이는 배열의 차원을 변경하거나, 행과 열의 개수를 조정하는 데 유용합니다.

NumPy에서 브로드캐스팅(Broadcasting)은 서로 다른 크기의 배열간에도 산술 연산이 가능하도록 하는 메커니즘입니다. 이는 배열 간 연산을 보다 간편하게 하고, 코드의 가독성을 높이며, 반복문을 사용하지 않고도 배열 연산을 수행할 수 있게 합니다.
브로드캐스팅 규칙
NumPy에서 브로드캐스팅은 다음과 같은 규칙을 따릅니다:
- 차원의 크기가 다를 때:
- 두 배열의 차원 수가 다르면, 차원 수가 맞을 때까지 1을 추가하여 차원을 맞춥니다.
- 한 배열의 차원이 1일 때:
- 해당 차원의 길이를 다른 배열의 해당 차원의 길이에 맞춥니다.
- 두 배열의 차원의 길이가 모두 1이거나 어느 한 배열의 차원이 없을 때:
- 두 배열의 해당 차원의 길이가 1로 간주되어 연산이 가능합니다.
1. Series
- 정의: Series는 1차원 데이터 배열로, 인덱스(index)와 값(value)을 갖습니다. 즉, 인덱스로 레이블링된 데이터의 모음입니다.
- 특징:
- 모든 데이터 유형을 포함할 수 있습니다 (정수, 부동 소수점, 문자열, 파이썬 객체 등).
- 배열과 유사하지만 인덱스가 붙어 있어 데이터에 레이블을 지정할 수 있습니다.
- NumPy 배열과 비슷하게 작동하지만 더 많은 기능을 제공합니다.
2. DataFrame
- 정의: DataFrame은 2차원 데이터 구조로, 여러 개의 열(column)을 가진 테이블 형태의 데이터를 저장합니다. 각 열은 서로 다른 유형의 데이터를 포함할 수 있습니다.
- 특징:
- 행(row)과 열(column)로 구성되며, 각 열은 Series 객체입니다.
- 행과 열 모두에 레이블(index)을 가지고 있습니다.
- 데이터베이스의 테이블이나 엑셀 스프레드시트와 유사한 구조를 가집니다.
- loc를 기준으로 (loc를 외워서) iloc와 구분하자
- iloc는 컬럼형을 쓸 수 없고, 인덱스 형태로 쓴다 -> 직관적이지 않다
git ignore적용
출처: https://dev-jwblog.tistory.com/51
[Git] .gitignore 다시 적용 시키기
프로젝트를 진행하면서 .gitignore 파일을 나중에 추가하였거나, 초반에 잘못 작성하여 수정하여 다시 적용시키게 되는 경우가 종종 발생합니다. 이러한 상황에서 .gitignore 를 다시 프로젝트에 적
dev-jwblog.tistory.com
'한국경제 with toss' 카테고리의 다른 글
7/3 데이터 시각화 (1) | 2024.07.03 |
---|---|
7/2 - 크롤링 (0) | 2024.07.02 |
6/28 - 반복문, 함수, 가변 매개변수, class (0) | 2024.06.28 |
6/27 iterable과 sclar자료형의 차이 (0) | 2024.06.27 |
6/26 파이썬 기초 문법 (0) | 2024.06.26 |