AI
[AI] Pandas (작성중)
owls
2023. 5. 12. 14:36
728x90
Pandas
데이터 조작 및 분석을 위해 Python 프로그래밍 언어로 작성된 software library입니다.
적용되는 데이터
- SQL 테이블 또는 Excel 스프레드 시트에서와 같이 이질적으로 유형이 지정된 열이 있는 테이블 형식 데이터
- 행 및 열 레이블이 포함된 임의의 행렬 데이터
- 시계열 데이터
- 다른 형태의 관찰 / 통계 데이터 세트
함수
차원 | 이름 | 설명 |
1차원 | Series | 균일한 유형의 배열로 표시된 1차원 데이터. 테이블의 열과 같다. 모든 유형의 데이터를 보유하는 1차원 배열. |
2차원 | DataFrame | 2차원 배열 또는 행과 열이 있는 테이블과 같은 2차원 데이터 구조. |
DataFrame
다중 함수 적용하는 Method는 다음과 같다.
- 테이블 형태로 정리해주는 함수 어플리케이션 : pipe()
- 행 혹은 열로 정리해주는 함수 어플리케이션 : apply()
- 집합 API : agg(), transform()
- 요소별 적용 함수 : applymap()
transform
데이터 변환에 사용하는 함수.
DataFrame.transform(func, axis=0, *args, **kwargs)
Return : DataFrame
길이가 자신과 같아야 하는 데이터프레임입니다.
-ex)
agg
집계(aggregating) 유형 작업만 수행합니다.
DataFrame.agg(func=None, axis=0, *args, **kwargs)
- Parameter
func : function, str, list or dict
데이터 집계에 사용할 함수입니다. 함수인 경우,
데이터프레임을 전달할 때 작동하거나 데이터프레임.apply에 전달할 때 작동해야 합니다.
-허용되는 조합:
-function
-string function name
-list of functions and/or function names, e.g. [np.sum, 'mean']
-dict of axis labels -> functions, function names or list of such.
axis : {0 or ‘index’, 1 or ‘columns’}, default 0
0 또는 '인덱스'인 경우: 각 열에 함수를 적용합니다.
1 또는 '열'인 경우: 각 행에 함수를 적용합니다.
*args
함수에 전달할 위치 인자
**kwargs
함수에 전달할 키워드 인자
-Returns
Returns : scalar, Series or DataFrame
The return can be:
- scalar : 단일 함수로 Series.agg가 호출될 때
- Series : 단일 함수로 DataFrame.agg가 호출될 때
- DataFrame :여러 함수와 함께 DataFrame.agg가 호출될 때
Return scalar, Series or DataFrame.
-ex)
728x90