Pandas
-
고수준의 자료구조(Series, Dataframe)와 파이썬에서 빠르게 쉽게 사용할 수 있는 데이터 분석도구를 포함하고 있다.
-
Numpy, Scipy, Statsmodels, Scikit-learn 등과 함께 사용한다.(주로 전처리에 이용)
-
Numpy의 배열과 유사하나, Numpy는 단일 산술 배열 데이터를 다루는데 특화되어 있는 반면, pandas 는 표 형식의 데이터나 다양한 형태의 데이터를 다루는 데 초점을 맞춰 설계했다는 것임
-
preprocessing with pandas
-
merging with pandas