본문 바로가기

(책 소개) "Do it! 데이터 분석을 위한 판다스 입문" (Chen, Daniel Y 지음 / 김영하 옮김, 이지스 퍼블리싱 출판) - Python 의 package 중 pandas 소개

Python을 활용해 data 분석을 용이하게 도와주는 package 중 Pandas가 있다. 

"R 과 Python의 차이"에 대한 내 생각

1. R은 통계 분석 및 보고를 위한 프로그레밍 언어이자 소프트웨어 환경이다. 수학자 및 통계학자들에게 보다 친숙한 직관을 토대(Matrix - 행결)로 구축되었다. R 에 기본적으로 포함된 dataframe 기능을 통해 숫자 외의 문자를 data 처리할 수 있다. 교육기관 (대학교 및 대학원) 의 수학과, 통계학과, 경제학과 등에서 사용하는 경우가 많아 관련 전공자들은 경험이 있는 경우가 많다. 다만, 범용 프로그래밍 언어는 아니므로 실무 현장에서 프로그래머들은 모르거나 생소한 경우가 많다. 

 

2. Python 은 범용 프로그래밍 언어이다. 초기 설치 후의 Python 에는 행렬(matrix) 분석 및 데이터 처리를 위한 기능은  없다. 데이터 분석을 위해 Padnas(판다스) 와 SciPy(사이파이) 등 package를 많은 python 사용자들이 설치한다. Matrix(행결) 구현 및 분석을 위해 python을 설치한다. 직관적인 범용 프로그래밍 언어인 덕분에, 실무 현장의 프로그래머들이 친숙한 경우가 많다. 

 

나는 python 의 pandas 및 numpy 기능을 활용하여 코딩한 후, 실무 프로그래머와 소통하고자 하여 이 책을 구매하여 실무에 적용중이다: "Do it! 데이터 분석을 위한 판다스 입문" (Chen, Daniel Y 지음 / 김영하 옮김, 이지스 퍼블리싱 출판)

 

 

책 표지: "데이터 분석을 위한 판다스 입문" 

나는 "Do it!" 책 series를 몇 권 사봤는데, (Do it! Jump to Python 등) 초보들을 위한 입문서를 잘 펴내는 series라 생각이 든다. 먼저 실습 환경 설치부터 차근차근 설명해 주고 풍부한 예제를 제공한다. 아래 목차를 보면 1. 실습 환경 준비, 2. 시작하기, 3. 데이터 프레임, 4. 그래프 그리기 로 진행하면서 초보 사용자가 부담없이 예제를 직접 구현하면서 깨달을 수 있게 도와준다. 

"Do it! 데이터 분석을 위한 판다스 입문"의 목차1

 

설명과 예제의 균형이 잘 잡힌 내용들이다. 

'프로그래밍 책이 필요없다. 인터넷을 뒤져서 적당한 내용을 찾아 배우면 된다'라는 분들에게는 '1. Panda 공식 사이트의 문서는 method 설명을 단순히 나열한 것에 불과한 데다가, 2. 그 method의 수도 매우 많아서 pandas의 기본기가 없는 독자들에게는 공식 문서가 입문을 방해 할 수 있습니다' 라는 면을 감안하고, 기본적인 부분들 (pip 설치 방법 등) 을 정형화된 방식으로 구현하여 시간을 단축하는 것이 나는 중요하다고 판단한다. '누군가 적절한 실습을 통해 데이터를 올바르게 처리하는 연습을 할 수 있도록 도움을 준다면' 새로운 개념을 익힐 떄 들이는 시간과 노력 대비 결과를 최적화할 수 있다고 생각한다. 

 

판다스를 처음 시작하는 사람들을 위한 책

 

이 책의 저자는 한 책을 기획하고 작성하는 과정에서 어떤 정보를 넣고, 어떤 정보를 제공할 지를 고민하였을 것이다. pandas 입문을 위한 액기스만 딱 뽑아서 정리한 책으로 정말 유용하다.