본문 바로가기

(3)
(책) "모두의 SQL: 누구나 쉽게 배우는 데이터 분석 기초" (김도연 지음, 길벗 출판) 나는 data 분석을 위해 SQL 공부가 필요하다. SQL 입문서로 "모두의 SQL: 누구나 쉽게 배우는 데이터 분석 기초" (김도연 지음)을 선택하였다. 아주 만족스럽다. SQL이란? Structured Query Language (구조화 질의어, SQL)는 관계형 데이터베이스 관리 시스템(RDBMS)의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어이다. SQL 은 정형화된 데이터를 대상으로 분석을 하기 용이하다. 정형화된 데이터 vs 비정형 데이터 (pg.18) 정형 데이터는 (structured data) - 틀이 잡혀 있는 데이터, 체계화된 데이터 - 높은 안정성, 유연하지 못한 구조 - 금융, 제조 등 대부분 기업의 업무용 데이터베이스 비정형 데이터 - 틀이 잡혀 있지 않고, 사전 ..
(책 소개) "Do it! 데이터 분석을 위한 판다스 입문" (Chen, Daniel Y 지음 / 김영하 옮김, 이지스 퍼블리싱 출판) - Python 의 package 중 pandas 소개 Python을 활용해 data 분석을 용이하게 도와주는 package 중 Pandas가 있다. "R 과 Python의 차이"에 대한 내 생각 1. R은 통계 분석 및 보고를 위한 프로그레밍 언어이자 소프트웨어 환경이다. 수학자 및 통계학자들에게 보다 친숙한 직관을 토대(Matrix - 행결)로 구축되었다. R 에 기본적으로 포함된 dataframe 기능을 통해 숫자 외의 문자를 data 처리할 수 있다. 교육기관 (대학교 및 대학원) 의 수학과, 통계학과, 경제학과 등에서 사용하는 경우가 많아 관련 전공자들은 경험이 있는 경우가 많다. 다만, 범용 프로그래밍 언어는 아니므로 실무 현장에서 프로그래머들은 모르거나 생소한 경우가 많다. 2. Python 은 범용 프로그래밍 언어이다. 초기 설치 후의 Pyth..
데이터 분석과 프로그래밍 기초를 위한 책 리스트 #1 (2021.4.11.) 데이터 분석과 프로그래밍 기초를 위한 책 리스트 #1 # 나는 괜찮다는 느낌이 드는 책을 일단 구입하는 편이다. 책이 절판되어, 나중에 구하기 불가능할 수도 있거든. # 내용 대비 한국의 책들은 가격이 저렴한 편이라 생각한다. 저자의 노하우, 직관, 그리고 기술을 배워서 내가 활용하는 가치는 정말 크다. 책 값 = 저자와의 만남에서 내가 대접할 차값 + 음식값 + 시간가치 라고 여기면 충분히 책을 구입할 만하다. # 프로그래밍 책들을 굳이 살 필요 없이, 인터넷에서 서칭만 해서도 충분하다는 사람들이 있다. 나는 어느정도 동의하지만, 100% 동의하지는 않는다. 종이책의 장점도 많다 1) (컴퓨터 스크린에서 읽는 것과 대비하여) 종이책을 읽을 경우 눈이 덜 피로하여 더 오래 동안 읽을 수 있다. 2) 책으..