나는 data 분석을 위해 SQL 공부가 필요하다. SQL 입문서로 "모두의 SQL: 누구나 쉽게 배우는 데이터 분석 기초" (김도연 지음)을 선택하였다. 아주 만족스럽다.
SQL이란?
Structured Query Language (구조화 질의어, SQL)는 관계형 데이터베이스 관리 시스템(RDBMS)의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어이다. SQL 은 정형화된 데이터를 대상으로 분석을 하기 용이하다.
정형화된 데이터 vs 비정형 데이터 (pg.18)
정형 데이터는 (structured data)
- 틀이 잡혀 있는 데이터, 체계화된 데이터
- 높은 안정성, 유연하지 못한 구조
- 금융, 제조 등 대부분 기업의 업무용 데이터베이스
비정형 데이터
- 틀이 잡혀 있지 않고, 사전 정의가 없는 데이터
- 다양하고 방대항 양의 데이터, 별도의 분석 처리 기술이 필요
- 텍스트, 이미지, 음원 데이터, 빅데이터
SQL로 할 수 있는 것과 활용 영역 (pg.25)
1. 데이터 처리를 통해 애플리케이션 개발에 사용한다.
2. 데이터를 추출, 수집, 가공할 수 있다.
3. 데이터를 검색하고 분석할 수 있다.
4. 그 외에도 여러 응용 분야와 연계하여 사용할 수 있다 (SAP, R, SAS 등)
"모두의 SQL: 누구나 쉽게 배우는 데이터 분석 기초" 는 좋은 SQL 입문서이다. 이 책은 SQL 구동환경으로 Oracle Database Express Edition 을 활용하는데, 어디서 이 플랫폼을 다운로드 받고 설치하는지부터 자세하고 친절하게 설명하고 있다. Oracle Database Expression Edition URL : Oracle Database Express Edition (XE) Downloads | Oracle 대한민국
코딩은 외국어와 비슷하다. 자주 사용하지 않으면 까먹는다. If you don't use it, you lose it 의 개념과 비슷하다. SQL 기초 문법(query)도 마찬가지다. 자주 사용하지 않는 query는 까먹는다. 그래서 입문서와 기본 개념서는 언제나 필요하다: 언제 다시 처음부터 개념을 되새김질할 필요가 있기 때문이다.
SQL에 대한 기본 개념서 및 입문서로서 훌륭한 책이다. 추천한다.
끝