15 December 2019

소문난 명강의 김도형의 데이터 사이언스 스쿨 수학 편 파이썬 라이브러리로 배우는 데이터 과학 필수 수학

데이터를 공부하는 사람이라면 한번쯤은 들어가 봤을법한 사이트인 데이터사이언스스쿨 사이트를 운영하는 김도형 박사님이 쓰신 책이다. 궁금한게 있어서 검색을 하다보면 자주 들어가서 보게 되는 사이트이고 볼 때마다 정리가 꼼꼼해서 도움을 많이 받은 사이트이다.

이 사이트 내용 그대로 책으로 나와도 되겠다는 생각을 자주 해왔는데 이 사이트의 내용이 정말 책으로 출판되었다. 사이트를 통해 봤던 내용을 정리된 책으로 보니 사이트 만큼이나 친절한 느낌을 받았다.

데이터 사이언스 스쿨

데이터 분야의 일을 하면서 늘 수학은 어렵고 힘든점이었고 개발자라서 그런지 수학공식보다는 코드로 이해를 하는게 편했었다. 이과생이기는 했지만 수포자였기 때문에 통계, 머신러닝, 딥러닝에서 등장하는 수학공식은 늘 동공지진을 유발했다.

또, 언제 배웠는지 기억도 나지 않는 로그, 미분, 적분을 마주해야 할 때는 공식보다는 코드를 먼저 봤는데 수학에 뭔가 빚을 진 기분이었다. 이런 기분을 조금이라도 덜어보고자 이 책의 출간을 기다렸는데 마침 기회가 되어 한빛미디어의 <나는 리뷰어다=""> 이벤트로 이 책을 읽게 되었다.

초반부에 이 책은 도구를 어떻게 만들지가 아니라 어떻게 사용할지를 초점을 두고 만들어졌다고 한다. 나 또한 도구를 만드는 것보다는 수학공식을 사용해서 어떻게 분석이나 머신러닝에 활용할지에 대해 목적을 두고 읽었는데 내 목적에 딱 부합하는 책이었다.

책의 두께가 상당하기는 하지만 분석에 자주 쓰이는 내용들을 최대한 알려주고자 하는 저자 분의 의도가 느껴지는 책이었다.

파이썬의 대표적인 라이브러리를 활용해서 설명하고 있으며 수학공식과 함께 어떻게 활용해야 하는지 친절하게 설명이 되어있다. 또 수학적 특징에 따라 어떤 라이브러리를 사용하면 좋을지에 대한 내용을 함께 담고 있어서 활용하고자 하는 의도에 따라 라이브러리를 선택할 수 있도록 도움을 준다.

이 책에서 가장 인상적이었던 부분이 바로 컴퓨터 사용자에 대한 부분이었다. 가끔 라이브러리 설치로 고생하시는 분들을 도와드리다 보면 컴퓨터의 이름이 한글로 된 분들을 종종 봐 왔다. 사소할 수 있는 부분이지만 컴퓨터 사용자의 한글 이름 때문에 설치와 설정 지옥으로 며칠을 고생하시는 분들을 많이 봐 왔기 때문에 꼭 필요한 내용이 잘 소개가 되어있다는 생각이 들었다.

주요 라이브러리의 역할을 소개하고 있고 어떻게 사용하면 좋을지에 대한 내용이 적절하게 들어가 있다.

함수와 역함수도 자주 그리게 되는 그래프 중 하나인데 공식과 함께 잘 설명이 되어있다. 요즘 수학을 사용하며 느끼는 건 중고등학교 때 이렇게 수학을 배웠다면 훨씬 잘 이해할 수 있지 않았을까라는 아쉬움이 든다. 공식만으로는 이해하기 힘든 부분을 시각화를 하게 되면 왜 이런 공식을 써야 하는지 훨씬 잘 와닿게 되는거 같다.

많이 활용되는 로지스틱 함수도 공식과 그래프를 함께 보면 더 잘 이해할 수 있는거 같다. 회귀 뿐만 아니라 분류에도 잘 쓰이며 머신러닝, 딥러닝 고루 사용되는데 이 책을 통해 그간 그림처럼 봐 왔던 공식을 이해하는데 도움이 되었다.

해설지도 따로 제공이 되어서 책과 분철할 수 있게 되어 있다. 책 두께가 상당한 편인데 들고 다니면서 볼때 분철하면 좋을 것 같다. 데이터 사이언스 스쿨 사이트의 내용이 상당히 방대한 편인데 제목에 “수학편”이라고 되어 있으니 다른편도 나오지 않을까 기대가 된다.

이 책의 코드는 아래 깃헙에서 받을 수 있다.

datascienceschool/math: 데이터 사이언스 스쿨 : 수학편 코드 주피터노트북

전체적으로 난이도가 좀 있는 책으로 파이썬 코드를 통해 수학 공식을 이해하고자 하거나 머신러닝, 딥러닝 알고리즘을 자주 사용해 왔지만 수학에 빚을 지고 있는 듯한 느낌을 받는 사람이 보면 좋을거 같다.