24 July 2022

파이썬을 활용한 베이지안 통계(2판)

초판은 절판이 되어 2판이 나오기 전에는 도서관에서 겨우 구해 볼 수 있었던 책이다. 그것도 근처 도서관에는 없어서 상호대차를 통해 어렵게 구해봤던 기억이 난다. 그래서 어렵게 초판을 구해보던 기억을 떠올려 이 책의 2판의 출간이 엄청 반가웠다.

가장 어려우면서도 꼭 필요한 내용이 확률과 통계 그것도 베이지안 통계다. 관련 책을 보고 있으면 수식으로 압도되는데 이 책은 파이썬 코드를 통해 설명하고 있다.

파이썬의 과학계산 라이브러리는 추상화가 잘 되어 있기 때문에 간단한 코드를 잘 가져다 사용할 수 있게 잘 풀어쓴 설명이 꼭 필요한데 이 책이 그 역할을 하고 있다.

책의 구성은 다음과 같다.

  • 확률, 베이즈 정리, 분포, 비율 추정, 수량 추정, 공산과 가산, 최솟값, 최댓값
  • 혼합 분포, 포아송 과정, 의사결정분석, 검정, 비교, 분류, 추론, 생존 분석, 표식과 재포획
  • 로지스틱 회귀, 회귀
  • 켤레사전분포, MCMC, 근사 베이지안

머신러닝이나 딥러닝을 다뤄보거나 데이터 분석을 하다보면 등장하는 통계적인 내용을 파이썬 코드 + 시각화와 함께 설명하고 있다. 또, 각 챕터마다 요약과 연습 문제가 있어 읽었던 내용을 다시 점검해 볼 수 있는 점도 좋다.

단, 이 책을 볼 때 기본적인 파이썬 문법, NumPy, Scipy, statmodels, Matplotlib 등의 파이썬 데이터 과학 도구의 기본 사용법을 이해하고 있다는 전제하에 설명이 되며, 또 scipy 에 구현되어 있는 통계적인 기능들은 대부분 추상화가 되어 있기 때문에 추상화된 깊은 부분의 내용을 이해하기 위한 노력도 필요하다는 점을 알아두어야 한다.

그렇기 때문에 파이썬 기초 문법을 이해하고 있고 파이썬 데이터 과학 주요 라이브러리에 대한 사용법을 어느정도 알고 있다면 베이지안 통계를 포기했던 사람에게 한 줄기 빛이 되는 책이다.

책 뒷편에 있는 내용처럼

  • 프로그래밍으로 베이지안 통계를 배우고 이해하며
  • 추정, 예측, 의사 결정 분석, 증명, 베이지안 가설 검정 등의 문제
  • 동전, 주사위, 쿠기 그릇, 월드컵 문제, 신장 종양 문제 등의 예제를 통해 설명하고 있으며
  • 실생활에 실생활의 문제를 푸는데 사용하는 계산법을 익히는데 도움이 되는 책이다.

곁에 두고 보고 또 보고 싶은 책이다.

이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.