25 June 2023

행동 데이터 분석을 알려주는 이 책은 통계적인 기초지식부터 응용까지를 다루며 실제 비즈니스 상황에서 어떻게 활용해야하는지에 대한 구체적인 가이드를 제시한다.

경험이 풍부한 저자는 R과 Python 을 모두 사용하여 실제 상황에 맞는 코드를 제시하고 있으며 그 결과를 어떻게 해석하고 개선해야하는지 비즈니스의 의사결정을 어떻게 해야하는지 현실 세계에서 고민할 법한 질문을 던져주며 문제를 해결하는 방법을 알려준다.

보통 이론적인 내용에 치중하다보면 실제 비즈니스 상황을 잘 반영하지 못하기도 하는데 이 책은 두 마리 토끼를 모두 잡을 수 있는 책이다.

최근에 봤던 비즈니스 데이터 분석 관련 책 중에서 손에 꼽을 정도로 이론적인 내용과 실무적인 내용을 균형있게 다룬 책이다.

책 초반을 보면 이 책은 t-검정이나 ANOVA와 같은 기존의 행동 데이터 분석 방법론을 소개하는 책이 아니며 비즈니스 문제를 풀면서 회귀 분석이 이러한 전통적인 방법보다 효과가 덜하다고 느낀적이 있다고 한다. 그래서 비즈니스 상황별로 적절한 통계적 기법과 분석 방법을 제시하고 있다.

파이썬과 R 두 가지로 책의 소스코드를 작성하여 제공하고 있으며 각 언어에 대한 의견도 제시하고 있다. EDA는 R로 하는 것을 선호하지만 웹 스크래핑은 파이썬이 훨씬 사용하기 쉽다는 의견이다.

인과 관계에 대해 설명하며 다중공선성에 대해서도 자세히 설명하고 있다. 상관 관계와 인과 관계를 설명할 때 자주 등장하는 기온과 아이스크림 판매량에 대한 예시로 설명한다.

현실 세계의 문제 해결방법에 대한 스토리텔링이 좋다. 각 챕터마다 비즈니스 상황을 제시하고 어떤 변수와 상황에서 어떤 의사결정을 내릴지에 대해 상황과 도표로 함께 설명한 점이 좋다.

400페이지 분량의 책을 통해 통계적인 지식, 분석결과 해석하기와 비즈니스 실무까지 이어서 다루기 때문에 비즈니스에서 데이터 분석을 하고자할 때의 팁을 다양하게 얻을 수 있었다.

이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.