18 February 2022

한빛미디어의 “혼공”시리즈인 혼자공부하는 시리즈 중 하나 답게 프로그래밍이나 데이터 분석이 초보를 대상으로 쓰여진 책이다.

원래 파이썬을 주로 사용하지만 R책도 종종 참고를 하는 편인데 아무래도 주 사용언어가 R이 아니다 보니 R에 좀 더 익숙해지고자 베타리딩에 참여했던 책이다.

파이썬의 판다스는 R에서 많은 영향을 받았다. 데이터프레임이라는 용어라든지 데이터의 요약 통계 등의 기능을 보면 R과 닮은 점을 많이 볼 수 있다.

테이블 형태의 데이터를 자주 다룬다면 엑셀로는 속도, 용량, 자유도면에서 아쉬움을 느낄 수가 있는데 이때 R이나 파이썬과 같은 언어를 사용하면 날개를 달 수 있다.

처음시작하는 입장에서 R이냐 파이썬이냐로 갑론을박이 이루어지기도 하는데 파이썬은 주로 사용하는 사람이지만 어떤 언어든 상관 없다고 생각한다.

R의 tidy data 라든지 grammar of graphics 는 어떤 언어를 사용하든 이런 철학은 데이터 분석과 시각화를 이해하기에 좋다.

그래서 내가 파이썬을 주로 다루고 있음에도 기회가 있으면 R과 관련된 이론이나 예제를 접해보려고 한다. 이 책의 베타리딩도 그러한 의미로 읽어보게 되었다.

R에 대한 기본적인 사용법과 함께 현실 데이터에 어떻게 이런 개념들을 적용하면 좋을지 예제를 통해 설명하고 있다.

이 책에 기대하면 좋은 내용은!

  • 통계가 처음인데 그 동안 배웠던 통계는 너무 복잡하고 어려웠다.
  • 예시데이터를 통해 통계를 쉽게 이해하고 R도 덤으로 익히고 싶다.
  • 데이터 시각화를 통해 데이터를 통해 인사이트를 얻고 싶다.
  • 실제 데이터를 통해 프로젝트처럼 데이터를 분석해 보고 싶다.
  • R의 명령어나 사용법을 좀 더 쉽고 친절한 언어로 익혀보고 싶다.

시중에 나와있는 데이터분석책은 많고도 많다. 데이터분석이 처음이고 통계, 시각화도 처음일 때 쉽게 풀어쓴 책으로 익혀보고자 할 때 좋은 책이다.

내용의 정리나 혼공노트처럼 곁에두고 참고해 볼 수 있는 요약노트를 제공해 주고 있어서 R의 입문자 혹은 데이터분석 입문자에게도 좋고 나처럼 파이썬을 주로 사용하지만 R도 배우고 싶은 사람에게도 친절한 안내를 해주는 책이다.

이 리뷰는 한빛미디어에서 베타리딩을 통해 도서를 제공받아 작성했습니다.