23 April 2023

칩후옌의 유명 강의 원서가 번역되어 나온다는 소식을 들었을 때부터 엄청 기대했던 책이 번역이 되었다. 얼마전 칩후옌의 Building LLM applications for production 블로그 포스트도 인상적으로 봤었는데 앞으로 저자의 다른 글도 책으로 나오길 기다려질 만큼 저자분의 노하우가 엄청나다.

그간 주로 봐왔던 머신러닝 책이 보통 알고리즘에 대한 수식과 라이브러리를 활용한 핸즈온 튜토리얼이었다면 이 책은 좀 다른 접근의 책이다.

일단 코드 없이 머신러닝 모델을 설계하고 배포하는 것까지 전단계에서 고려해야 하는 사항에 대해 꼼꼼하게 정리되어있다. 그래서 이 책을 읽으면 매우 꼼꼼한 실력있는 사수가 하나하나 짚어주는 느낌의 책이기도 하다.

머신러닝, 딥러닝 아키텍처가 어떻게 나뉘며 이 때 고려해야하는 측정지표나 알아두어야할 통계 개념들에 대해 정리하고 있다.

또 ML 모델은 누구 한 명의 작업으로 이루어지기 보다는 여러 사람의 협업을 통해 이루어지는 오케스트라와 같은데 이 때 각 직군 별로 고려하는 사랑을 정리해 두었는데 관리자의 의견이 매우 인상적이었다.

머신러닝을 책, 영상, 코드, 경진대회 다양한 경로로 배우게 되는데 현업에서 직접 업무를 하지 않는 이상 경진대회 등을 주로 활용하게 된다. 경진대회를 통해 모델을 개선하다보면 우승을 위한 알고리즘이나 방법을 찾아 쓰게 되는데 이런 방법이 실제 현업과는 동떨어진 방법일 때가 종종 있다. 그래서 리더보드에 대한 비판 등에 대해 언급한 점도 인상적이다.

특정 작업 태스크에 따라 어떤 방법으로 태스크를 진행해야 하는지 현업에서 통하는 방법에 대한 팁을 최대한 녹여낸점이 좋았다.

ML엔지니어가 되기 위해 공부할 때로 돌아간다면 우선적으로 공부할 것들이 인상적이었고 실제로 공감되었다. 깃을 통한 버전관리, SQL, NoSQL, 파이썬/다스크, 데이터 구조, 확률 및 통계, ML 알고리즘, 병렬 컴퓨팅, REST API, 쿠버네티스+에어플로, 단위/통합 테스트까지 현업에서 필요한 것들을 잘 나열해 주었다.

처음 이 분야를 배우는 사람이라면 이 많은 키워드에 언제 저 키워드를 다 배우나 싶을 수도 있다. 만든 모델의 성능 뿐만 아니라 현실세계에서 해당 모델이 동작하고 동작하는 모델을 통해 더 나은 세상을 만들 수 있는 좋은 팁이 담겨있다. ML엔지니어를 희망하는 사람들 뿐만 아니라 현업자에게도 전반적인 팁을 정리할 수 있는 주변에 강추하고 싶은 정말 좋은 책이다.

이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다