[도서 리뷰] 파이토치로 배우는 자연어 처리
이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.
교보문고 2021 올해의 책 IT 전문서로 <혼자 공부하는 머신러닝+딥러닝>과 <파이토치로 배우는="" 자연어="" 처리="">가 각각 AI/ML 분야와 자연어 처리 분야에서 1등을 했다고 한다! 올해 이 두 권의 책을 모두 읽어볼 수 있어 행운이었다.파이토치로>
두 책 모두 한빛미디어의 “나는 리뷰어다”를 통해 읽어보게 되었는데, <혼자 공부하는 머신러닝+딥러닝>은 머신러닝 입문자 분들에게 가장 처음으로 추천하는 책이다. 이 책과 부록의 그림을 보면서 저자분의 세심함을 다시 엿볼 수 있었다. 그리고 연말에 자연어처리 프로젝트를 진행했는데 <파이토치로 배우는="" 자연어="" 처리=""> 를 읽으며 그동안 알고 있었던 내용을 아주 깔끔하게 정리할 수 있었다.파이토치로>
하고 있는 프로젝트는 텐서플로로 진행했지만 요즘 파이토치를 주변에서 많이 쓰고 있기 때문에 내년에는 본격적으로 파이토치를 해봐야겠다는 시점에서 아주 적절하게 내게 온 책이 아닐까 싶다.
💻 자연어처리든, 머신러닝, 딥러닝이 처음일지라도 텍스트를 기계가 이해할 수 있는 형태로 만들고 좋은 성능을 낼 수 있는 다양한 팁들이 가득하다. 텐서플로를 주로 사용하고 있었지만 자연어처리에 필요한 핵심 용어들이 쉽게 정리 되어 있어서 읽으면서 알고 있던 내용을 정리해 볼 수 있는 책이었다.
📝 원핫벡터부터 n-gram, 표제어와 어간, 단어주머니, TF-IDF, 시퀀스 표현에 대한 개념까지 역자 분의 다른 책들과 마찬가지로 자연어 처리에 대한 기초 텍스트 처리에 대한 내용이 친절하게 정리가 되어 있었다.
⚡️ 딥러닝이 처음이라도 기초개념부터 설명하기 때문에 이 책을 통해 입문해 볼 수 있다. 퍼셉트론, 활성화 함수, 손실함수, 평가지표, 데이터분할, 하이퍼파라미터, 규제와 같은 기본 개념을 설명하고 있다.
🔥 파이토치 초보자에게도 너무 좋았다. 파이토치를 정말 본격적으로 써봐야겠다는 생각이 들게 한 책이었다. MLP, CNN 을 통해 성씨를 분류하는 예제를 통해 배울 수 있으며, 사전 훈련된 임베딩을 사용하는 방법과 CBOW를 통해 임베딩을 하는 방법, 전이학습까지 코드를 돌려보며 이해해 볼 수 있다.
또 시퀀스 모델링을 통해 새로운 성씨를 생성해 볼 수 있으며, 어텐션, 기계번역 그리고 pororo를 통한 한글 자연어처리까지 소개하고 있다. 원서에는 없는 최신 한글 모델을 배워볼 수 있는 점도 좋았다.
두께도 두껍지 않아서 부담없이 읽을 수 있는 300페이지 내외의 분량이었다. 내년에는 텐서플로보다 파이토치를 더 많이 사용해 보는게 목표인데 이 책을 통해 도움을 많이 받았다. 역자 분의 책 모두 올 한 해 정말 많은 도움을 받아서 감사한 마음을 전하고 싶다.
이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다.