- 28 Oct 2024 »
[도서 리뷰] 쿠버네티스 창시자에게 배우는 모범 사례(2판)
개발자 워크플로우, 모니터링, 보안 등 실무에 필수적인 주제들을 폭넓게 다루는 책 이 책은 쿠버네티스의 기초 배포부터 고급 운영까지 전체 라이프사이클을 포괄하는 실용적인 가이드북이다. 특히 주목할만한 점은 각 장의 말미에 “모범 사례”를 정리하여 실전에서 바로 적용할 수 있는 지침을 제공한다. 주제별로 크게 실무, 운영, 보안 내용으로 나눠본다면 다음과 같이 볼 수...
- 29 Sep 2024 »
[도서 리뷰] 코드 밖 커뮤니케이션
“코드 밖 커뮤니케이션”은 기술적 역량 못지않게 중요한 개발자의 소프트 스킬, 특히 커뮤니케이션 능력 향상에 초점을 맞춘 실용서다. 이 책의 가장 큰 강점은 실제 개발 현장의 구체적인 상황을 예로 들며 효과적인 방법과 피해야 할 사례를 명확히 대비시킨다는 점이다. 예를 들어, 시스템 아키텍처를 설명하는 다이어그램 작성에 있어 복잡한 구조를 계층별로 명확히 구분하고...
- 25 Aug 2024 »
[도서 리뷰] 실무로 통하는 클린 코드
클린 코드 로버트 C. 마틴의 『클린 코드』는 오랫동안 소프트웨어 개발자들 사이에서 코드 품질 향상의 바이블로 여겨져 왔다. 이 책은 코드의 가독성, 유지보수성, 확장성을 높이기 위한 원칙과 가이드라인을 제시하며, 많은 개발자들에게 코드 작성의 새로운 기준을 제시했다. 그러나 이번에 읽은 이 책은 『클린 코드』에 이어, 좀 더 실질적인 적용 방법과 구체적인 사례를...
- 28 Jul 2024 »
[도서 리뷰] 처음 시작하는 FastAPI
처음 시작하는 FastAPI 이 책은 웹 개발과 파이썬을 통합하여 최신 기술을 활용하는 방법을 체계적으로 설명한다. “모던 웹과 파이썬”에서 시작하여 FastAPI를 중심으로 웹 애플리케이션 개발을 다루고, 실제 웹사이트 구현, 데이터 처리, 인증, 테스트, 배포 등의 주제를 포괄적으로 다룬다. PART 1: 모던 웹과 파이썬 CHAPTER 1: 모던 웹 이 장에서는 현대 웹의...
- 24 Jun 2024 »
[도서 리뷰] 데브옵스 엔지니어를 위한 실전 관찰 가능성 엔지니어링
이 책은 현대 소프트웨어 개발과 운영 환경에서 날로 그 중요성이 커지고 있는 ‘관찰 가능성(Observability)’에 대해 포괄적이고 심도 있게 다루고 있다. 총 5개의 PART로 구성된 이 책은 관찰 가능성의 기본 개념부터 실제 적용 방법, 그리고 조직 문화에 미치는 영향까지 광범위한 내용을 체계적으로 설명하고 있다. 개념의 명확한 정립 관찰 가능성의 개념을 명확히...
- 26 May 2024 »
[도서 리뷰] 실무로 통하는 ML 문제 해결 with 파이썬
실무로 통하는 ML 문제 해결 with 파이썬 이 책은 기존 파이썬을 활용한 머신러닝 쿡북의 2판으로 이 책의 공동저자 중 한명인 크리스 알본(Chris Albon)은 데이터 사이언스와 머신 러닝 분야에서 잘 알려진 인물로, 특히 시각적인 설명과 교육 자료를 통해 잘 알고 있던 분이다. 아래 링크의 크리스 알본의 X계정을 팔로우 해보면 머신러닝과 관련된...
- 28 Apr 2024 »
[도서 리뷰] 챗GPT API를 활용한 챗봇 만들기
5일만에 파이썬, 프롬프트 엔지니어링, 오픈AI API, 에이전트, 벡터DB 마스터하기라는 매력적인 문구에 이끌려 이 책을 읽게 되었다. 요즘 고객센터 문의나 질의응답에서 사람의 대답을 얻는 것보다 AI의 답을 얻는 것이 흔한 시대가 되었다. 기술적인 질문에 대해서도 일일이 찾아 답변하지 않아도 API 가 알아서 지난 질문의 답을 찾아와 링크까지 걸어주며 친절하게 답을 해준다....
- 24 Mar 2024 »
[도서 리뷰] 쉽고 빠르게 익히는 실전 LLM
모델을 직접 만들거나 파인튜닝 해서 쓰던 것에서 API를 사용하여 쉽게 나만의 모델을 만들 수 있는 시대가 되었다. 프로그래밍 초보자라도 API 사용법과 간단한 추상화된 웹개발 도구 몇 가지를 익힌다면 나만의 LLM 챗봇이나 AI도구를 만들 수 있는 시대가 되었다. 이에 대한 친절한 가이드가 되는 책이 바로 이 책이다. 파이썬 기반의 다양한 라이브러리를...
- 25 Feb 2024 »
[도서 리뷰] 딥러닝의 정석 (2판)
파이토치는 딥러닝 연구 및 애플리케이션 개발에 있어 가장 인기 있는 프레임워크 중 하나로, 그 사용의 용이성과 유연성 때문에 널리 채택되고 있다. 이 책은 파이토치의 기본적인 사용법부터 고급 기능까지 체계적으로 다루며, 딥러닝의 다양한 주제를 이해하는데 도움을 준다. 딥러닝 입문자라면 전반전인 기본을 탄탄하게 쌓는데 도움이 될만한 내용으로 구성되어 있고, 실무자에게도 기본 지식을...
- 22 Dec 2023 »
[도서 리뷰] Release의 모든 것
“Release의 모든 것”은 다음 책의 번역서로 한국어서는 2판으로 한빛미디어에서 출판되었다. Release It! Second Edition: Design and Deploy Production-Ready Software by Michael Nygard 이 책은 개발자들이 프로덕션 환경에서 소프트웨어를 디자인하고 배포할 때 마주치는 다양한 문제들을 직관적이고 현실적으로 다루고 있다. 저자가 이야기하는 건 이론적인 얘기가 아니라, 실제 현장에서 겪은 경험을 토대로 한...
- 26 Nov 2023 »
[도서 리뷰] 데이터 드리븐 리포트
📊 데이터 분석은 꼭 분석가 직군 뿐만 아니라 비즈니스나 경영, 학술 등 분야를 막론하고 필요한 스킬이지 않을까 싶다. 평소 데이터 분석에 관심이 많고 다양한 데이터를 다루다 보니 관심있게 보게 된 책이기도 하다. 이미지 출처 : generated by OpenAI’s DALL-E 📈 의사결정의 정확성, 시장 트렌드 파악, 고객 이해, 효율성 및 생산성,...
- 23 Oct 2023 »
[도서 리뷰] 처음부터 제대로 배우는 스프링 부트
스프링 부트에 대해 학습하고자 할 때, 필요한 것은 이론이나 개념을 설명하는 것뿐만 아니라 실제 상황에서 어떻게 활용할 수 있는지 알려주는 안내서이다. 스프링 데이터, 스프링 시큐리티, 스프링 웹플럭스와 같은 스프링의 핵심 모듈에 대해 실용적으로 알려준다. 스프링 부트의 철학과 간단한 코드로 어플리케이션을 개발하는 방법을 보여준다. 각 장은 이론적인 부분을 최소화하고, 실제 코드...
- 24 Sep 2023 »
[도서 리뷰] 진화적 아키텍처
진화적 아키텍처는 소프트웨어 아키텍처의 진화와 발전에 대한 심도 있는 이해를 제공하는 책이다. 이 책은 기업들이 변화하는 요구사항과 기술 환경에 적응하며, 지속 가능하고 유연한 아키텍처를 구축하는 방법에 대해 탐구한다. 다양한 사례 연구와 실제 경험을 기반으로 한 이 책은 아키텍처를 설계하고 유지하는 데 있어 중요한 원칙과 패턴을 제시한다. 실용적인 접근법: 이 책은...
- 20 Aug 2023 »
[도서 리뷰] 견고한 데이터 엔지니어링
실무에서 일을 하다보면 친절한 사수 없이 스스로 시행착오를 겪으며 성장해야 하는 외로운 순간이 있다. 그 때 이 책이 옆에 있다면 어떨까? 이 책은 데이터 엔지니어링 업무를 하며 궁금한 A-Z까지의 내용을 친절한 사수처럼 설명한다. 견고한 데이터 엔지니어링은 실제 데이터 엔지니어링 문제 해결을 위한 탄탄한 기반 제공하는 것을 목표로 하는 책이다. 데이터...
- 23 Jul 2023 »
[도서 리뷰] MLOps 실전 가이드
MLOps 에 대한 내용은 주로 DevOps와 관련된 내용을 참고해 오고 있었는데 이렇게 딱 MLOps 만을 한정한 책이 나와 인상깊게 읽게 되었다. 머신러닝 모델을 만들었다면 이를 꾸준히 개선하고 운영해야 좀 더 나은 모델로 현실세계 문제를 해결하는데 도움이 되기 때문에 모델을 서빙하고 운영하는 것에 대한 중요성을 실감하고 있던터라 더 인상깊게 읽어볼 수...
- 25 Jun 2023 »
[도서 리뷰] 행동 데이터 분석
행동 데이터 분석을 알려주는 이 책은 통계적인 기초지식부터 응용까지를 다루며 실제 비즈니스 상황에서 어떻게 활용해야하는지에 대한 구체적인 가이드를 제시한다. 경험이 풍부한 저자는 R과 Python 을 모두 사용하여 실제 상황에 맞는 코드를 제시하고 있으며 그 결과를 어떻게 해석하고 개선해야하는지 비즈니스의 의사결정을 어떻게 해야하는지 현실 세계에서 고민할 법한 질문을 던져주며 문제를 해결하는...
- 28 May 2023 »
[도서 리뷰] AWS 기반 데이터 과학
실무에서 실시간으로 쌓이는 대용량 데이터를 사용해서 실무 프로젝트를 진행한다면 클라우드 환경을 빼놓고 일하기가 어렵다. 이 책은 여러 클라우드 제품군 중 AWS를 기반으로 쓰여졌다. 데이터과학에 대한 어느정도 기본 이해가 있는 상태에서 AWS제품군을 활용방안을 제시하고 있기 때문에 데이터 과학에 대한 기초 소양이 필요한 책이기도 하다. 현업에서 AWS의 제품군을 활용하여 어떻게 비즈니스를 해야하는지에...
- 23 Apr 2023 »
[도서 리뷰] 머신러닝 시스템 설계
칩후옌의 유명 강의 원서가 번역되어 나온다는 소식을 들었을 때부터 엄청 기대했던 책이 번역이 되었다. 얼마전 칩후옌의 Building LLM applications for production 블로그 포스트도 인상적으로 봤었는데 앞으로 저자의 다른 글도 책으로 나오길 기다려질 만큼 저자분의 노하우가 엄청나다. 그간 주로 봐왔던 머신러닝 책이 보통 알고리즘에 대한 수식과 라이브러리를 활용한 핸즈온 튜토리얼이었다면 이...
- 26 Mar 2023 »
[도서 리뷰] 데이터 과학을 위한 파이썬과 R
데이터 과학, 통계 등을 시작하고자 할 때 어떤 언어를 선택할지에 대한 기로에 놓이게 된다. 파이썬과 R은 데이터과학 분야에서 주로 사용되는 언어이기도 하다. 보통 다양한 생태계를 이야기할 때는 파이썬을 통계 패키지를 좀 더 사용하고자 한다면 R을 추천하는 편이다. 서로 어떤 언어가 좋고 나쁘고를 떠나서 각 장점을 이해하고 사용하면 좋겠다는 생각을 해왔다....
- 26 Feb 2023 »
[도서 리뷰] 혼자 공부하는 데이터 분석 with 파이썬
혼자 공부하는 데이터 분석 with 파이썬 1:1 과외하듯 배우는 데이터 분석 자습서 파이썬을 활용한 데이터 분석을 평소에 자주하고 있기 때문에 이 책의 출간이 더 기다려지기도 했는데 한빛미디어 나는 리뷰어다 이벤트를 통해 읽어보게 되었다. 이 책의 장점 워낙 명성이 높으신 저자분이 집필하신 책이라 데이터 분석에 대한 기본적인 내용을 꼼꼼하고 자세한 설명을...
- 31 Dec 2022 »
[도서 리뷰] 트랜스포머를 활용한 자연어 처리
Attention is all you need 논문으로 큰 주목을 받은 Transformer로 자연어처리에서 좋은 성능을 내며 주목을 받고 있다. 요즘 나오는 초거대모델을 보면 곧 내 일자리를 잃지 않을까 혹은 지금까지 해왔던 자연어 공부가 무용해지는게 아닐까 싶을 정도로 초거대모델의 성능은 눈부시다. 광고문구, 비즈니스메일, 내용 요약 등 나보다도 작문을 잘하고 요약을 잘 하는 모습을...
- 27 Nov 2022 »
[도서 리뷰] 파이썬 라이브러리를 활용한 텍스트 분석
비정형 텍스트 데이터는 정형 데이터에 비해 전처리가 어렵기도 하고 또 여러 전처리 방법을 사용한다 하더라도 막상 시각화를 하거나 분석을 하다보면 제대로 된 인사이트를 얻기 위해 텍스트를 정제하는 과정이 쉽지 않음을 느낀다. 하지만 텍스트 데이터를 분석할 수 있다면 방대한 논문 속에서 트랜드를 이루는 키워드를 찾아낼 수도 있으며 방대한 텍스트를 시각화해서 인사이트를...
- 30 Oct 2022 »
[도서 리뷰] 파이썬 기반 금융 인공지능 - 파이썬과 케라스를 활용한 금융 시계열 데이터 기반 알고리즘 트레이딩 전략
파이썬 기반 금융 인공지능 파이썬과 케라스를 활용한 금융 시계열 데이터 기반 알고리즘 트레이딩 전략 이 책은 금융전문가인 이브힐피시라는 저자와 데이터 사이언스 스쿨 사이트를 운영하는 김도형 박사님에 의해 번역이 되었다. 올해 초에도 이 두분의 저자, 역자 분의 책인 “파이썬을 활용한 금융 분석 2판”을 통해서도 많은 도움을 받았다. 어떤 사람이 읽으면 좋을까?...
- 02 Oct 2022 »
[도서 리뷰] 소문난 명강의 : 김기현의 딥러닝 부트캠프 with 파이토치
소스코드 텐서플로를 주로 사용해 왔는데 파이토치에 익숙해 지고자 이 책을 읽게 되었다. IT전문서를 읽을 때는 일단 코드를 먼저 보고 책을 나중에 보게 되는데 이 책도 깃헙에 챕터별로 예제를 공개해 두고있다. 책의 소스코드 : https://github.com/kh-kim/deep_learning_book_exercise 기본에 충실한 책 텐서플로를 주로 사용해 왔기 때문에 기본적인 내용은 어느정도 알고 보기 시작했지만 기본적인 내용을...
- 28 Aug 2022 »
[도서 리뷰] SQL로 시작하는 데이터 분석
SQL로 시작하는 데이터 분석 SQL 책을 보면 대부분 기능적인 설명위주로 되어 있는데 이 책은 실제와 가까운 비즈니스 데이터 분석예제로 구성되어 있다. 최근 본 SQL 책 중에 가장 실무와 가깝고 재미있는 주제로 쓰여진 책이다. 다른 SQL책은 SQL문법 위주로 되어 있기 때문에 실무에 적용하거나 통계적인 연산을 고려해서 보려면 SQL과 통계에 대한 책을...
- 24 Jul 2022 »
[도서 리뷰] 파이썬을 활용한 베이지안 통계(2판)
파이썬을 활용한 베이지안 통계(2판) 초판은 절판이 되어 2판이 나오기 전에는 도서관에서 겨우 구해 볼 수 있었던 책이다. 그것도 근처 도서관에는 없어서 상호대차를 통해 어렵게 구해봤던 기억이 난다. 그래서 어렵게 초판을 구해보던 기억을 떠올려 이 책의 2판의 출간이 엄청 반가웠다. 가장 어려우면서도 꼭 필요한 내용이 확률과 통계 그것도 베이지안 통계다. 관련...
- 25 Jun 2022 »
[도서 리뷰] 혼자 공부하는파이썬(개정판)
혼자 공부하는 파이썬 프로그래밍 책을 처음부터 끝까지 읽고 따라했지만 막상 뒤돌아 서면 어떤 내용을 봤었는지 또 배웠던 기능을 어디에 사용해야 할지 난감할 때가 있다. 이 책은 혼자 공부한다는 가정하에 쉬운 설명과 요약, 연습문제로 구성되어 있다. 마치 직접 공부하고 실습하며 궁금하거나 체크해야 할 내용이 친절하게 정리되어 있다. 파이썬은 워낙 인기있는 언어이고...
- 29 May 2022 »
[도서 리뷰] XGBoost와 사이킷런을 활용한 그레이디언트 부스팅
머신러닝 알고리즘을 사용하다보면 보통 성능이 잘 나오는 트리계열의 알고리즘 위주로 사용하게 되는데 캐글이나 데이콘 대회를 볼 때도 트리 계열의 알고리즘들이 대체적으로 많이 사용되고 좋은 성능을 내는 편이다. 부스팅 계열 알고리즘은 여러 머신러닝 책에서도 다루기도 하지만 부스팅 계열의 알고리즘만을 다룬 책이라 부스팅 알고리즘을 제대로 배우고 싶다면 읽어보면 좋을 책이다. 책을 읽기...
- 24 Apr 2022 »
[도서 리뷰] 파이썬을 활용한 금융 분석(2판)
찐 전문가가 쓰고 찐 전문가가 번역한 찐 파이썬 금융 분석 책 파이썬 기본부터 다질 수 있는 책 금융 데이터 분석을 다루면 파이썬 데이터 분석 도구인 판다스를 제대로 배울 수 있다. 지난 해 파이썬 증권 데이터 분석 강의를 만들면서 시중에 나와있는 파이썬 금융 분석 책들을 여러 권 봤는데 그 중에서도 손꼽을...
- 28 Mar 2022 »
[도서 리뷰] 파이썬 라이브러리를 활용한 머신러닝(번역개정2판)
파이썬 라이브러리를 활용한 머신러닝(번역개정2판) 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서 사이킷런 핵심개발자가 썼다는 것 하나만으로도 이 책을 설명할 수 있다. 1판으로도 사이킷런 공식문서를 보다가 이해되지 않는 부분이 있을 때 이 책을 찾아보면서 놓치고 있던 것들을 찾고 배울 수 있어서 1판이 출판된지 시간이 제법 지났어도 두고두고 봤다. 사이킷런은 버전1.0으로...
- 18 Feb 2022 »
[도서 리뷰] 혼자 공부하는 R 데이터 분석
한빛미디어의 “혼공”시리즈인 혼자공부하는 시리즈 중 하나 답게 프로그래밍이나 데이터 분석이 초보를 대상으로 쓰여진 책이다. 원래 파이썬을 주로 사용하지만 R책도 종종 참고를 하는 편인데 아무래도 주 사용언어가 R이 아니다 보니 R에 좀 더 익숙해지고자 베타리딩에 참여했던 책이다. 파이썬의 판다스는 R에서 많은 영향을 받았다. 데이터프레임이라는 용어라든지 데이터의 요약 통계 등의 기능을 보면...
- 26 Dec 2021 »
[도서 리뷰] 파이토치로 배우는 자연어 처리
교보문고 2021 올해의 책 IT 전문서로 <혼자 공부하는 머신러닝+딥러닝>과 가 각각 AI/ML 분야와 자연어 처리 분야에서 1등을 했다고 한다! 올해 이 두 권의 책을 모두 읽어볼 수 있어 행운이었다. 두 책 모두 한빛미디어의 “나는 리뷰어다”를 통해 읽어보게 되었는데, <혼자 공부하는 머신러닝+딥러닝>은 머신러닝 입문자 분들에게 가장 처음으로 추천하는 책이다. 이 책과...
- 21 Nov 2021 »
[도서 리뷰] 구글 BERT의 정석
요즘 자연어처리에서 압도적인 인기를 끌고 있는 BERT 만을 다룬 책이 나왔다고 해서 관심이 갔는데 한빛미디어의 “나는 리뷰어다”를 통해 운 좋게 읽어보게 되었다. 자연어처리 관련된 경진대회를 보면 BERT를 사용한 모델이 종종 등장하는데 이 책은 트랜스포머 모델을 설명하며 BERT의 작동 원리 부터 BERT 모델이 사전학습 되는 방법과 BERT를 파인튜닝해 다운스트림 태스크에 활용하는...
- 24 Oct 2021 »
[도서 리뷰] 미국 주식으로 시작하는 슬기로운 퀀트투자
이 책을 처음 봤을 때 저자명을 보고 예전에 봤던 “금융공학 레시피”책이 떠올랐다. “금융공학 레시피”는 금융에 대한 전문적인 지식 뿐만 아니라 파이썬을 활용하여 금융공학을 꼼꼼하게 구현하고 있어서 무척이나 인상깊게 봤던 책이다. 그래서 “미국 주식으로 시작하는 슬기로운 퀀트투자”가 나왔을 때 꼭 읽어보고 싶다는 생각이 들었는데, 한빛미디어의 “나는 리뷰어다”를 통해 읽어볼 수 있게...
- 17 Oct 2021 »
[도서 리뷰] 데이터 과학자의 일
페이스북의 “오하이오의 낚시꾼”( https://www.facebook.com/buckeyestatfisher/ )은 데이터 분석에 관심있는 사람들이 많이 구독하는 페이지 중에 하나다. “오하이오의 낚시꾼”에 올라오는 게시물을 볼 때면 페이지 운영자의 내공이 엄청나게 느껴지는데 이 페이지를 운영하는 분이 책을 엮었다 해서 서평단 이벤트를 신청했는데 이벤트 운이 없는 내가 당첨되고야 말았다! 게다가 평소 알고 지내던 페친 분 중 한 분도...
- 22 Sep 2021 »
[도서 리뷰] fastai와 파이토치가 만나 꽃피운 딥러닝
어떤 머신러닝 전문가가 기본적인 수학, 프로그래밍에 대한 내용이 어렵다면 머신러닝과 딥러닝을 하겠다고 하면 안 된다는 얘기를 해서 적잖아 놀랐던 적이 있다. 딥러닝을 익히고 다양한 분야에 적용하면서 사용하는 라이브러리는 점점 더 추상화 되어 기본적인 철학을 이해하고 있다면 수백, 수천줄로 구성된 딥러닝 알고리즘을 추상화된 코드 몇줄로 좋은 성능을 내는 모델을 만들 수가...
- 21 Aug 2021 »
[도서 리뷰] 텐서플로 2.x와 케라스로 구축하는 생성적 적대 신경망 GAN 인 액션
얼마 전에 작년의 엔비디아 발표에서 젠슨황의 키노트 발표가 인공지능에 의해 만들어진 영상이라는 뉴스가 화제가 되었었다. 지난 해 키노트를 보면서 만들어진 영상이라는 의심은 전혀 할 수 없을 정도로 젠슨황의 키노트는 거의 완벽에 가까웠다. 닮은 꼴 연예인을 찾는다든지 신생아의 초음파 사진으로 출생했을 때의 이미지를 유추해 낸다든지 인공지능을 통한 이미지 구현을 볼 때마다...
- 18 Jul 2021 »
[도서 리뷰] 머신러닝을 활용한 웹 최적화
머신러닝을 활용한 웹 최적화 머신러닝이나 통계 이론만을 익히다 보면 실제 내 서비스에 어떻게 적용해야 할지 난감해진다. 책도 읽고 여러 모델도 돌려봤지만 실제 서비스에 적용해 보는 건 또 다른 얘기가 된다. 그리고 타이타닉 예제를 돌려보더라도 다른 분류 예제에 적용해 볼 수 있다는 건 알지만 실제 내 예제에 적용하기까지의 과정이 쉽지 않다....
- 20 Jun 2021 »
[도서 리뷰] 일잘러의 비밀, 구글 스프레드시트 제대로 파헤치기
MS오피스 도구를 사용하지 않기 때문에 주로 구글 드라이브를 사용하는데 오피스 도구들에 비해 문서나 잘 정리된 책이 없는게 아쉬었는데 구글 스프레드시트 책이 나왔다는 것만으로도 이 책에 관심이 갔다. 그런데 저자분의 성함을 보니 예전 파이콘에서 뵈었던 분 같아서 저자분 소개를 읽어보니 파이콘에서 발표했던 그 분이 맞았다. 파이콘에서도 개발 직군이 아님에도 파이썬을 활용해서...
- 23 May 2021 »
[도서 리뷰] 실전 시계열 분석 - 통계와 머신러닝을 활용한 예측 기법
파이썬 시계열 데이터 관련 한국어 서적이 많지 않은 상황에서 이 책이 출판되었다고 해서 많이 궁금했는데 를 통해 읽어보게 되었다. 지금도 흘러가는 시간속에서 많은 데이터가 쌓이고 있고 우리는 이렇게 쌓인 데이터를 통해 무언가 인사이트를 얻고자 한다. 매출액, 재고량, 판매량, 주가의 가격, 비트코인의 가격, 서버의 트래픽량 등 시계열은 업무 뿐만 아니라 실생활과도...
- 18 Apr 2021 »
[도서 리뷰] 몽고DB 완벽 가이드 실전 예제로 배우는 NoSQL 데이터베이스 기초부터 활용까지(3판)
RDBMS를 주로 다루다가 NoSQL을 사용하고자 하면 가장 먼저 고려하게 되는게 몽고DB일것이다. 이미 현업에서도 많이 사용되고 있고 key-value 형태의 동적 스키마형 도큐먼트를 다루기에 적합하다. NoSQL은 RDBMS에 비해 확장성과 유연성을 가지며 대용량 데이터를 다루기에도 적합하다. 몽고DB책이 많이 않은 상황에서 이 책은 3판이라는 점에서도 몽고DB를 익히고자 할 때 가장 추천할만한 책이 아닐까 싶다....
- 20 Mar 2021 »
[도서 리뷰] 사토시의 서 - 비트코인 창시자 사토시 나카모토의 철학을 보다
몇년전 장고걸스라는 파이썬의 장고프레임 워크를 통해 웹사이트를 만드는 튜토리얼을 처음 시작할 때 이태원의 비트코인 카페에서 모임을 했던 기억이 난다. 그 당시 현실세계에서 비트코인으로 카페의 음료 가격을 결제할 수 있다는게 놀라웠다. 그 후로 비트코인의 가격은 상상할 수 없을 만큼 올랐는데 물론 나는 하나도 갖고있지 않다. 세상의 화제를 모으는 비트코인이 어떤 방식으로...
- 22 Feb 2021 »
[도서 리뷰] 비즈니스 머신러닝
머신러닝 이론에 치우치다 보면 결국 그래서 이걸 어떻게 써먹어야 될지 난감할 때가 종종 있다. 그래서 현실과 가까운 데이터를 다루다 보면 내 업무에도 이렇게 적용하면 되겠다는 아이디어가 떠오르기도 한다. 이 책은 실무에 최대한 촛점을 맞춰 제작되어 있다. SageMaker를 예전부터 사용해 보고 싶었는데 해당 도서가 출간되어서 읽어보게 되었다. 머신러닝 모델을 만들고 비즈니스에...
- 05 Jan 2021 »
[파이썬 데이터 분석] 깊은 복사와 얕은 복사에 대해
copy에 대해 참고 : copy — 얕은 복사와 깊은 복사 연산 — Python 3.9.1 문서 import pandas as pd # 데이터프레임에 a 라는 컬럼을 생성합니다. df = pd.DataFrame({"a": range(5)}) df a 0 0 1 1 2 2 3 3 4 4 # 0, 1번 인덱스값만 추출해서 df2 에 사본을 만듭니다....
- 20 Dec 2020 »
[도서 리뷰] 혼자 공부하는 머신러닝+딥러닝
머신러닝이나 딥러닝을 보통 배우거나 이해하기 어려운 분야이다. 하지만 이렇게 배우기 어려운 분야도 어떤 예제와 설명이냐에 따라 내용이 쉽게 와 닿기도 한다. 그동안 봤던 책이 너무 어려웠다면 이 책으로 그간의 어려움을 해소할 수 있지 않을까 싶다. 게다가 저자 분은 유명 머신러닝, 딥러닝 책을 여러 권 번역과 출판하신 분이다. 우리집에도 저자 분의...
- 22 Nov 2020 »
[도서 리뷰] 우아한 사이파이
파이썬으로 데이터 분석, 시각화, 머신러닝을 다루면서 scipy 를 종종 사용해 오면서 scipy를 사용하는 코드를 볼 때마다 scipy에 대해 좀 더 알고 싶다는 생각을 해오던 중에 이 책을 읽게 되었다. 책 제목 그대로 “우아한 사이파이”는 멋지고 우아하다. 코드 한 두 줄로 그럴 듯한 결과물을 만들어 내기 때문이다. 파이썬의 이런 우아한 환경은...
- 18 Oct 2020 »
[도서 리뷰] 파이썬과 대스크를 활용한 고성능 데이터 분석 대규모 데이터셋 분석, 시각화, 모델링부터 분산 앱 패키징과 배포까지
16G의 메모리가 있는 장비를 주로 사용하며 판다스로 10G정도의 파일을 불러온 사람들이면 판다스의 굼뜬 반응에 답답함을 느꼈을 사람들이 많을 것이다. 그나마 16G의 메모리를 사용하고 있어 10G정도까지라도 로드를 할 수 있지만 8G나 4G의 메모리를 사용하고 있다면 1G의 파일만 로드해도 작업을 할 수 없을 정도로 느려지는 것을 느낄 수 있었을 것이다. 최근 10G이상의...
- 27 Sep 2020 »
[도서 리뷰] 처음 시작하는 딥러닝 Deep Learning from Scatch
scratch 로 들어가는 책들은 대부분 밑바닥부터 코드를 작성해서 설명하고 두껍지도 않아서 읽기에 부담도 적은 편이다. 이 책의 제목에 “밑바닥부터~”가 들어갈 것 같았지만 이 책의 제목은 “처음 시작하는 딥러닝”이다. 천리길도 한 걸음부터 시작하듯이 이 책은 딥러닝을 시작하는 초심자를 위해 파이썬의 간단한 코드를 통해 딥러닝 알고리즘과 원리를 설명하고 있다. 기본적인 파이썬 지식을...
- 23 Aug 2020 »
[도서 리뷰] 파이썬으로 배우는 통계학 교과서
이 책을 읽기 전까지 통계와 관련된 여러 책들을 봤었다. 지금까지 봤던 책들은 대부분 너무 어렵거나 파이썬이 아닌 R로 설명이 되어 있어서 적당한 수준의 파이썬 통계책이 있었으면 좋겠다고 생각했을 시점에 이 책을 보게 되었다. 너무 어려운 수준의 통계용어와 수식은 읽고나서도 무슨 내용인지 어떻게 적용해야 될지 감이 잘 오지 않았는데 이 책은...
- 06 Jul 2020 »
[도서 리뷰] 핸즈온 머신러닝 2판
핸즈온 머신러닝(2판) 최근 몇 년간 머신러닝을 공부했던 사람이라면 이 책 한권쯤 있는 사람이 많을거 같다. 워낙 베스트셀러이고 머신러닝과 딥러닝 전반을 자세히 다루고 있고 온라인상에서 볼 수 있는 다양한 예제에 대한 자세한 설명을 보며 머신러닝을 익혀볼 수 있는 책이다. 원서의 2판이 공개되었을때도 관심이 많았는데 번역서가 나온다고 해서 기다려졌던 책이다. 1판을 이미...
- 31 May 2020 »
[도서 리뷰] 학교에서 알려주지 않는 17가지 실무 개발 기술
학교에서 알려주지 않는 17가지 실무 개발 기술 파일을 읽었는데 갑자기 인코딩이 깨져서 당황스러울 때가 있었을거다. 분명히 읽혔던 파일인데 다른 장비에서 읽거나 백업해서 읽었더니 한글이 다 깨져보인다든지 코드의 주석이 다 깨져보인다든지 하는 경험을 해본 적이 있을거다. 그래서 여러가지 방법으로 찾아보다가 그게 인코딩 문제라는 것을 깨닫게 된다. 또 세부적인 인코딩의 차이점이 무엇인지...
- 30 Apr 2020 »
[도서 리뷰] 파이썬으로 배우는 딥러닝 교과서
한빛미디어에서 나온 교과서 시리즈는 대부분 챙겨서 보는 편인데 이 책도 “교과서”시리즈 중의 하나로 나왔다. “교과서” 시리즈 중에는 “파이썬으로 배우는 통계학 교과서”가 특히나 도움이 많이 되어 이 책도 기대하고 보게 된 책이다. 목차를 보게 되면 “교과서”답게 파이썬이 처음인 사람들을 위해 파이썬 기초부터 다루고 있다. 파이썬이 처음이든 프로그래밍이 처음이든 이 책을 읽고...
- 27 Mar 2020 »
[도서 리뷰] 알기쉬운 비유와 기초수학으로 시작하는 그로킹 딥러닝
알기쉬운 비유와 기초수학으로 시작하는 그로킹 딥러닝 책 시작부에 쓰인 책의 의도를 보면 이 책은 내부 동작 과정을 알 수 없는 고수준 라이브러리에 의존하지 않고 간단한 계산을 넘어서는 수학지식이 없는 독자가 책을 소화할 수 있어야 한다고 나와있다. 이 책은 의도대로 수학공식보다는 그림이나 도식을 통해 설명을 하려고 노력하고 있고 또 그림과 도식...
- 15 Dec 2019 »
[도서 리뷰] 소문난 명강의 김도형의 데이터 사이언스 스쿨 수학 편 파이썬 라이브러리로 배우는 데이터 과학 필수 수학
소문난 명강의 김도형의 데이터 사이언스 스쿨 수학 편 파이썬 라이브러리로 배우는 데이터 과학 필수 수학 데이터를 공부하는 사람이라면 한번쯤은 들어가 봤을법한 사이트인 데이터사이언스스쿨 사이트를 운영하는 김도형 박사님이 쓰신 책이다. 궁금한게 있어서 검색을 하다보면 자주 들어가서 보게 되는 사이트이고 볼 때마다 정리가 꼼꼼해서 도움을 많이 받은 사이트이다. 이 사이트 내용 그대로...
- 12 Nov 2019 »
[도서 리뷰] 회사에서 바로 통하는 엑셀 실무 데이터 활용 + 분석
어떤 도메인이든 전공이든 엑셀은 거의 모든 분야에서 활용이 될거 같다. 주로 파이썬을 통해 데이터 분석을 하고 있지만 엑셀도 빼놓고 쓸 수 없는 필수 툴임에 틀림이 없다. 늘 쓰는 기능만 쓰게 되는데 이런 습관에서 벗어나고 싶은 마음에 이 책을 읽게 되었다. 다양한 함수에 대한 사용법을 통해 데이터를 색인하거나 검색해서 전처리 할...
- 13 Oct 2019 »
[도서 리뷰] 파이썬을 활용한 머신러닝 쿡북
이 책의 대상 독자는 초보자는 아니라고 한다. 2주간 이 책을 옆에 두고 시간이 날 때마다 봤는데 파이썬에 대한 기초 소양이 있고 데이터분석과 시각화에 대한 어느정도 소양이 있다면 더 보기 좋을거 같지만 설명이 자세하게 적혀져 있어서 입문자라도 기계학습에 대한 기초지식만 있다면 읽는데 큰 무리는 없을 거 같다. 책의 표지 윗부분의 문구에서도...
- 15 Sep 2019 »
[도서 리뷰] 파이썬 날코딩으로 알고 짜는 딥러닝
머신러닝, 딥러닝 알고리즘을 사용하다보면 내부를 이해하지 못한채 사용할 때가 종종있다. 일단 사용하고는 보지만 내부 알고리즘을 이해하고 사용하면 각각의 파라메터 옵션이 어떤 것을 의미하고 좀 더 좋은 성능을 낼 수 있도록 작성할 수 있을 것이다. 이미 잘 만들어진 알고리즘을 사용하더라도 파이썬의 자기호출 기능 등을 사용하면 소스코드를 볼 수도 있지만 라이브러리에 따라...
- 06 Aug 2019 »
[도서 리뷰] 파이썬 자료구조와 알고리즘
알고리즘은 어렵고 복잡하다는 느낌을 받고 있고 프로그래밍을 해온지 생각보다 오래 되었음에도 알고리즘은 어려운 분야 중 하나다. 그래서 이번에도 조금이라도 익숙해 지고자 이 책을 읽게 되었다. 일단 알고리즘같이 어려운 내용은 너무 두꺼우면 지치기 쉬운데 다른 책에 비해 가볍고 얇은 점이 마음에 들었다. 요즘 외출 할 때 이 책을 자주 들고 나갔었는데...
- 18 Jul 2019 »
[도서 리뷰] 파이썬 코딩 도장
코딩은 공부하는게 아니라 연습한다는 얘기에 강하게 동의한다. 다른 사람들이 수영하는 모습을 아무리 많이 본다해도 내가 직접 물에 들어가보지 않으면 수영을 배우기 힘들다. 또 다른 사람들이 자전거를 타는 모습을 아무리 많이 본다해도 내가 직접 자전거를 타보고 넘어지지 않으면 자전거를 배우기 어려울 것이다. 그래서 프로그래밍을 배운다면 실제로 코드를 직접 타이핑해보고 오류가 나고...
- 14 Jul 2019 »
[도서 리뷰] 파이썬 라이브러리를 활용한 데이터 분석(2판)
파이썬 라이브러리를 활용한 데이터 분석(2판) 주변에서 판다스 책을 추천해 달라는 얘기를 들으면 이 책을 가장 우선으로 추천하곤 했다. 제목은 파이썬 라이브러리를 활용한 데이터 분석이지만 이 책 만큼 판다스를 잘 다루고 있는 책은 드물 것이다. 왜냐면 이 책은 판다스 라이브러리를 개발한 웨스매키니가 직접 쓴 책이기 때문이다. 수학을 전공한 웨스매키니는 R에서 영향을...
- 08 Jun 2019 »
[도서 리뷰] 파이썬으로 웹 크롤러 만들기(2판) : 초간단 나만의 웹 크롤러로 원하는 데이터를 가져오는 방법
파이썬으로 웹 크롤러 만들기(2판) 이 책의 초판도 인상적으로 읽었는데, 2판이 나와서 다시 읽어보게 되었다. 기존 초판에서 4, 5, 16장이 추가되었다고 한다. 프로그래밍 책을 읽을 때 가장 먼저 하는 일은 github 저장소가 있는지 찾는다. 이 책의 저자도 github 페이지에 책의 소스코드를 공개하고 있고 주피터 노트북을 통해 바로 실습할 수 있도록 .ipynb...
- 12 Apr 2019 »
[도서 리뷰] 엑셀만 알아도 할 수 있는 데이터 과학
엑셀만 알아도 할 수 있는 데이터 과학 책 제목에서부터 쉽게 풀어썼을 것 같은 느낌에 이 책에 관심이 갔다. 막상 실무에서 데이터 과학을 한다 하더라도 엑셀을 많이 사용하는 편이고 꼭 복잡한 기술을 써야하는게 아니기 때문에 책 제목이 마음에 들었다. 이 책 앞 부분에 있는 옮긴이의 말 처럼 데이터 과학은 꼭 대용량...
- 07 Jul 2018 »
Mac OSX python ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed
Mac OSX python ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:749) NLTK data를 다운로드 할 때 SSL 오류메시지가 나와서 nltk data downloader 에 문제가 있는건가 생각했었다. 결국 nltk 데이터를 깃헙에서 다운로드 받아 썼는데 파이썬으로 크롤링을 하다보니 https 프로토콜로 통신을 하려고 하면 같은 오류가 발생해서 무슨 문제일까 고민했었다. 구글링을 해보니 https를 사용하지...
- 26 Apr 2018 »
[NDC후기] 소프트웨어 2.0을 활용한 게임 어뷰징 검출
소프트웨어 2.0 소개 소프트웨어 2.0을 활용한 게임 어뷰징 검출 그간 NDC에 가고 싶었지만 매번 늦게 신청해서 못 갔는데, 이번에는 첫 날 신청을 해서! 드디어 처음으로 NDC에 가보게 되었다. NDC에서 가장 듣고 싶었던 세션인 소프트웨어 2.0에 대한 발표를 듣고 정리한 내용이다. 발표자 분은 예전에 같은 회사에서 일했던 롤모델같은 분이기도 하다. NDC뿐만...
- 15 Apr 2018 »
[도서 리뷰] 처음 배우는 딥러닝 수학
이 책은 제목에서 처음 배우는이라는 문구에서 알 수 있듯이 딥러닝 입문자를 위한 수학책이다. 딥러닝 책이지만 이 책은 수학책이기 때문에 코드가 나오지 않고 수학 공식, 도표 그리고 엑셀로 수학을 설명하고 있다. 딥러닝 책 중에는 수학 공식을 거의 다루지 않은 책도 있고, 나 또한 딥러닝을 공부하며 수학에 대한 이해는 뒤로 미루고 코드로...
- 05 Mar 2018 »
Google Colaboratory의 무료 GPU로 Keras 사용해 보기
Colab의 GPU로 Keras 사용해 보기 참고 : 케라스 공식문서에서 멀티GPU 사용하기 예제를 Colab에서 돌아가도록 수정 https://keras.io/utils/#multi_gpu_model Colab 의 성능은 나쁘지 않은 편이다. 현재 메모리 13기가와 CPU는 Intel(R) Xeon(R) CPU @ 2.30GHz을 사용할 수 있다. GPU는 Tesla K80 으로 멀티GPU는 지원하지 않는다. Colaboratory의 메모리 정보보기 !cat /proc/meminfo MemTotal: 13341960 kB MemFree:...
- 30 Jan 2018 »
Mac OSX에서 XGBoost 설치하기
2016년 논문에서 소개 됨 : XGBoostArxiv.pdf 분산형 그래디언트 부스팅 알고리즘 결정트리(Decision Tree) 알고리즘의 연장선에 있음 여러 개의 결정트리를 묶어 강력한 모델을 만드는 앙상블 방법 분류와 회귀에 사용할 수 있음 랜덤포레스트와는 다르게 이전 트리의 오차를 보완하는 방식으로 순차적으로 트리를 만듦 무작위성이 없으며 강력한 사전 가지치기를 사용 캐글 상위 랭커들이 많이 사용하고...
- 14 Jan 2018 »
[도서 리뷰]딥러닝 부트캠프 with 케라스
길벗출판사의 개발자 리뷰어 이벤트를 통해 작성된 리뷰입니다. 최근 케라스에 관심을 갖게 된건 캐글 경진대회에서 상위권에 든 사람들이 케라스를 사용한 것을 보고 부터다. 하지만 케라스로 출판된 책이 많지 않아 책으로 정리 된 내용을 학습하고 싶었는데 최근 케라스 책이 몇 권 출판 되었다. 이 책도 그 중 하나로 딥러닝에 대한 이론 소개와...
- 11 Dec 2017 »
Mac OSX에서 NLTK Data 설치하기
Mac OSX에서 NLTK Data 설치하기 파이썬을 이용한 자연어 처리 툴깃 분류, 토큰 화, 형태소 분석, 태깅, 구문 분석 및 의미 추론을 위한 텍스트 처리 라이브러리, WordNet을 제공 아나콘다를 사용하면 한 번에 다운로드를 받을 수 있으나, 아나콘다 환경이 아닐 때 직접 설치하려고 하면 CERTIFICATE_VERIFY_FAILED 로 설치가 되지 않는다. nltk.download() 에서 SSL오류가...
- 26 Nov 2017 »
scikit-learn 핵심개발자 안드레아 뮐러가 쓴 머신러닝 책 - 파이썬 라이브러리를 활용한 머신러닝
파이썬 라이브러리를 활용한 머신러닝 이 리뷰는 한빛미디어의 “나는 리뷰어다” 이벤트를 통해 책을 제공받아 작성했습니다. 이 책은 싸이킷런의 핵심 개발자가 참여해 집필했다는 것만으로도 매력적으로 다가왔다. 파이썬 머신러닝을 얘기할 때 사이킷런이 핵심을 차지하고 있기 때문에 출간 때부터 눈여겨 왔는데, 한빛미디어의 나는 리뷰어다를 통해 읽을 수 있게 되어 행운이었다. 이 책은 그간 여러...
- 22 Nov 2017 »
MAC OSX에서 konlpy 설치 시 ImportError: No module named 'jpype' 오류 해결
설치하기 — KoNLPy 0.4.3 documentation # 일단, 내 MAC OSX 버전은 다음과 같다. import platform import sys print(""" system: %s mac_ver: %s """ % ( platform.system(), platform.mac_ver(), )) system: Darwin mac_ver: ('10.13.1', ('', '', ''), 'x86_64') konlpy를 pip install konlpy로 설치하고 노트북에서 import 했더니 다음과 같은 오류가 나서 몇 시간을...
- 21 Nov 2017 »
캐글러 설문조사의 응답을 파이썬 데이터 시각화 툴로 살펴보기
캐글을 시작한지 두 달정도 된 초보자로, 이 설문조사의 결과를 바탕으로 데이터사이언스와 머신러닝과 관련 된 인사이트를 얻어볼 수 있지 않을까 가설을 세워본다. 참고 URL : Data Science FAQ Kaggle Novice to Grandmaster Kaggle 캐글러를 대상으로 한 설문조사 설문기간 : 2017년 8월 7일부터 8월 25일까지 평균 응답 시간은 16.4 분 171 개...
- 20 Nov 2017 »
matplotlib 한글폰트 사용하기
matplotlib 한글폰트 사용하기 1. 필요한 패키지를 가져옵니다. # 그래프를 노트북 안에 그리기 위해 설정 %matplotlib inline # 필요한 패키지와 라이브러리를 가져옴 import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.font_manager as fm # 그래프에서 마이너스 폰트 깨지는 문제에 대한 대처 mpl.rcParams['axes.unicode_minus'] = False 2. 그래프를 그리기 위해 임의의 데이터를...
- 15 Feb 2015 »
파이썬 코리아 Data101 튜토리얼(IPython Notebook) 후기
IPython Notebook을 처음 접한 건 지난해(2014년) 파이썬코리아 6월 세미나에서였다. 어찌 보면 기형적으로 장고를 통해 파이썬을 접했기에 파이썬 문법을 익히기 위해 코드카데미의 파이썬 강좌를 수강했던 경험이 있는데 코드카데미를 통해 파이썬을 학습하면서 느꼈던 장점은 환경설정에 대한 진입장벽을 없애줬다는 점이었다. 이런 내게, IPython Notebook은 코드를 입력하고 결과를 바로 보여준다는 점에서 코드카데미를 떠올리게도 했지만...
- 14 Aug 2014 »
장고로 첫 삽뜨기
장고로 첫 삽 뜨기 - 우리집 꼬마를 위한 유아용 영어동요 웹앱 개발후기 django 장고 시작하기 장고코딩을 처음 해 본게 스마트스터디의 오픈세션에서 였는데 내 게으름으로 인해 그 후 일년이 지나서야 본격적으로 장고를 시작하게 되었다. 그렇다고 뭐 아주 열심히 열정적으로 장고를 사용한 건 아니지만 말이다. 과거, 옥시토신 호르몬의 분비로 인해 서버 아이디와...
- 26 Feb 2014 »
지킬로 블로그 시작하기
Jekyll 지킬 Jekyll 시작하기 어디선가 Jekyll은 워드프레스보다 훨씬 설치가 간단 하다고 하는데 그 말 그대로 github에 저장소를 만들고 터미널에서 몇 줄이면 바로 블로그가 생성 되었다. (보통 10여분 정도 걸리기도 한다고 하지만 대부분 바로 생성 되었다.) $ jekyll new 저장소명 $ cd 저장소명 $ git init $ git remote add origin...
- 14 Feb 2014 »
코드카데미로 파이썬 배우기
Codecademy python수업 후기 지난 몇달 간 python도 제대로 모르면서 취미로 무작정 django로 웹어플리케이션을 만들면서 모르는 건 그때 그때 구글링을 통해 해결하곤 했었는데 python을 제대로 알지 못 하고 django를 다루다 보니 장님 코끼리 만지는 기분으로 python 기초에 대한 부족함을 늘 느끼고 있었다. 보통 새로운 언어를 익힐 때 환경을 설정하는 일이 까다롭고...