본문 바로가기
데이터사이언스

책리뷰) 모두의 한국어 텍스트분석 with 파이썬 박조은, 송영숙 저

by _온기 2023. 8. 12.
반응형

책리뷰) 모두의 한국어 텍스트분석 with 파이썬 박조은, 송영숙 저

너무 좋은 책을 발견해서 리뷰를 진행하게 되었다. 

파이썬이 대중화 되면서 ' 이제 GPT 활용해서 코드를 있겠구나' 라고 생각하는 사람도 있겠지만 '안해봤다'라는 허들이 높아서 도전조차 못하는 사람들을 위해 AtoZ를 알려주는 책이다. 

책 표지에도 '기초부터 chat gpt까지 누구나 쉽게 시작하는 자연어처리'라고 소개하고있다.

오늘코드를 통해 박조은님의 도움을 많이 받았던만큼 이번 책도 기대되었다. 

https://www.youtube.com/c/todaycode

 

오늘코드todaycode

공공데이터 분석 데이터 시각화 캐글을 통한 머신러닝/딥러닝 튜토리얼 Pandas, Numpy, Scipy, scikit-learn, TensorFlow, Keras, Jupyter, Colaboratory 👉 페이스북 : https://www.fb.com/todaycode​ 👉 인스타그램 : https://

www.youtube.com

책은 생각한만큼 친절했는데 

1. 실습 환경을 코랩으로 해서 별도의 설치 없이 가능

2. 한국어 텍스트 분석 절차를 친절하게 알려줌

3.파이썬 라이브러리 기초를 알려줌

4.실습 할 수 있게 도와줌 (예제 코드 및 코랩 코드 제공)

5.Chat gpt 생성모델 개념, 질문 법에 대해 알려줌 (트랜드를 놓치지 않음)

나는 데이터사이언스를 배우고 있는 학생이지만, 아예 베이스가 없는 사람이라도 이 책의 친절한 설명을 따라가다 보면, 자신감있게 실무에서 적용할 수 있는 기술과 인사이트를 얻게 될 것이다.


실습을 위한 깃헙 링크도 제공된다.  

https://github.com/pytextbook/pytextbook

 

GitHub - pytextbook/pytextbook: 모두의 한국어 텍스트 분석 with 파이썬

모두의 한국어 텍스트 분석 with 파이썬. Contribute to pytextbook/pytextbook development by creating an account on GitHub.

github.com

나같은 경우는 한글 텍스트 분석을 코랩에서 진행해봤기 때문에 

내가 했던 방식과 비교해보면서 책을 읽을 수 있었다.

그리고 친절한 저자 직강도 유튜브에 올라와있다.

https://youtu.be/KwO_BfeT5WE?list=PLaTc2c6yEwmp35y9Z868VlV9NQpG-eBb6


내가 직접 실습해본 케이스

폰트 패치부터 어떻게 하는지 몰라서 헤맸었고 

뒤에 어미를 정리하고싶은데 몰라서 처음 만든 워드클라우드는 엉망이었다.

(제일 두드러지게 많은 단어중에 '있다'가 있으면 안되잖아.....)

그리고 한글 분석에는 이게 필수 인거 아시나요? utf-8 

처음에 몰랐답니다...

encoding='utf-8'

결국 돌고돌아 해냈긴했다.

jpg로 다운받을 수 있게까지 완성! 


이렇게 하나하나 삽질하기보다 기초부터 탄탄하게 한국어 텍스트 분석을 할 수 있도록 도와주는것이 이 책이다.

생각보다 더 친절하고 

라이브러리도 정말 필요한것만 알려주신다. 데이터 시각화도 해볼 수 있다.ggplot으로 시각화까지 해보고나면 '오... 보고서의 퀄리티를 확 높일 수 있을것 같은데?'라는 생각이든다.

이런분들에게 추천한다.

1. 텍스트 분석을 업무에서 한번 해보고 싶었는데 엄두가 안난다.

2. 비싼돈을 들이긴 싫지만 신기술에는 뒤쳐지고싶지 않다.

3. 책 한권으로 최대한 많은 뽕(?)을 뽑고싶다.

이런분들이라면 후회없는 선택이 될거라고 생각한다. 

 

반응형

댓글