【한글자막】 NLP : Python 으로 배우는 자연어 처리
What you'll learn
- Python으로 텍스트 파일 작업하는 방법
- Python으로 PDF 파일 작업하는 방법
- 텍스트에서 패턴 검색을 위한 정규 표현식 활용
- 초고속 토큰화를 위한 spaCy 사용
- 어간 추출 및 표제어 추출
- 단어 집합과 검색
- 품사 태깅을 사용한 원시(raw) 텍스트 파일 자동 처리
- 개체명 인식 이해
- spaCy로 POS(품사 태깅) 및 NER(개체명 인식) 시각화
- SciKit-Learn(사이킷런)을 통한 텍스트 분류
- 토픽 모델링을 위한 잠재 디리클레 할당
- 비음수 행렬 분해
- Word2Vec 알고리즘 사용
- 감성 분석을 위한 NLTK 사용
- 딥러닝을 사용한 자신만의 챗봇 만들기
Requirements
- Python에 대한 기본 지식
- Python 패키지
- 인터넷 환경
Description
Welcome to the best Natural Language Processing course on the internet!
안녕하세요! Jose Portilla입니다.
특별히 한국의 수강생분들을 만나기 위해 한국어 자막을 준비했습니다.
강의를 들으시고 궁금하신 점은 언제든 Q&A에 남기실 수 있지만 Q&A는 꼭 영어로 남겨주세요.
이 강의는 Python프로그래밍 언어와 함께 자연어 처리 사용법을 배우고자 하는 분들이 온라인으로도 완벽하게 배우실 수 있도록 설계되었습니다. 이 강의에서 우리는 Python으로 NLP의 세계적 수준의 실무자가 되기 위해 배워야 할 모든 것을 다룰 것입니다. 기본 사항부터 시작하여 Python으로 텍스트 및 PDF 파일을 열고 작업하는 방법과 정규 표현식을 사용하여 텍스트 파일 내에서 맞춤 패턴을 검색하는 방법을 알아보겠습니다.
우리는 자연어 처리의 기초, Python용 NLTK(Natural Language Toolkit), 초고속 토큰화를 위한 최신 spaCy, 구문 분석, 개체명 인식, 표제어 추출을 배웁니다. 또한 형태소 분석, 표제어, 불용어, 구문 일치, 토큰화 등과 같은 기본적인 NLP 개념을 이해할 것입니다!
다음으로 우리는 당신의 Python 스크립트가 지능형 언어 시스템을 구축하는 데 필수적인 명사, 동사 및 형용사와 같은 적절한 품사에 텍스트의 단어를 자동으로 할당할 수 있는 품사 태깅을 다룰 것입니다. 또한 텍스트 정보를 제공함으로써 코드가 돈, 시간, 회사, 제품 등과 같은 개념을 자동으로 이해할 수 있도록 하는 개체명 인식에 대해서도 배웁니다.
최첨단 시각화 라이브러리를 통해 이러한 관계를 실시간으로 볼 수 있습니다. 그런 다음 Machine Learning을 이해하고 텍스트 분류를 수행하기 위한 Scikit-Learn으로 Machine Learning 시스템을 자동으로 구축합니다. 우리는 그것을 통해 긍정적 또는 부정적인 영화 리뷰를 구분하거나, 스팸과 합법적인 이메일 메시지를 결정할 수 있습니다.
우리는 이 지식을 토픽 모델링과 같은 자연어 처리를 위해 더 복잡한 자율 학습 방법으로 확장할 것입니다. 여기서 기계 학습 모델은 원시(raw) 텍스트 파일에서 주제와 주요 개념을 감지합니다. 이 과정에는 NLTK 라이브러리를 사용한 텍스트의 감정 분석, Word2Vec 알고리즘을 사용한 의미론적 단어 벡터 생성 및 딥 러닝을 사용하여 자체 채팅 봇을 구축하는 것과 같은 최첨단 고급 주제에 대한 전체 섹션이 포함되어 있습니다!
이 모든 것이 30일 환불 보장과 함께 제공되므로 부담 없이 강의를 시작해보세요.
당신도 NLP 전문가가 되십시오!
I will see you inside the course,
Jose
Who this course is for:
- 자연어 처리 사용에 관심 있는 Python개발자
Instructors
Jose Marcial Portilla has a BS and MS in Mechanical Engineering from Santa Clara University and years of experience as a professional instructor and trainer for Data Science, Machine Learning and Python Programming. He has publications and patents in various fields such as microfluidics, materials science, and data science. Over the course of his career he has developed a skill set in analyzing data and he hopes to use his experience in teaching and data science to help other people learn the power of programming, the ability to analyze data, and the skills needed to present the data in clear and beautiful visualizations. Currently he works as the Head of Data Science for Pierian Training and provides in-person data science and python programming training courses to employees working at top companies, including General Electric, Cigna, The New York Times, Credit Suisse, McKinsey and many more. Feel free to check out the website link to find out more information about training offerings.
1980년 도서출판 '헤임인터내셔널'이라는 이름으로 설립된 웅진씽크빅은 '헤임고교학습', '어린이마음', '웅진위인전기', 등을 잇따라 성공적으로 선보이며 교육업계를 이끌어왔습니다.
유아에서 성인을 아우르는 다양한 교육문화 콘텐츠를 개발, 제공하며 40년간 끊임없이 발전하는 교육기업입니다.
2021년 3월, 웅진씽크빅은 Udemy와 Strategic Alliance를 체결하였으며,
다양한 Udemy의 글로벌 Bestseller 강의들을 한국 수강생들에게 소개하고 있습니다.
영어를 어려워하는 수강생을 위해 글로벌 인기 강의에 한국어 자막도 제공하고 있으며, 국내에서 학습 수요가 높은 IT, 비즈니스, 직무개발, 어학 분야 등의 유명 강의도 모두 들을 수 있도록 다양한 콘텐츠 공급사와 제휴를 맺어 E-Learning 사업을 지속적으로 확대해나가고 있습니다.