PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】
What you'll learn
- seleniumを用いてテキスト情報を抽出することができるようになります。
- seleniumを用いて自動でログインすることができるようになります。
- Webページからテキスト情報を取得することができるようになります。
- Pillowを用いてPythonで画像を扱うことができるようになります。
- ランキング形式のサイトからまとめて情報を収集することができるようになります。
- Pandasを用いてデータを整理し、CSVへの掃き出しをできるようになります。
Requirements
- Pythonの基本的な文法が理解できる方
- HTML, CSSのことが理解できている方
- 本コースは、macOSを使用して進めていきますが、Windowsでも同様に進めることができます。
- Mac, Windowsの両方の環境構築手順を紹介しています。
Description
受講生8,000人を超えるキカガク講師によるPythonによるWebスクレイピング入門が登場。
PythonによるWebスクレイピングの実装方法を学び、定期的なデータの収集を効率化しましょう。
Webスクレイピングとは、定期的な情報収集、大量の情報収集であれば、数行のコードを書くだけで自動で行ってくれる便利テクニックです。
このWebスクレイピング技術を用いることで、業務の効率化への第一歩を踏み出していきましょう。
【コース概要】
以下、本コースで扱う大枠の内容となっております。
Webページに自動でログイン
テキストデータを取得
ランキング形式のサイトから一括で情報を取得
画像データを取得
まとめた情報をCSVファイルに出力
検索サイトのクエリを把握
本講座では、講師自作のWebページを用いてWebスクレイピングを行います。
画像処理ライブラリであるPillowやスクレイピング・クローリングライブラリであるSeleniumの導入についても解説します。
【注意】
本講座はWebスクレイピング初学者向けであり、Webスクレイピングの基礎をしっかりと身につけていただきたいので高度な内容は抑えております。
しっかりとカリキュラムをご覧になった上でご受講ください。
HTML, CSSの基礎的な知識がある前提で講座を進めております。
理解できていない方はprogateで勉強してから受講してください。
Pythonの基本的な文法、Jupyter Notebookの使い方がわかる前提で講座を進めております。
理解できていない方は以下2つの動画(Udemy)で勉強してから受講してください。
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -
【キカガク流】プログラミング力向上のためのPythonで学ぶアルゴリズム論(前編)
Who this course is for:
- 自動でWebから情報を取得するのに興味がある方
- 機械学習等で使用するデータをWebから取得したい方
- 業務効率化のためにWebスクレイピングを学びたい方
Instructor
プログラミング教育系YouTuber
2021年1月現在、約2万人のチャンネル登録者がいる「いまにゅのプログラミング塾」を運営。
プログラミング初学者がプログラミングを楽しみ、ビジネス活用につなげていくための講座を公開中。
■書籍
・図解ポケット 今日から使える! データサイエンスがよくわかる本
・Tableauで始めるデータサイエンス
-----
元 株式会社キカガク 取締役COO
大学では多変量解析を専攻。大学時代4年間、塾講師として「教育」に熱中し、300名以上の中高生の授業を担当。
現在はキカガク開催の短期セミナー・長期コースのメイン講師、社内外の講師育成を担当。ビジネスパーソン向けのAI関連セミナーにて300名以上の教育実績を持ち、セミナー事業の責任者として機械学習教育に注力。
Udemyデビュー作はベストセラーとなり、2作目はわずか1ヶ月で受講生1000名を突破。初学者・中級者をメインに講座を展開しています。