PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】
4.2 (1,408 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
8,696 students enrolled

PythonによるWebスクレイピング〜入門編〜【業務効率化への第一歩】

Seleniumを用いて、自動ログイン、テキストの抽出、画像データの収集を行ってみよう。データの収集方法を学ぶことで、定期的なデータ収集を効率良く行うことができます。
4.2 (1,408 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
8,696 students enrolled
Created by 今西 航平
Last updated 5/2019
Japanese
Current price: $90.99 Original price: $129.99 Discount: 30% off
23 hours left at this price!
30-Day Money-Back Guarantee
This course includes
  • 2.5 hours on-demand video
  • Full lifetime access
  • Access on mobile and TV
  • Certificate of Completion
Training 5 or more people?

Get your team access to 4,000+ top Udemy courses anytime, anywhere.

Try Udemy for Business
What you'll learn
  • seleniumを用いてテキスト情報を抽出することができるようになります。
  • seleniumを用いて自動でログインすることができるようになります。
  • Webページからテキスト情報を取得することができるようになります。
  • Pillowを用いてPythonで画像を扱うことができるようになります。
  • ランキング形式のサイトからまとめて情報を収集することができるようになります。
  • Pandasを用いてデータを整理し、CSVへの掃き出しをできるようになります。
Course content
Expand all 21 lectures 02:40:34
+ 環境構築
2 lectures 13:15

【注意】

Windowsの方は、Firefox周りでエラーが出る場合が多いため、
順調に進まなかった場合は、GoogleChromeを使用し進めてください。
よろしくお願いいたします。

Seleniumのインストールと準備
11:54
+ テキストデータを自動抽出
5 lectures 24:33
テキストデータの取得
01:53
演習:各項目の抽出
04:21
テキストデータを一括取得
10:36
演習:値の抽出
03:08
CSVファイルに出力
04:35
+ ランキングサイトからまとめて情報収集
5 lectures 01:08:19
1つの観光地の情報を取得
11:39
演習:総合評価の取得
10:13
すべての観光地の情報を取得
11:39
演習:総合評価と各項目をまとめて取得
23:28
全ページの情報を取得
11:20
+ 画像の収集
3 lectures 20:39
Pillowの使い方
04:58
1枚の画像を取得
06:58
すべての画像を取得
08:43
+ おまけ
2 lectures 13:28
Xpathとは
04:55
Yahoo!路線情報で検索
08:33
Requirements
  • Pythonの基本的な文法が理解できる方
  • HTML, CSSのことが理解できている方
  • 本コースは、macOSを使用して進めていきますが、Windowsでも同様に進めることができます。
  • Mac, Windowsの両方の環境構築手順を紹介しています。
Description

受講生8,000人を超えるキカガク講師によるPythonによるWebスクレイピング入門が登場。
PythonによるWebスクレイピングの実装方法を学び、定期的なデータの収集を効率化しましょう。

Webスクレイピングとは、定期的な情報収集、大量の情報収集であれば、数行のコードを書くだけで自動で行ってくれる便利テクニックです。
このWebスクレイピング技術を用いることで、業務の効率化への第一歩を踏み出していきましょう。

【コース概要】

以下、本コースで扱う大枠の内容となっております。

  1. Webページに自動でログイン

  2. テキストデータを取得

  3. ランキング形式のサイトから一括で情報を取得

  4. 画像データを取得

  5. まとめた情報をCSVファイルに出力

  6. 検索サイトのクエリを把握

本講座では、講師自作のWebページを用いてWebスクレイピングを行います。
画像処理ライブラリであるPillowやスクレイピング・クローリングライブラリであるSeleniumの導入についても解説します。

【注意】

  • 本講座はWebスクレイピング初学者向けであり、Webスクレイピングの基礎をしっかりと身につけていただきたいので高度な内容は抑えております。

  • しっかりとカリキュラムをご覧になった上でご受講ください。

  • HTML, CSSの基礎的な知識がある前提で講座を進めております。

    理解できていない方はprogateで勉強してから受講してください。

  • Pythonの基本的な文法、Jupyter Notebookの使い方がわかる前提で講座を進めております。

    理解できていない方は以下2つの動画(Udemy)で勉強してから受講してください。

    • 【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -

    • 【キカガク流】プログラミング力向上のためのPythonで学ぶアルゴリズム論(前編)

Who this course is for:
  • 自動でWebから情報を取得するのに興味がある方
  • 機械学習等で使用するデータをWebから取得したい方
  • 業務効率化のためにWebスクレイピングを学びたい方