Udemy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
Development
Web Development Data Science Mobile Development Programming Languages Game Development Database Design & Development Software Testing Software Engineering Development Tools No-Code Development
Business
Entrepreneurship Communications Management Sales Business Strategy Operations Project Management Business Law Business Analytics & Intelligence Human Resources Industry E-Commerce Media Real Estate Other Business
Finance & Accounting
Accounting & Bookkeeping Compliance Cryptocurrency & Blockchain Economics Finance Finance Cert & Exam Prep Financial Modeling & Analysis Investing & Trading Money Management Tools Taxes Other Finance & Accounting
IT & Software
IT Certification Network & Security Hardware Operating Systems Other IT & Software
Office Productivity
Microsoft Apple Google SAP Oracle Other Office Productivity
Personal Development
Personal Transformation Personal Productivity Leadership Career Development Parenting & Relationships Happiness Esoteric Practices Religion & Spirituality Personal Brand Building Creativity Influence Self Esteem & Confidence Stress Management Memory & Study Skills Motivation Other Personal Development
Design
Web Design Graphic Design & Illustration Design Tools User Experience Design Game Design Design Thinking 3D & Animation Fashion Design Architectural Design Interior Design Other Design
Marketing
Digital Marketing Search Engine Optimization Social Media Marketing Branding Marketing Fundamentals Marketing Analytics & Automation Public Relations Advertising Video & Mobile Marketing Content Marketing Growth Hacking Affiliate Marketing Product Marketing Other Marketing
Lifestyle
Arts & Crafts Beauty & Makeup Esoteric Practices Food & Beverage Gaming Home Improvement Pet Care & Training Travel Other Lifestyle
Photography & Video
Digital Photography Photography Portrait Photography Photography Tools Commercial Photography Video Design Other Photography & Video
Health & Fitness
Fitness General Health Sports Nutrition Yoga Mental Health Dieting Self Defense Safety & First Aid Dance Meditation Other Health & Fitness
Music
Instruments Music Production Music Fundamentals Vocal Music Techniques Music Software Other Music
Teaching & Academics
Engineering Humanities Math Science Online Education Social Science Language Teacher Training Test Prep Other Teaching & Academics
AWS Certification Microsoft Certification AWS Certified Solutions Architect - Associate AWS Certified Cloud Practitioner CompTIA A+ Cisco CCNA CompTIA Security+ Amazon AWS Microsoft AZ-900
Graphic Design Photoshop Adobe Illustrator Drawing Digital Painting InDesign Character Design Canva Figure Drawing
Life Coach Training Neuro-Linguistic Programming Personal Development Personal Transformation Mindfulness Life Purpose Meditation CBT Emotional Intelligence
Web Development JavaScript React CSS Angular PHP Node.Js WordPress Vue JS
Google Flutter Android Development iOS Development React Native Swift Dart Programming Language Mobile Development Kotlin SwiftUI
Digital Marketing Google Ads (Adwords) Social Media Marketing Google Ads (AdWords) Certification Marketing Strategy Internet Marketing YouTube Marketing Email Marketing Retargeting
Microsoft Power BI SQL Tableau Business Analysis Data Modeling Business Intelligence MySQL Data Analysis Blockchain
Business Fundamentals Entrepreneurship Fundamentals Business Strategy Business Plan Startup Freelancing Online Business Blogging Home Business
Unity Game Development Fundamentals Unreal Engine C# 3D Game Development C++ 2D Game Development Unreal Engine Blueprints Blender
30-Day Money-Back Guarantee
Development Data Science Python

Pythonによるビジネスに役立つWebスクレイピング(BeautifulSoup、Selenium、Requests)

Python3のスクレイピング用ライブラリBeautifulSoup、Seleniumなどを用いて、世界中のWebサイトからデータを取得します。効率的にデータを収集・活用することで、業務の効率化・生産性向上に貢献する技術を身に付けましょう!
Rating: 4.3 out of 54.3 (308 ratings)
2,576 students
Created by 清水 義孝
Last updated 4/2021
Japanese
30-Day Money-Back Guarantee

What you'll learn

  • Python3のスクレイピング用ライブラリBeautifulSoup、Selenium、Requests、Newspaper3k、Pandas(read_html)が扱えるようになります。
  • Beautiful Soupを用いて、複数のWebページを巡回し、目的の情報を取得する方法を理解することができます。
  • Seleniumを利用した、ログイン画面への対処、JavaScriptを用いた動的なサイトへの対処、画像を取得・ダウンロードする方法を理解することができます。
  • newspaper3kを用いて、ニュースサイトやブログのトップページに表示されている複数の記事を順に巡回し、記事や要約、キーワードをダウンロード・保存する方法を理解することができます。
  • Pandasのread_htmlを用いて、Webサイト上のテーブルに格納されているデータを取得する方法を理解することができます。
  • スクレイピングにおけるXPath、CSSセレクタ、正規表現の利用方法を学ぶことができます。
  • スクレイピングでデータを取得・抽出し、取得したデータを整形・グラフ化、保存する一連の流れを習得することができます。
Curated for the Udemy for Business collection

Course content

20 sections • 131 lectures • 8h 20m total length

  • Preview03:17
  • Preview02:50
  • Preview05:05
  • Preview03:58
  • 【重要】Udemyの使い方
    01:45

  • Jupyter Notebookのインストール
    01:14
  • Preview05:04
  • エディットモード・コマンドモード、ショトカットキー
    04:42
  • マークダウン
    02:34
  • コードの実行
    02:06
  • データ保存
    01:29
  • ファイル共有、終了方法
    03:55
  • その他の便利な機能
    00:43
  • ライブラリのインストール
    00:55

  • HTMLの構成、タグの種類
    08:02
  • HTMLタグの属性
    02:55
  • CSSとは
    01:57
  • HTMLの階層構造
    02:45

  • Preview02:05
  • newspaper3kでデータが取得できない場合の対応方法
    00:53
  • 単一のニュース記事の取得
    06:00
  • 自然言語処理による要約の取得
    03:14
  • Preview07:06
  • CSVファイルへの保存1(ヘッダデータ)
    08:37
  • CSVファイルへの保存2(明細データ)
    05:10
  • newspaper3kの基本演習
    4 questions
  • ソースコード
    00:09

  • Preview01:39
  • Pandas・read_htmlの基本
    03:47
  • Preview06:27
  • 取得データの変換1(数値)
    07:11
  • 取得データの変換2(日付)
    05:44
  • 株価グラフの描画
    04:51
  • 株価データの保存
    02:30
  • ソースコード
    00:09

  • Preview00:35
  • Preview04:31
  • Requestsの使い方(responseオブジェクト)
    05:05
  • Requestsの使い方(getメソッドの引数)
    07:00
  • ソースコード
    00:09

  • Preview01:17
  • Preview05:37
  • BeautifulSoupでHTMLの階層を移動してタグを指定する方法
    05:16
  • BeautifulSoupのfind、find_allメソッドの使い方
    03:28
  • BeautifulSoupのselectメソッドの使い方
    03:37
  • BeautifulSoupの基本演習
    5 questions
  • ソースコード
    00:09

  • Preview02:05
  • 読売新聞オンラインからHTMLデータの取得
    06:47
  • サイトの変更に伴うコードの変更点
    01:04
  • selectメソッドによるニュースタイトル・URLの取得
    07:31
  • 複数のニュースタイトル・URLの取得
    06:58
  • Preview04:50
  • ソースコード
    00:09

  • Preview02:37
  • Preview01:17
  • 【解説】主要ニュースのタイトル・URL一覧の取得
    08:54
  • 【課題】要約ページからニュースページへのリンクの取得
    00:34
  • 【ヒント】リンクをたどって複数のページを遷移する方法
    01:52
  • 【解説】サイトの変更に伴うコードの変更点
    01:48
  • 【解説】要約ページからニュースページへのリンクの取得
    07:39
  • 【課題】各主要ニュースの記事の取得
    00:36
  • 【解説】サイトの変更に伴うコードの変更点
    00:53
  • 【解説】各主要ニュースの記事の取得
    05:51
  • ソースコード
    00:09

  • Preview01:30
  • Preview03:56
  • 正規表現で使う関数(match・search)
    04:35
  • 正規表現で使う関数(findall・finditer・fullmatch・sub)
    05:34
  • 文字列の先頭・末尾を指定する記号
    02:16
  • 繰り返し回数を指定する記号
    07:17
  • 集合(否定を含む)・ORを指定する記号
    05:11
  • 特殊シーケンス
    05:59
  • コンパイル・特殊文字のエスケープ
    03:21
  • 貪欲マッチ・非貪欲マッチ
    03:31
  • フラグ引数
    09:09
  • ソースコード
    00:09

Requirements

  • Pythonの基本的な文法を理解されている方を対象としています。もし受講の途中で知識の不足を感じるようでしたら、参考のリンクを掲載しておりますので、補足ください。
  • 講師はWindowsの環境で解説しておりますが、Macでも同様に進めていくことができます。
  • スクレイピングが全くの未経験でも問題ありません。HTML、CSSの基本についても解説しております。
  • 講師はAnacondaでのPython3環境を構築し、Jupyter Notebookを元に解説を進めておりますが、別のPython3環境でも進めていくことができます。
  • AnacondaでのPython3の環境構築、Jupyter Notebookの使い方についての講義も提供しております。

Description

現役のデータサイエンティストが提供するWebスクレイピングに関する講座で、データサイエンスの実務における経験を基に、デザインされた講座になります。


近年、ビジネスでのデータ活用においては、世界中のWebサイトから様々なデータを取得することが求めらています。 また変化も激しい環境において、それぞれのWebサイトの構造や内容も頻繁に更新され、日々変わっていきます。


スクレイピングが難しい理由として、次のようなポイントが挙げられます。

  1. Webサイトにより構造が異なる

  2. Webサイトの構造が複雑・頻繁に変わる

  3. JavaScriptでユーザーの操作によって新たなページが読み込まれるなど、特殊な技術が使われている

しかし、ビジネスでスクレイピングを用いるには、これらのポイントに適切に対処していくことが求められます。


これら難しいポイントに適切に対処し、ビジネスでスクレイピングを活用できるよう、このコースはデザインされています。

このコースの特徴は次のようなものになります。

  1. 様々なニーズや場面に応じて使い分けできるよう、Pythonのスクレイピングライブラリの中でも幅広いライブラリをカバーします。

    •    Beautiful Soup、Selenium、Requests、newspaper3k、Pandasのread_html

  2. ビジネスで活用するにおいて必要となる、スクレイピングにおける一連のプロセスをカバーします。

    •    データ取得・抽出から、整形、グラフ化、保存まで

  3. 特殊な技術が使われているWebサイトも考慮し、幅広いスキルを身につけれるよう、レクチャーを提供します。

    •    JavaScriptを用いた動的なサイトへの対処方法

    •    ログイン画面への対処方法

    •    リンクをたどり、複数のWebページを巡回する方法

    •    テキスト情報・画像ファイルの取得方法

                                                                           など多数

これらを通じてこのコースの受講後は、世界中のWebサイトから効率的に情報を取得することができるようになります。


このWebスクレイピングの講座では、次のトピックをカバー致します。

  1. AnacondaでのPython3の環境構築、Jupyter Notebookの使い方

  2. HTMLとCSSの基本

  3. newspaper3kによるニュース記事・要約の取得と保存

  4. Pandasでスクレイピングによる株価の取得とグラフ化・保存

  5. RequestsとBeautiful Soupの基本的な使い方

  6. Beautiful Soupでリンクをたどり、複数のWebページを巡回する方法

  7. Beautiful Soupでの必要な情報の抽出方法

       a) HTMLの階層を移動して、HTMLタグの該当する箇所を検索する方法

       b) find、find_allメソッドにより、HTMLタグの該当する箇所を検索する方法

       c) selectメソッドにより、CSSセレクタで該当する箇所を指定する方法

  8. XPathやCSSセレクタの記述方法

  9. 正規表現の使い方

  10. Seleniumの基本的な使い方

  11. SeleniumによるJavaScriptを用いた動的なサイトへの対処方法

  12. Seleniumによるログイン画面への対処方法

  13. Selenium、Requestsによる画像ファイルのダウンロード・保存方法

  14. 実践プロジェクト


なお、Classなどオブジェクト指向の記述は、初心者向きでは無いので本コースの対象外としております。本コースでは、これらの記述を使わずに解説しておりますので、ご注意ください。


Who this course is for:

  • Webスクレイピングをビジネスに活用されたい方
  • Webスクレイピングを趣味に活用されたい方
  • Webスクレイピングに興味があるが、始め方がわからない方
  • Webサイトから効率的にデータを取得する方法を学習されたい方

Instructor

清水 義孝
データサイエンス、Python、スクレイピング、データ分析、BIツール
清水 義孝
  • 4.3 Instructor Rating
  • 308 Reviews
  • 2,576 Students
  • 1 Course

清水 義孝 (しみず・よしたか)

データサイエンティスト

1973年生まれ。


大学卒業後は、大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。


論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。


現在、大手製造業でデータサイエンティストとして、ビックデータの分析に携わっている。またその経験を活かしデータ収集・分析、BIツールに関する社内講座を担当。講座を通じて、のべ500名以上に教育を提供している。


Webスクレイピング、データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」の運営を始める。訪問者数は毎月7万名を超え、大好評となった。


著書に、よくわかるPython3入門シリーズ、Python3によるビジネスに役立つデータ分析入門などがある。

  • Udemy for Business
  • Teach on Udemy
  • Get the app
  • About us
  • Contact us
  • Careers
  • Blog
  • Help and Support
  • Affiliate
  • Impressum Kontakt
  • Terms
  • Privacy policy
  • Cookie settings
  • Sitemap
  • Featured courses
Udemy
© 2021 Udemy, Inc.