
このコースの説明です。
ますは、これから学ぶスクレイピングで、このコースの中で最終的にどんなことをするかの説明です。
seleniumモジュールをインストールします。
Webドライバー Google Chromeのダウンロードを行います。
まずは、Webドライバー(Google Chrome)が起動するか確認してみましょう。
最初にログイン処理をしましょう。ログイン画面を出して、ユーザ名(メールアドレス)を入力するところまで、どのようにプログラミングするかを学びましょう。
ログインのあと、パスワードを入力する画面で、自動的にパスワードを入力するまで、どのようにプログラミングするかを学びましょう。
タグ一覧から、Pythonタグをクリックして、Pythonタグが付けられた記事一覧を出すまでのプログラミング方法を学びます。
1つ1つの記事に付けられたタグの見つけ方と、その個数の数え方、および次ページをクリックする方法などを学びます。
さあ、スクレイピングの総仕上げです。Pythonタグが付けられた過去10000個の記事(約1年分)のタグを蓄積し、どのようなタグが、いくつぐらい付けられているか、CSVファイルとして出力するまでを学びます。
エンジニアリングに関する知識を記録・共有するためのサービスであるQiita(キータ)のWebページを題材として、Python+seleniumでのWebスクレイピングプログラムの作り方を学びます。
Qiitaには、毎日数多くの記事が投稿されていますが、Pythonタグのついた記事には、どんな関連タグがついているのでしょうか?
まずは、過去10000記事のタグの種類と個数を数えるWebスクレイピングプログラムを作ってみましょう。
このプログラムの作り方を動画で見ることにより、いかに簡単にWebスクレイピングプログラムが作れてしまうかびっくりすることでしょう。