
レクチャーではscikit-learnを用いて識別を説明していきます.scikit-learnには多数のチュートリアルがありますので,参考にしてください.
レクチャーで説明しているjupyter notebookのファイル(*.ipynb)をzipファイルにまとめてあります.これをあらかじめダウンロードして展開し,開けるようにしておいてください.
レクチャーを見る際には,レクチャーと一緒に,自分の環境でnotebookを実行してみてください.
notebookのファイル名は,「セクション番号_ファイル番号」になっています.レクチャータイトルにも同じ番号を付けていますので,どのレクチャーがどのnotebookなのかを確認してください.
2020/5/10追記:新しいファイル「20200509ipynb.zip」を作成しました.こちらをダウンロードしてください.またgithubにもコードを掲載しました.リンクを参照してください.
ダウンロードしたMNISTデータセットは,ホームディレクトリ(ホームフォルダ)のscikit_learn_data/ の中にあります.
注意:ダウンロードできない場合には,「おしらせ」に掲載した解決策を試してみてください.
scikit-learnにはAPを計算するクラスがありますが,2クラス問題用なので,多クラス問題のAPやmAPを計算するにはレクチャーのよう自分でコードを書く必要があります.
ダウンロードしたデータセットは,ホームディレクトリ(ホームフォルダ)のscikit_learn_data/ の中にあります.
このコースでは,機械学習における識別(分類・認識)の基礎をPythonを用いて学びます.このコースの目標は,機械学習でデータを識別するための一連の流れ(データの準備・前処理・識別器・評価など)を理解することです.Pythonの機械学習ライブラリscikit-learnとインタラクティブなプログラミング環境jupyter notebook (ipython notebook)を使って,実際にpythonコードを実行しながら学びます.
レクチャーでは,notebook上で実行するpythonコードとその内容を説明します.pythonコードのnotebookはダウンロードできますので,レクチャーを見ながら・見た後で実際に実行することをおすすめします.自分なりに改変・修正すると,さらに理解が高まるでしょう.
機械学習を理解するためには数学が必要になるのですが,このレクチャーでは(ほとんど)数式を使わず,コードを実行して結果を議論することで,機械学習のコンセプトを伝えるようにしています.理論的なことを知りたい場合には,他の資料を参考にしてください.
プログラミングの注意:pythonやその他の言語でのプログラミング経験があることを前提にしていますので,python自体の説明は省略しています.
レクチャーで使用しているnotebookはダウンロードできます.「レクチャー用のnotebookのダウンロードはこちら(ソースコードはここにあります)」というレクチャーを参照してください.