Pythonで機械学習:scikit-learnで学ぶ識別入門
What you'll learn
- 機械学習の識別(分類・パターン認識)が何かが分かります
- Pythonとjupyter notebookが使えるようになります.
- Pythonの機械学習ライブラリscikit-learnを使えるようになります
- 学習データとテストデータを準備する
- データの前処理をする
- 学習データで識別器を学習する
- 交差確認(cross validation)やleave-one-outなどを使う
- 識別器でテストデータを識別する
- 識別結果を評価する
- 過学習とは何かを知る
- 2クラス分類と多クラス分類の違いを知る
- k最近傍識別器(k-NN)を使う
- サポートベクターマシン(SVM)を使う
- ロジスティック回帰を使う
- 多層ニューラルネットワーク(多層パーセプトロン)を使う
- パーセプトロンを使う
Course content
- Preview01:34
- 02:54識別とは
- 01:02識別の流れ
- 02:31ラベルについて
- 01:24回帰とは(ここでは扱わない)
- 01:28教師あり,教師なし,半教師あり
- 00:55ディープラーニング(深層学習)とは
Requirements
- pythonプログラミングの初歩的な知識
- jupyter notebook のプログラミング環境が構築できるスキル
Description
このコースでは,機械学習における識別(分類・認識)の基礎をPythonを用いて学びます.このコースの目標は,機械学習でデータを識別するための一連の流れ(データの準備・前処理・識別器・評価など)を理解することです.Pythonの機械学習ライブラリscikit-learnとインタラクティブなプログラミング環境jupyter notebook (ipython notebook)を使って,実際にpythonコードを実行しながら学びます.
レクチャーでは,notebook上で実行するpythonコードとその内容を説明します.pythonコードのnotebookはダウンロードできますので,レクチャーを見ながら・見た後で実際に実行することをおすすめします.自分なりに改変・修正すると,さらに理解が高まるでしょう.
機械学習を理解するためには数学が必要になるのですが,このレクチャーでは(ほとんど)数式を使わず,コードを実行して結果を議論することで,機械学習のコンセプトを伝えるようにしています.理論的なことを知りたい場合には,他の資料を参考にしてください.
プログラミングの注意:pythonやその他の言語でのプログラミング経験があることを前提にしていますので,python自体の説明は省略しています.
レクチャーで使用しているnotebookはダウンロードできます.「レクチャー用のnotebookのダウンロードはこちら(ソースコードはここにあります)」というレクチャーを参照してください.
Who this course is for:
- 機械学習という言葉は知っているが,中身を知らない人
- プログラミングが嫌いではない人(Pythonプログラミングをします)
- Pythonプログラミング環境を用意できる人
- 具体的に機械学習を適用したいデータがある人
Instructor
コンピュータビジョン,画像認識,パターン認識,動画像処理,医用画像処理などを専門とする.電子情報通信学会和文誌D編集委員,PRMU委員,MI委員.情報処理学会CVIM委員,GCAD委員など歴任.2001年新潟大学助手,2005年広島大学准教授.2020年名古屋工業大学教授.翻訳書に「コンピュータビジョン ―アルゴリズムと応用―」「統計的学習の基礎」「スパースモデリング」(共立出版)「Pythonで体験するベイズ推論」(森北出版).電子情報通信学会シニア会員.情報処理学会,IEEE,IEEE Computer Society等会員.