
本コースの対象者、また逆に受講されない方が良い方、受講後の姿、受講の前提条件について学びます。また、ハンズオンのトラブルシューティングの参考情報として、本コース収録環境についてお伝えします。
本コースの内容の概要を学びます。
人工知能とは何か、その概要(特化型、汎用型(AGI)との違い)と、人工知能の中の機械学習の位置付けについて学びます。
機械学習とは何か、その概要を、機械学習モデルを各構成要素に分解することで学んでいきます。各構成要素に分解して学ぶ実例として、大規模言語モデル(LLM)を使用した、OpenAIが開発した生成AI(ジェネレーティブAI)の代表格であるChatGPTや、家賃予測モデルを取り上げます。
機械学習の種類として、教師あり学習、教師なし学習、深層学習、強化学習、アンサンブル学習それぞれの概要について、それぞれの種類ごとに、アルゴリズムとして最小二乗法、k-means、Transformer(GPT)、Q学習、ブースティングの具体例を交えて学びます。
機械学習のプロセスとして、目的定義、事前準備、学習、改善、運用の、各プロセスの概要について学びます。
機械学習のスキルとして、目的定義、事前準備、学習、改善、運用の、各プロセスで必要なスキルの概要について学びます。
本講座のハンズオンで使用する開発環境である、Google Colabの概要と、他の開発環境(Jupyter Notebook、PyCharm、Spyder、VSCodeなど)とGoogle Colabの位置付けについて学びます。
本講座のハンズオンで使用するプログラミング言語である、Pythonの概要と、機械学習で使用されるその他のプログラミング言語(R、Julia、C++、JavaScriptなど)の概要について学びます。
本講座のハンズオンで使用するライブラリである、Scikit-learnの概要と、他のライブラリ(Pandas、Matplotlib、NumPyなど)との使い分けについて学びます。
機械学習のスキル面ではなく、マインド面のポイントとして、講師が考える、学びを継続しやすく、結果的にスキルも身に付けやすくなる3つの心構えをご紹介します。
教師あり学習の主要モデルの1つ、回帰モデルの概要と、計算手順(アルゴリズム)の種類(最小二乗法、勾配降下法、決定木、ランダムフォレスト、ニューラルネットワーク)について学びます。
本講座のハンズオンで回帰モデル作成に使用する計算手順(アルゴリズム)でもある、最小二乗法の概要とモデル作成の仕組みについて学びます。
教師あり学習の主要モデルの1つ、分類モデルの概要と、計算手順(アルゴリズム)の種類(単純パーセプトロン(誤差逆伝播法含む)、ロジスティック回帰(最尤推定法含む)、サポートベクターマシン(SVM))について学びます。
本講座のハンズオンで分類モデル作成に使用する計算手順(アルゴリズム)でもある、決定木の概要とモデル作成の仕組み(ジニ係数、利得計算)について学びます。
SVMの概要と、線形分類モデル作成の仕組みについて学びます。
本講座のハンズオンで分類モデル作成に使用する計算手順(アルゴリズム)でもある、SVMの概要と、非線形分類モデル作成の仕組み(カーネル関数、カーネルトリック)について学びます。
事前準備プロセスのサブプロセスである、データ整形の作業概要とポイントを具体例と共に学びます。
事前準備プロセスのサブプロセスである、データ分割の作業概要(2分割(ホールドアウト法)、3分割など)とポイントを具体例と共に学びます。
評価プロセスで回帰モデル評価を行う際の、評価指標の種類(決定係数 (R^2)、平均二乗誤差(MSE)、平均絶対誤差(MAE))と概要について学びます。
評価プロセスで分類モデル評価を行う際の、評価指標の種類(正解率(Accuracy)、適合率(Precision)、再現率(Recall)、F1値(F1-score))と概要について混同行列(Confusion Matrix)と共に学びます。
改善プロセスで改善が必要な事象としてのデータスケール不揃い問題の本質と、その改善策の標準化の概要について学びます。
<タイムスタンプ>
問題の内容について(0:00~)
改善策(4:54~)
改善プロセスで改善が必要な事象としての多重共線性問題の本質と、その検知方法(相関係数(Correlation Coefficient)、VIF(Variable Inflation Factor))と改善策(手動削除、Lasso回帰、PCA(主成分分析)、PLS(偏最小二乗法)、Ridge回帰、データセット変更)の概要について学びます。
<タイムスタンプ>
問題の内容について(0:00~)
検知方法(9:38~)
改善策(11:31~)
改善プロセスで改善が必要な事象としての過学習問題の本質と、その改善策(検証用データの導入(k-分割交差検証含む)、ハイパーパラメータ調整による、モデル複雑さ調整、計算手順(アルゴリズム)変更)の概要について学びます。
<タイムスタンプ>
問題の内容と改善策の概要について(0:00~)
改善策1(検証用データの導入)について(6:03~)
改善策2(ハイパーパラメータ調整による、モデル複雑さ調整)について(12:20~)
改善策3(計算手順(アルゴリズム)変更)について(16:32~)
本ハンズオンにおける回帰モデル作成の目的と手段、また使用するデータセット概要について学びます。
事前準備プロセスのサブプロセスである、データ収集のハンズオンと、インポートしたデータの可視化(統計情報サマリ出力、ヒストグラム作成、散布図作成)を通じたデータ概要理解を実施します。
<タイムスタンプ>
はじめに(0:00~)
Google Colabの使い方(1:02~)
データインポート(6:20~)
統計情報サマリ出力(21:06~)
ヒストグラム作成(25:30~)
散布図作成(33:47~)
まとめ(52:16~)
事前準備プロセスのサブプロセスである、データ整形のハンズオンを実施します。
<タイムスタンプ>
はじめに(0:00~)
文字列の数値化(2:08~)
不要データの削除(12:53~)
まとめ(21:11~)
事前準備プロセスのサブプロセスである、データ分割(2分割(ホールドアウト法))のハンズオンを実施します。
学習プロセスとして、事前準備で準備したデータセットを元に回帰モデル作成を行います。
評価プロセスとして、作成した回帰モデルの評価(決定係数 (R^2))を行います。
改善プロセスとして、評価プロセスで検知したデータスケール不揃い問題に対して標準化を使用しモデルの改善を図ります。(多重共線性検知(相関係数、VIF)含む)
<タイムスタンプ>
はじめに(0:00~)
標準化(1:10~)
多重共線性検知(相関係数)(17:21~)
多重共線性検知(VIF)(25:18~)
まとめ(31:11~)
改善プロセスとして、改善①で検知した多重共線性問題に対して計算手順変更(最小二乗法 -> PLS)を行うことで、モデルの改善を図ります。(PLS適用後の相関係数、VIF確認含む)
<タイムスタンプ>
はじめに(0:00~)
計算手順変更(PLS)(0:18~)
PLS適用後の相関係数確認(7:35~)
PLS適用後のVIF確認(13:18~)
まとめ(19:01~)
本ハンズオンにおける分類モデル作成の目的と手段、また使用するデータセット概要について学びます。
事前準備プロセスのサブプロセスである、データ収集のハンズオンを実施します。
事前準備プロセスのサブプロセスである、データ整形のハンズオンを実施します。
事前準備プロセスのサブプロセスである、データ分割(2分割(ホールドアウト法))のハンズオンを実施します。
学習プロセスとして、事前準備で準備したデータセットを元に分類モデル作成を行います。
評価プロセスとして、作成した分類モデルの評価(正解率(Accuracy)、適合率(Precision)、再現率(Recall)、F1値(F1-score))を行います。
改善プロセスとして、評価プロセスで検知した過学習問題に対してグリッドサーチによるハイパーパラメータ調整(検証用データの導入(k-分割交差検証)含む)を行うことで、モデルの改善を図ります。また、作成した分類モデル(決定木)の可視化と解釈の仕方について学びます。
<タイムスタンプ>
はじめに(0:00~)
ハイパーパラメータ調整(グリッドサーチ)(0:31~)
決定木の可視化方法(37:48~)
まとめ(55:20~)
改善プロセスとして、改善①で確認したモデル精度の更なる向上のため、計算手順変更(決定木 -> SVM)を行うことで、モデルの改善を図ります。
<タイムスタンプ>
はじめに(0:00~)
標準化(0:16~)
計算手順変更(SVM)(7:40~)
まとめ(23:27~)
<コースの概要>
本コースは前半の概要編と理論編で人工知能・機械学習の基礎と教師あり学習によるモデル作成の仕組みを学びます。
その後、後半の実践編で、Google Colabの環境で、PythonとScikit-learnを使用し回帰モデル作成、分類モデル作成の一連のプロセス(事前準備、学習、評価、改善 (標準化、ハイパーパラメータ調整、アルゴリズム変更(PLS、SVM)))をハンズオンで実施することで、学んだ理論を実践で使えるスキルに引き上げていきます。
また、スキルだけではなく、人工知能・機械学習を学ぶ際の心構えを含め、ご自身のキャリアを切り開いていくために必要な考え方、マインド面のポイントも合わせてお伝えしていきます。
<他教材との違い>
本コースと他教材(書籍やYoutube動画教材等)との違いは以下の通りです。
・1本完結型コースであるためご自身でネット検索やマニュアル確認等を行う手間がかからない。
・モデル作成の仕組みや、なぜそのコードを使用するのか等、解説する技術や手順一つとってもその理由や背景を詳細に説明しているため途中で止まらずに受講できる。
・全レクチャー動画ダウンロード可能なため、場所を問わずどこからでも受講できる。
・全ハンズオンで使用するデータセットや完成版のコード等を添付しているため、コーディングミスによる原因調査等、余計な手間がかからない。
<コース受講後の姿>
本コース受講後には以下のスキルを自然と身に付けることができます。
・教師あり学習によるAIモデル開発スキルが身に付く
・プログラミングスキル(Python、Scikit-learn、Pandas、Matplotlib等各種ライブラリ含む)
・開発プロセス完遂スキル(事前準備(データの整形等含む)、学習、評価、改善)
・深層学習や強化学習など、教師あり学習以外のAIモデル開発の学習効率が上がる
・他の学習方法との差分(深層学習ならTensorFlow等のライブラリ利用方法等)のみ学習でOK
・普段使っているAIサービスに対する疑問が晴れてスッキリする
・ChatGPTが誤った回答を返すことがあるのはなぜ?
・Amazonのお勧めに求めていない商品がレコメンドされることがあるのはなぜ?
・Googleフォト上で別人を同一人物と認識されることがあるのはなぜ?
・AIエンジニアで構成されるチームや組織のマネジメントスキルが上がる
・プロジェクトの問題解決力アップ
・エンジニアのアサイン力アップ(スキルレベルの見極め)
・リスクマネジメント力アップ
<コースの内容>
本コースの内容は以下の通りです。
コース概要
本コース受講にあたって
自己紹介
本コースのねらい
本コースの内容
人工知能・機械学習概要
人工知能とは
【キーワード】特化型、汎用型(AGI)
機械学習とは
【キーワード】大規模言語モデル(LLM)、OpenAI、生成AI、ChatGPT、家賃予測モデル
機械学習の種類
【キーワード】教師あり学習、教師なし学習、深層学習、強化学習、アンサンブル学習、最小二乗法、k-means、Transformer(GPT)、Q学習、ブースティング
機械学習のプロセス
機械学習に必要なスキル
Google Colabとは
【キーワード】Google Colab、Jupyter Notebook、PyCharm、Spyder、VSCode
Pythonとは
【キーワード】Python、R、Julia、C++、JavaScript
Scikit-learnとは
【キーワード】Scikit-learn、Pandas、Matplotlib、NumPy
機械学習を学ぶ心構え
機械学習ハンズオン理論編(教師あり学習)
回帰とは①(概要)
【キーワード】最小二乗法、勾配降下法、決定木、ランダムフォレスト、ニューラルネットワーク
回帰とは②(モデル作成の仕組み(最小二乗法))
分類とは①(概要)
【キーワード】単純パーセプトロン(誤差逆伝播法含む)、ロジスティック回帰(最尤推定法含む)、サポートベクターマシン(SVM)
分類とは②(モデル作成の仕組み(決定木))
【キーワード】ジニ係数、利得計算
分類とは③(モデル作成の仕組み(サポートベクターマシン(SVM)(線形分類)))
分類とは④(モデル作成の仕組み(サポートベクターマシン(SVM)(非線形分類)))
【キーワード】カーネル関数、カーネルトリック
事前準備プロセスのポイント①(データ整形)
事前準備プロセスのポイント②(データ分割)
【キーワード】2分割(ホールドアウト法)、3分割
評価プロセスのポイント①(回帰モデル評価)
【キーワード】決定係数 (R^2)、平均二乗誤差(MSE)、平均絶対誤差(MAE)
評価プロセスのポイント②(分類モデル評価)
【キーワード】正解率(Accuracy)、適合率(Precision)、再現率(Recall)、F1値(F1-score)、混同行列(Confusion Matrix)
改善プロセスのポイント①(標準化)
改善プロセスのポイント②(多重共線性)
【キーワード】相関係数(Correlation Coefficient)、VIF(Variable Inflation Factor)、手動削除、Lasso回帰、PCA(主成分分析)、PLS(偏最小二乗法)、Ridge回帰、データセット変更
改善プロセスのポイント③(過学習)
【キーワード】検証用データの導入(k-分割交差検証含む)、ハイパーパラメータ調整による、モデル複雑さ調整、計算手順(アルゴリズム)変更
機械学習ハンズオン実践編①(教師あり学習(回帰))
目的定義
事前準備(データ収集)
事前準備(データ整形)
事前準備(データ分割)
学習
評価
改善①(標準化)
改善②(計算手順変更(偏最小二乗法(PLS)))
機械学習ハンズオン実践編②(教師あり学習(分類))
目的定義
事前準備(データ収集)
事前準備(データ整形)
事前準備(データ分割)
学習
評価
改善①(ハイパーパラメータ調整(グリッドサーチ))
改善②(計算手順変更(サポートベクターマシン(SVM)))
ボーナスレクチャー
ボーナスレクチャー