
本コースの教材の使用方法です。
本コースのイントロダクションです。
本コースの概要を解説します。
強化学習について、概要を解説します。
強化学習を動画でデモします。
強化学習の社会における活用例をいくつか紹介します。
開発環境であるGoogle Colaboratoryの使い方を解説します。
このセクションの教材を紹介します。
このセクションの概要です。
本セクションで行う実装の概要を解説します。
Google Colaborayoryを使用し、シンプルな強化学習を実装します。
Google Colaborayoryを使用し、シンプルな強化学習を実装します。
Google Colaborayoryを使用し、シンプルな強化学習を実装します。
強化学習を簡単に実装できるツール、OpenAI Gymを紹介します。
このセクションの教材を紹介します。
このセクションの概要です。
強化学習において頻繁に使用する、数学の表記法について学びます。
強化学習において最適化すべき「価値」を定義します。
学習に価値関数を用いる、TD学習(Temporal-Difference Learning) について学びます。
このセクションの演習です。Q学習のコードをベースにSARSAを実装します。
このセクションの教材を紹介します。
このセクションの概要です。
深層学習について、概要を解説します。
深層強化学習の概要を解説します。
使用するフレームワーク、PyTorchの基礎を解説します。
使用するフレームワーク、PyTorchの基礎を解説します。
PyTorchを使い、深層強化学習を実装します。
本セクションの演習です。
このセクションの教材を紹介します。
このセクションの概要です。
深層強化学習による月面着陸船の制御について、概要を解説します。
深層強化学習による月面着陸船の制御について、実装を解説します。
深層強化学習による月面着陸船の制御について、実装を解説します。
強化学習の先端的研究をいくつか紹介します。
本講座の最後に、受講生の皆さんへ向けてメッセージを送ります。
講師の活動や最新情報についてご紹介します。
みんなの強化学習講座は、「強化学習」について学び、親しむためのコースです。
強化学習では、「環境において最も報酬が得られやすい行動」を「エージェント」が学習し、自発的に様々な行動パターンを獲得します。
本コースは、この強化学習の原理およびコードによる実装を基礎から丁寧に解説します。
様々な場面で応用されつつある強化学習を身に付け、活用できるようになりましょう。
注: 本コースに先立ちYouTubeでのライブ講義【Live人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。
コースの内容は以下の通りです。
Section1. 強化学習の概要
→ 強化学習の全体像を把握し、開発環境であるGoogle Colaboratoryの使い方を学びます。
Section2. シンプルな強化学習
→ 最小限のPythonのコードで、強化学習の一種Q学習を実装します。
Section3. 強化学習の原理
→ 強化学習の理論、動作原理を学びます。
Section4. 深層強化学習
→ ディープラーニング(深層学習)と強化学習を組み合わせた深層強化学習について学びます。
Section5. 強化学習の応用
→ OpenAI Gymを利用して、月面着陸船の制御にトライします。また、強化学習の先端研究の紹介も行います。
なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックがダウンロード可能です。
本コースはディープラーニング用フレームワークとしてPyTorchを、強化学習の環境としてOpenAI Gymを使用します。
また、Pythonの開発環境にはGoogle Colaboratoryを使用します。