みんなの強化学習講座 -PythonとGoogle Colaboratoryで基礎から少しずつ学ぶ強化学習の原理と実装-
What you'll learn
- 強化学習の原理について、基礎的な知識を学びます。
- Pythonで書かれた強化学習のコードが読めるようになります。
- 自分の力で、強化学習のコードを実装する力が身に付きます。
- PyTorch、OpenAI Gym、Stable Baselinesなどのライブラリを使用して、深層強化学習を実装できるようになります。
- 強化学習全般についての知識が身につきます。
- 最新の研究事例を学びます。
Requirements
- Pythonの基礎を学ぶためのテキストがダウンロード可能ですが、動画によるPythonの解説はありません。
- 何らかのプログラミング経験があった方が望ましいです。
- Google Colaboratoryを使用するため、ローカル環境はWindowsでもMacでも大丈夫です。
- Google Colaboratoryを使用するためにGoogleアカウントが必要になります。
- 中学レベルの数学で十分です。高度な数学は必要ありません。
- ディープラーニング(深層学習)の解説は必要最低限となります。
Description
みんなの強化学習講座は、「強化学習」について学び、親しむためのコースです。
強化学習では、「環境において最も報酬が得られやすい行動」を「エージェント」が学習し、自発的に様々な行動パターンを獲得します。
本コースは、この強化学習の原理およびコードによる実装を基礎から丁寧に解説します。
様々な場面で応用されつつある強化学習を身に付け、活用できるようになりましょう。
注: 本コースに先立ちYouTubeでのライブ講義【Live人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。
コースの内容は以下の通りです。
Section1. 強化学習の概要
→ 強化学習の全体像を把握し、開発環境であるGoogle Colaboratoryの使い方を学びます。
Section2. シンプルな強化学習
→ 最小限のPythonのコードで、強化学習の一種Q学習を実装します。
Section3. 強化学習の原理
→ 強化学習の理論、動作原理を学びます。
Section4. 深層強化学習
→ ディープラーニング(深層学習)と強化学習を組み合わせた深層強化学習について学びます。
Section5. 強化学習の応用
→ OpenAI Gymを利用して、月面着陸船の制御にトライします。また、強化学習の先端研究の紹介も行います。
なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックがダウンロード可能です。
本コースはディープラーニング用フレームワークとしてPyTorchを、強化学習の環境としてOpenAI Gymを使用します。
また、Pythonの開発環境にはGoogle Colaboratoryを使用します。
Who this course is for:
- 強化学習に興味があるけど、最初のとっかかりが分からない方。
- 強化学習の難解な数式に辟易した方。
- 強化学習のコードがPythonで書けるようになりたい方。
- 強化学習を使って、何らかの問題を解決したい方。
- 強化学習全般の知識が欲しい方。
- 強化学習関連のライブラリが使いこなせるようになりたい方。
- 仕事上、強化学習の知識が必要になった方。
Instructor
「ヒトとAIの共生」がミッションの会社、SAI-Lab株式会社の代表取締役。
AIの教育/研究/アート。
東北大学大学院理学研究科、物理学専攻修了。博士(理学)。
法政大学デザイン工学部兼任講師。
オンライン教育プラットフォームUdemyで、十数万人にAIを教える人気講師。
複数の有名企業でAI技術を指導。
「AGI福岡」「自由研究室 AIRS-Lab」を主宰。
著書に、「はじめてのディープラーニング」「はじめてのディープラーニング2」(SBクリエイティブ)、「Pythonで動かして学ぶ!あたらしい数学の教科書」「あたらしい脳科学と人工知能の教科書」「Google Colaboratoryで学ぶ! あたらしい人工知能技術の教科書」「PyTorchで作る!深層学習モデル・AI アプリ開発入門」「BERT実践入門」「生成AIプロンプトエンジニアリング入門」(翔泳社)。共著に「No.1スクール講師陣による 世界一受けたいiPhoneアプリ開発の授業」(技術評論社)。