Udemy Business

Teach on Udemy

Turn what you know into an opportunity and reach millions around the world.

Learn More

Your cart is empty.

Keep shopping

【 TensorFlow・Python3 で学ぶ】深層強化学習入門

Qラーニングや方策勾配など強化学習の基礎理論を学び、Pythonでプログラムを書いてエージェントを作成し、理解を深めましょう。

Created by井上博樹 (Hiroki Inoue)

Last updated 10/2019

Japanese

What you'll learn

強化学習の基本的な原理（Q学習や方策勾配）を理解できるようになります。
Q学習の基本原理を理解することができます
DQN（深層Q学習）の仕組みを理解することができるようになります。
OpenAI Gymのライブラリを使用してゲームをプレイする学習をさせることができます。
アルファ碁を解説している論文を解読するための基礎知識が習得できます。

Course content

8 sections • 40 lectures • 3h 22m total length

このコースの概要0:53
強化学習の枠組み4:36

このセクションの概要1:48
カートポール問題のGymを動かしてみよう4:05
倒れたら環境をリセットしよう5:16
DQNとエクスペリエンス・リプレイ3:43
TensorFlowで実装してみよう（ネットワークのクラス定義）12:11
Experienceを格納するMemoryクラスの定義5:31
パラメーター初期化とエクスペリエンスの保存3:08
エクスペリエンスメモリーを蓄積しよう4:05
トレーニングを実行しよう（1/2）7:43
トレーニングを実行しよう（2/2）5:53
matplotlibで結果を可視化しよう4:30
テスト（エージェントにゲームをプレイさせてみよう）5:11
このセクションで使用したノートブック0:06

外部リファレンスや参考図書1:08
AI・ディープラーニングのおすすめコース2:26
CUDAのインストール（TensorFlow入門より）7:22
GPU版を入れるためのCUDA 8.0のインストール手順です。
cuDNNのインストール（TensorFlow入門より）9:35
cuDNN 5.0の導入手順です。6.0対応版も収録しますが、それまでは適宜読み替えてください。

Requirements

macOS, Windows, またはUbuntu（Linux）
インターネット接続
Python3, Anaconda Navigator, Jupyter Notebook
TensorFlow, OpenAI Gym

Description

【更新情報】

2017/11/9　カートポール問題の結果の可視化、エージェントのプレー表示をアップロードしました。これで基本的なトピックは一通りカバーしました。あとはリクエストに応じてPythonのコーディングの補足解説や、発展的なトピックの紹介を追加していきたいと思いますので、ぜひリクエストください。

2017/11/8　カートポール問題のトレーニングのレクチャーを掲載しました。

2017/11/1　カートポール問題のイントロを掲載しました。

2017/10/30 多腕バンディット問題を解くチュートリアルを掲載しました。

2017/10/29　方策勾配のセクションのイントロをアップロードしました。

【コース概要】

この講座は、AlphaGo Zeroの活躍などで大注目されている強化学習についての基礎知識を、プログラムを作成しながら学ぶコースです。

強化学習を使うと、画像を入力として与えるだけでゲームや囲碁、将棋などの対戦を機械が自分で繰り返し、最適な方策を学んで、人間よりも高いスコアを出す学習ができることが知られています。

（主なトピック）

このコースでは、こうした強化学習を理解するための

・マルコフ決定過程

・ベルマン方程式

・Q学習（Q-テーブルとQ-ネットワーク）

・方策勾配（ポリシーグラディエント）

・DQN（深層Qネットワーク学習）

などの基礎的な概念を理論解説と、Pythonでコードを書く演習を通して学びます。

（プログラミング題材）

題材としては、非営利のAI研究機関OpenAIが公開しているOpen AI Gymから

１．フローズンレイク問題（凍った湖の上を穴に落ちずにゴールする）

（１）Qテーブル法でQ値を求める

（２）Qネットワーク法（ニューラルネットワーク）で解く

２．多腕バンディット問題（マルチアームのスロットマシーン）

３．カートポール問題（倒立振り子）

　　DQN（Deep-Q学習、ディープラーニング、多層ニューラルネットワーク）で解く

　　ポール（棒）が倒れないようにカート（台車）を操作する問題

などのパッケージを入手して、強化学習を実践します。

ぜひこの機会に強化学習の考え方や基礎知識を身につけ、ビジネスや開発に活かしましょう。

【受講上の注意】

このコースはビデオでの学習をしたくない方には向いていませんので、ご注意ください。

Who this course is for:

強化学習の基本的な仕組みを学びたい方
画像分類やRNNなど機械学習を学んできたが、強化学習にチャレンジしたい方
自力でコードを書くのが嫌でない方
ビデオを視聴するのが苦痛でない方

【 TensorFlow・Python3 で学ぶ】深層強化学習入門

What you'll learn

Explore related topics

Course content

イントロと環境構築2 lectures • 5min

環境構築（Windows）3 lectures • 18min

環境構築（macOS）2 lectures • 10min

Qテーブルによる学習5 lectures • 28min

Qネットワーク学習6 lectures • 33min

多腕バンディット問題（方策勾配）5 lectures • 25min

カートポール問題（方策勾配法 その２）13 lectures • 1hr 3min

ボーナスセクション4 lectures • 21min

Requirements

Description

Who this course is for: