Udemy Business

Teach on Udemy

Turn what you know into an opportunity and reach millions around the world.

Learn More

Your cart is empty.

Keep shopping

みんなの強化学習講座 -PythonとGoogle Colaboratoryで基礎から少しずつ学ぶ強化学習の原理と実装-

Name: みんなの強化学習講座 -PythonとGoogle Colaboratoryで基礎から少しずつ学ぶ強化学習の原理と実装-
Rating: 4.2 (511 reviews)

その高い性能により世界中で注目を集めている人工知能（AI）、強化学習および深層強化学習について学ぶコースです。強化学習の概要、原理、コードによる実装をシームレスに学びましょう。最終的に、深層強化学習を使った月面着陸船の制御まで行います。

Created by我妻幸長 Yukinaga Azuma

Last updated 4/2026

Japanese

What you'll learn

強化学習の原理について、基礎的な知識を学びます。
Pythonで書かれた強化学習のコードが読めるようになります。
自分の力で、強化学習のコードを実装する力が身に付きます。
PyTorch、OpenAI Gym、Stable Baselinesなどのライブラリを使用して、深層強化学習を実装できるようになります。
強化学習全般についての知識が身につきます。
最新の研究事例を学びます。

Course content

6 sections • 36 lectures • 4h 21m total length

教材の使用方法2:28
本コースの教材の使用方法です。
イントロダクション7:29
本コースのイントロダクションです。
コースの概要2:00
本コースの概要を解説します。
強化学習の概要14:21
強化学習について、概要を解説します。
強化学習のデモ6:50
強化学習を動画でデモします。
強化学習の活用例9:51
強化学習の社会における活用例をいくつか紹介します。
Google Colaboratoryの使い方13:16
開発環境であるGoogle Colaboratoryの使い方を解説します。

セクション2の教材0:11
このセクションの教材を紹介します。
Section2の概要2:35
このセクションの概要です。
実装の概要9:13
本セクションで行う実装の概要を解説します。
シンプルな強化学習の実装 Part113:45
Google Colaborayoryを使用し、シンプルな強化学習を実装します。
シンプルな強化学習の実装 Part210:27
Google Colaborayoryを使用し、シンプルな強化学習を実装します。
シンプルな強化学習の実装 Part35:08
Google Colaborayoryを使用し、シンプルな強化学習を実装します。
OpenAI Gymの紹介6:44
強化学習を簡単に実装できるツール、OpenAI Gymを紹介します。

セクション3の教材0:11
このセクションの教材を紹介します。
Section3の概要2:26
このセクションの概要です。
数学の表記について4:34
強化学習において頻繁に使用する、数学の表記法について学びます。
「価値」の定義11:58
強化学習において最適化すべき「価値」を定義します。
TD学習8:16
学習に価値関数を用いる、TD学習（Temporal-Difference Learning） について学びます。
演習12:48
このセクションの演習です。Q学習のコードをベースにSARSAを実装します。

セクション4の教材0:11
このセクションの教材を紹介します。
Section4の概要6:38
このセクションの概要です。
ディープラーニングの概要8:07
深層学習について、概要を解説します。
深層強化学習の概要5:55
深層強化学習の概要を解説します。
PyTorchの基礎 PART111:33
使用するフレームワーク、PyTorchの基礎を解説します。
PyTorchの基礎 PART28:13
使用するフレームワーク、PyTorchの基礎を解説します。
深層強化学習の実装16:10
PyTorchを使い、深層強化学習を実装します。
演習7:00
本セクションの演習です。

セクション5の教材0:11
このセクションの教材を紹介します。
Section5の概要5:01
このセクションの概要です。
月面着陸船の制御 -概要-10:25
深層強化学習による月面着陸船の制御について、概要を解説します。
月面着陸船の制御 -実装- PART115:19
深層強化学習による月面着陸船の制御について、実装を解説します。
月面着陸船の制御 -実装- PART210:25
深層強化学習による月面着陸船の制御について、実装を解説します。
強化学習の先端研究8:48
強化学習の先端的研究をいくつか紹介します。
最後に2:07
本講座の最後に、受講生の皆さんへ向けてメッセージを送ります。

Requirements

Pythonの基礎を学ぶためのテキストがダウンロード可能ですが、動画によるPythonの解説はありません。
何らかのプログラミング経験があった方が望ましいです。
Google Colaboratoryを使用するため、ローカル環境はWindowsでもMacでも大丈夫です。
Google Colaboratoryを使用するためにGoogleアカウントが必要になります。
中学レベルの数学で十分です。高度な数学は必要ありません。
ディープラーニング（深層学習）の解説は必要最低限となります。

Description

みんなの強化学習講座は、「強化学習」について学び、親しむためのコースです。

強化学習では、「環境において最も報酬が得られやすい行動」を「エージェント」が学習し、自発的に様々な行動パターンを獲得します。

本コースは、この強化学習の原理およびコードによる実装を基礎から丁寧に解説します。

様々な場面で応用されつつある強化学習を身に付け、活用できるようになりましょう。

注: 本コースに先立ちYouTubeでのライブ講義【Live人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。

コースの内容は以下の通りです。

Section1. 強化学習の概要

→ 強化学習の全体像を把握し、開発環境であるGoogle Colaboratoryの使い方を学びます。

Section2. シンプルな強化学習

→ 最小限のPythonのコードで、強化学習の一種Q学習を実装します。

Section3. 強化学習の原理

→ 強化学習の理論、動作原理を学びます。

Section4. 深層強化学習

→ ディープラーニング（深層学習）と強化学習を組み合わせた深層強化学習について学びます。

Section5. 強化学習の応用

→ OpenAI Gymを利用して、月面着陸船の制御にトライします。また、強化学習の先端研究の紹介も行います。

なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックがダウンロード可能です。

本コースはディープラーニング用フレームワークとしてPyTorchを、強化学習の環境としてOpenAI Gymを使用します。

また、Pythonの開発環境にはGoogle Colaboratoryを使用します。

Who this course is for:

強化学習に興味があるけど、最初のとっかかりが分からない方。
強化学習の難解な数式に辟易した方。
強化学習のコードがPythonで書けるようになりたい方。
強化学習を使って、何らかの問題を解決したい方。
強化学習全般の知識が欲しい方。
強化学習関連のライブラリが使いこなせるようになりたい方。
仕事上、強化学習の知識が必要になった方。

みんなの強化学習講座 -PythonとGoogle Colaboratoryで基礎から少しずつ学ぶ強化学習の原理と実装-

What you'll learn

Explore related topics

Course content

強化学習の概要7 lectures • 56min

シンプルな強化学習7 lectures • 48min

強化学習の原理6 lectures • 40min

深層強化学習8 lectures • 1hr 4min

強化学習の応用7 lectures • 52min

ボーナスレクチャー1 lecture • 1min

Requirements

Description

Who this course is for: