Udemy
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
Turn what you know into an opportunity and reach millions around the world.
Learn More
Your cart is empty.
Keep shopping
AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用をやめて自分の経験に頼るようになったか
Rating: 4.1 out of 5(18 ratings)
162 students

AlphaZeroの意外な構造 またはAlphaGoは如何にして棋譜データの利用をやめて自分の経験に頼るようになったか

AlphaGoから進化したAlphaZeroの強化学習アルゴリズム:人の知識なしでゼロから学習に成功した強化学習モデル のゲームAI「AlphaZero」の学習モデルとモンテカルロ木探索を数式とイラストで解説していきます。将棋AIとしても.
Created by内山 充康
Last updated 3/2026
Japanese

What you'll learn

  • AlphaGo ZeroとAlphaZero の仕組みを強化学習を通して説明できるようになります。
  • AlphaZeroに至るまでの歴史的経緯をたどることができます。
  • AlphaZeroを通して、ニューラルネットワークやディープラーニングの概要を理解します。
  • Pythonコードに触れることができます。(初心者向け)

Coding Exercises

This course includes our updated coding exercises so you can practice your skills as you learn.

See a demo
Image of coding exercise example

Course content

9 sections109 lectures4h 56m total length
  • このコースについて1:27

    このコースについてのお知らせです。コースの目的について解説しています。

  • コース概要3:00

    コース概要です。各セクションの内容を解説しています。みんさんの興味に合ったセクションから始めるのもいいでしょう

  • 受講対象者2:17

    どのような受講生が対象であるか、解説しています。不安な方は、コース購入前にみてください。

  • このコースの進め方1:19

    レクチャーの進め方について解説しています。万人向けに、分かりやすく作っているコースですが、少し専門的になったり、冗長に感じたりする部分があるかもしれません。どのように進めていったらよいのか解説しています。

Requirements

  • Goolgeドライブを使うため、Goolge アカウントが必要です。Gmailが使える方なら大丈夫です。
  • 何より大前提として、世界最強となったゲームAI「AlphaZero」 がどのような仕組みなのか具体的に知りたいという好奇心が必要です。

Description

AlphaGoは大量のプロの棋譜データを集めて教師あり学習をさせていましたが、その後発表されたAlphaGoZeroは、プロの棋譜データなしで、まるで赤ちゃんのような状態から学習を始めてAlphaGoに勝つようになりました。さらに、AlphaGoZeroをより汎用的に改良したAlphaZero は大変シンプルな構造となっていて、強化学習初心者でも学びやすくなっています。モンテカルロ木探索 (Monte Carlo Tree Search) と、マルチヘッドのディープニューラルネットワークを中心に学んでいきます。

AlphaZeroは、Googleの巨大なネットワークの中で学習されたゲームAIですので、1台のマシンでは学習できませんが、論文に基づくコードを動かしながら、人の知識なしでゼロから学習を始めるAlphaZeroの構造を、強化学習の観点から、豊富な図とPythonプログラミングで楽しく学んでいきましょう。

前半には、チェス・マシン Deep Blue についての解説もあります。

Who this course is for:

  • 人工知能(AI)に興味をもつ方
  • ゲームAIの仕組みに興味のある方
  • AlphaZeroの仕組みを詳しく理解したい方
  • ディープラーニングを一通り受講された方、またはこれからディープラーニングを始めたい方