What you'll learn
- 統計モデリングの基礎
- 確率プログラミングの基礎
- 一般化線形モデル / 一般化線形混合モデル
- マルコフ連鎖モンテカルロ法
Requirements
- Python によるデータサイエンスの基礎
- 確率・統計の基礎知識
- 期待値・事前分布・事後分布・尤度などの用語が理解できること
Description
Python のパッケージである PyMC3 を使って統計モデリングと確率プログラミングの基礎を学びます。最初は、分布へのあてはめといった簡単な例題からスタートして、最終的には一般化線形モデル(GLM)や一般化線形混合モデル(GLMM)といったモデルの概要を理解できるようになることを目指します。
PyMC3 は、わかりやすいインターフェースを持っていることが特徴の確率プログラミングのパッケージであり、非常にシンプルな記法でさまざまなモデルを表現できるようになっています。本コースでは、この PyMC3 を使って、より短期間かつ少ない学習コストで統計モデリングの全体像を理解することを狙っています。
なお、本講座で使用している PyMC3 のバージョンは 3.11.2 です。
【注意点】
本講座ではできるだけ理論的な側面と実装的な側面の両方の説明をするようにしていますが、理論的な側面を理解するには確率分布等に関する予備知識が必要となります。必要な予備知識に関しては、動画の始めの方でご紹介していますので、予めご確認下さい。
また、本講座の中で紹介している例題は、既に公開済みの講座である「NumPyro で学ぶベイズ統計モデリング【基礎編】」とほぼ同じ例題ですが、利用している確率プログラミングのパッケージが異なります。
なお、こちらの講座は基本的には「実装」あるいは「コード」の側にウェイトを置いた内容になっています。概念的な部分の説明もさせて頂いていますが、こうした部分は基本的にはオマケ的なものと考えて下さい(私自身は統計の専門家ではありませんので、多少力不足の部分があるかと思います)。大雑把な話ではなく、本格的な統計分析を勉強されたい方はこちらの講座ではなく、しっかりした統計学の教科書にあたってみることをお勧めします。
また、こちらの講座のタイトルは「統計モデリング」となっていますが、本講座でさせて頂くお話はほぼ全て「ベイズ」の文脈でお話させて頂く内容になっております。従いまして、講座の内容も「ベイズ統計モデリング」を扱ったものになります。ご注意下さい。
Who this course is for:
- 統計モデリング・確率プログラミングに興味がある人
- GLM や GLMM について知りたい人
- ベイズ統計に興味がある人
Instructor
フリーランスのデータサイエンティスト・アルゴリズム開発者
東京工業大学 修士課程(数学科)修了。大学では位相幾何学・微分幾何学を専攻し、ゲージ理論を位相幾何学に応用したドナルドソン理論を学ぶ。
シンクタンクおよびベンチャー企業にて、無線通信分野の研究支援業務に従事し、企業の研究者と共同で第4世代携帯のためのアルゴリズムを研究・開発。通信分野における複数の特許の共同発明者。
2011年より、MathWorks にて統計解析・機械学習を中心に、プリセールスおよびコンサルンティング業務に従事。多数のイベント・講習会等において技術解説を行う。
2019年より、フリーランスのデータサイエンティスト・アルゴリズム開発者として活動中。