Windows10で学ぶAI画像認識(Mask RCNNモデル)
What you'll learn
- AI画像認識モデルとはどういうものか?MaskRCNNモデルを題材に学習します。
- 仮想環境の構築方法、Windows10で一から構築していきます。
- MaskRCNNモデルの理論
- ディープラーニングのモデルと実際のプログラムの関係
Requirements
- AIや画像認識に関心がある人
Description
■Windows10で、AI画像認識について学んでいきます。
Mask RCNNモデルを題材にしています。
(マスク アールシーエヌエヌ モデル)
■(1)(2)章で、まずは、AIの画像認識とはどういうものなのかを説明していきます。
(2)章の説明では、そもそも動画のプログラムとはどんなものなのか?画像は何でできているのか?画像のピクセル値を、実際に出力してみています。
ディープラーニングは、畳み込み演算をはじめとして、内部的にいろいろな処理があるのですが、私自身、自分の目で画像の中のピクセル値を見てみたことで、ディープラーニングのニューラルネットワークの層がそれぞれ何をやっているのか、あっそういうことか!?と非常に手に取るようにイメージできるようになりました。ですから、みなさんにも是非と、画像のピクセル値を実際に見てみることをお勧めしています。
(2)章で詳しく説明しています。
■(3)章から、画像認識のMask RCNNモデルを、実際に動かしていきます。仮想環境の構築から始めていきます。
(3)章が写真(静止画)で、(4)章が動画で動かしてみるという内容になっています。
(3)章は、特に丁寧に解説していますので、手順通りやれば動かせると思います。是非、トライしてみてください。
この部分は、Pythonプログラムをダウンロードして動かすという内容なので、Pythonプログラムを書けなくても大丈夫です。
実際の画面の映像をお見せしながら説明していきますので、本やWebサイトだけの情報より、わかりやすいと思います。
できるだけ多くの方に実行していただけるようOS・言語・フレームワーク等は、なるべくメジャーなもの・普及しているものを選びんでいます。(Python、Windows10、Tensorflow、Jupyter、Anaconda)
■画像認識のMask RCNNは、面白いモデルだと思います。
みなさんにも、是非、この面白さが伝わるとうれしいです。
■(4)章で、動画ベースでも処理できるようにしていきます。
GPU搭載のWidowsPCでの実行やWebカメラ・スマホカメラの使い方についても、できるかぎり丁寧に解説しています。
■(5)章は、より理論を深く知りたいという方のために、Mask RCNNモデルの中身や、モデルの理論とプログラムの関係についても解説しています。
理論は図や写真をもとに、数式を使わずに説明していますので、とっかかりとしてイメージをつかめるように工夫して説明しています。
Mask RCNNモデルの全体像が一目でわかるような「全体図」も作成しています。
巨大なモデルの仕組みを要約するのは、私自身、大変でしたが、わかりやすい「全体図」になっていると思いますので、是非、見てみてください
内容が深くなってきますと、日本語での解説も少なくなってきますので、是非、この講座も参考にしていただけたらと思います。
■(5)章では、また、Mask RCNNの理論が、どのようにプログラミングと対応しているのか、導入部分ですが解説をしています。
もしかしたらMask RCNNモデルのプログラムを解読するような強者もでてくるかもしれないと思って、GitHubにMask RCNNモデルの「中身の」プログラムをわかりやすい形にしたジュピターノートブックも載せていますので、力が余ってる人は、Mask RCNNモデルの「中身の」プログラムも見てみてください。
この講座を検索するためのキーワード
深層学習 ディープラーニング 画像認識 人工知能 コンピュータビジョン anaconda tensorflow keras python jupyter opencv windows windows10 AI
Who this course is for:
- AIに関心がある人
- AIエンジニアになりたい人
Instructor
株式会社JDSC
データサイエンティスト 伊藤 泰輔
東京大学(1998年卒)
Google TensorFlowデベロッパー認定資格取得(2021/10/17取得)
AIを担当しています。ディープラーニングでAIモデルの研究開発をしています。AIと名がつけば、画像認識、物体検出、画像生成(GAN)、自然言語処理・時系列データ分析、深層強化学習など広く扱います。プログラミング言語はPython、ディープラーニングのフレームワークはTensorflowが中心です。
画像認識をスクラッチに近い感じで作ってみたことや、モーションキャプチャーのAIプログラムもマルチモーダルで作ってみたことがあります。ウェーブレット解析などの信号波形の時系列データ分析もやっていました。
一時は深層強化学習にもこっていたのですが、最近は、物体検出をやっていたり、医療系のデータでモデル開発してたりします。
Python3 エンジニア認定データ分析試験合格
VBAもできます。(VBA Professional Office 2003)