
レクチャー11でgit cloneするWhisper_MICが講座収録時からソースの構造が大幅に改定されています。講座を進めるために過去のバージョン(2023/1/2のコミット)に戻す必要がありますので、こちらの補講では戻す方法をご説明いたします。
git cloneした後に以下コマンドを実行することで講座収録時のバージョンに戻せます。
git checkout 91afa6b0523e59e5d396dc69c86aa3a07ccf156e
レクチャー11: Whisper_MICの動画と合わせてこちらもご確認ください。
仮想環境へ入るバッチの作成とシステム構成に従ったWebアプリのセットアップを行っていきます。
◇この講座でできるようになること
・(中級者向け)ZOOMやTeamsなどのオンライン会議レコーディングファイルもしくは音声ファイルからの
議事録自動作成(Colab)をPythonでモジュールとAPIの呼び出しのみ(非常に少ないコード)で行います。
・(中~上級者向け)Python Flaskを用いてローカル環境(インターネット接続なし)で動作する本格的な音声認識システムを
構築できます。バックエンドはOpenAIのWhisperモデルなので、認識精度はかなり高いです。
◇この講座の構成
動画ファイル or 音声ファイルのアップロード
動画ファイルからの音声ファイル作成
音声ファイルからのテキスト抽出(音声認識)
音声認識テキストからの要点抽出(自動要約)←ChatGPT(gpt3.5/gpt4.0)にプロンプト生成してもらいました。
要点抽出結果のダウンロード
Flask環境の構築
ミニマムなFlaskアプリ
Whisper_MIC
Flask画面パーツ
Stable Diffusionでfavicon
Bootstrap
Ajax
デモ
システム構成
Whisper_MICとファイル連携
仕上げ