Anacondaのインストール5:18
JupyterNotebookを含むPythonのディストリビューションの一つであるAnacondaの取得とインストールについて説明します。
JupyterNotebookの使い方①6:40
JupyterNotebookの起動から基本的な操作の仕方まで説明します。
JupyterNotebookの使い方①（実践）5:18
実際にAnacondaNavigatorからJupyterNotebookを起動する方法を実践します。
JupyterNotebookの使い方②5:17
JupyterNotebookのノートを編集する方法について説明します。
JupyterNotebookの使い方②（実践）6:19
実際にノートブックを編集してみます
JupyterNotebookの使い方③4:06
セーブポイントの設定、ノートブックの閉じ方、あらかじめ作られたノートブックの開き方などの操作について説明します。
JupyterNotebookの使い方③（実践）4:39
実際にノートのファイル操作などをしてみます。
JupyterNotebookの使い方④7:57
JupyterNotebookでMarkdownの使い方について説明します。
MarkdownはJupyterNotebookにドキュメントを追加する際に重要です。
JupyterNotebookの使い方④（実践）6:38
実際にMarkdownの簡単な編集を行ってみます。
学習環境の構築7:29
学習環境の構築方法について説明します。
機械学習の学習専用の仮想環境を作り、そこでJupyterNotebookを利用できるようにします。
ファイルの構成5:09
学習用のデータのダウンロードと内容の説明です。
data.zipをダウンロードして適切な場所にファイルを配置してください。

配列の扱い方7:11
scikit-learnで機械学習を学ぶにあたり必要なライブラリであるnumpyの使い方についての学習の第一弾です。
最初に配列の扱い方の基本を学びます。
1-1_numpy.ipynbを開いて学習を開始してください。
配列の変形3:48
numpyを利用して１次元から２次元、２次元から１次元の配列の変換をする方法について紹介します。
データの取得と変換5:39
numpyの配列の成分のデータ型の取得と、データ型の変換を行う方法について説明します。
インデックスとスライス9:43
numpyでのインデックスとスライスについて説明します。
numpyはPythonのリストやタプルなどと同様にインデックス・スライスを使うことが出来ます。
データ設定3:38
numpyの配列にデータを設定する様々な方法について学習します。
乱数6:05
numpyには乱数を発生させるための関数がいくつか存在します。
その中の代表的なものの使い方について学習します。
データの生成8:53
全ての値が0、などといった特定のルールを持つ配列を生成する方法について説明します。
配列の結合5:09
１次元及び２次元の配列を結合し、新しい配列を得る方法について説明します。
配列の分割・転置6:45
2次元配列を分割する方法と、配列の転置を得る方法について説明します。
演算処理①5:37
numpyの演算のうちユニバーサルファンクション・ブロードキャストについて説明します。
演算処理②9:20
numpyの配列に関する演算のうち論理演算に関連するものを説明します。
問題3:02
numpyの内容を復習するための問題を解いてみましょう。
問題（解答）6:10
問題の解答と解説を行います。

matplotlibの概要5:57
matplotlibの概要について説明します。
1-2_matplotlib.ipynbを開いて学習を開始してください。
折れ線グラフ11:32
matplotlibを用いて折れ線グラフを描画する方法の基本について説明します。
棒グラフ・ヒストグラム4:31
matplotlibを用いて棒グラフとヒストグラムを描画する方法を説明します。
散布図5:54
matplotlibを用いて散布図を描画する方法を説明します。
機械学習では最もよく使う図です。
等高線6:24
matplotlibで等高線を描画する方法を説明します。
複数のグラフの描画①6:55
描画オブジェクトを利用して複数のグラフを描画する方法について説明します。
描画オブジェクト6:19
描画オブジェクトの概念と使い方について説明します。
複数のグラフの描画②5:38
複数のグラフの描画の第２弾です。
３次元のグラフ9:58
描画オブジェクトを用いて３次元のグラフを描画する方法を説明します。
その他4:35
その他の内容についての解説です。
問題3:31
matplotlibの内容を復習するための問題を解いてみましょう。
問題（解答）9:22
問題の解答と解説を行います。

pandasの基本・データの生成6:15
pandasの基本とデータの生成法について説明します。
1-3_pandas.ipynbを開いて学習を開始してください。
データの生成と切り取り①9:11
DataFrameの一部をhead()やtail()などで取得する方法について説明します。
データの生成と切り取り②4:17
DataFrameのデータを行単位・列単位で取得する方法について説明します。
データの生成と切り取り③7:30
DataFrameの特定の行・列の範囲を切り取る方法について説明します。
また、列・行の追加方法についても説明します。
データの追加・削除5:17
DataFrameに行や列を新たに追加する方法や、既存の行や列を削除する方法について説明します。
データの分析①5:00
pandasでCSVデータを読み取ってデータ分析を行う方法を説明します。
データの分析②8:07
読み出したCSVデータをもとに、実際に簡単なデータ分析を行ってみます。
問題4:53
pandasの復習問題を解いてみます。
問題（解答）12:55
復習問題の解答です。

基本統計量の概念7:22
基本統計量の概念について説明します。
1-4_statics_basic.ipynbを開いて学習を開始してください。
numpyによる基本統計量の算出6:53
numpyを用いて様々な基本統計量を求める方法について説明します。
pandasによる基本統計量の計算①5:55
pandasのdescribeメソッドを用いて基本統計量を計算する方法を説明します。
pandasによる基本統計量の計算②6:47
pandasを用いて個別の基本統計量を求める方法と、pandsのデータをヒストグラムとして表示する方法を説明します。
正規分布と標準偏差6:56
基本統計量の概念と、それをnumpy、pandasで実装する方法について学習します。
問題2:15
基本統計量に関する練習問題の説明です。
問題（解答）6:58
基本統計量に関する問題の解答です。

単回帰分析の概要3:58
回帰分析の概要について説明します。
ロードしたデータの概要4:55
機械学習の最初のアルゴリズムとして単回帰分析による回帰分析を行ってみます。
手始めに、scikit-learnのモジュールを利用して米国ボストン市郊外における地域別の住宅価格のデータセットを読み出します。
さらにボストンデータの概要について説明します。
目的変数と各説明変数の内容について詳しく説明します。
2-1_linear_regression1.ipynbを開いて学習を開始してください。
共分散と相関係数9:13
各パラメータ間の相関関係を表す共分散と相関係数について説明します。
説明変数と目的変数の相関関係5:35
pandasの機能を用いて実際にパラメータの相関係数を計算すると共に、目的変数との相関関係が深い説明変数を、実際に目的変数と共に散布図で描画し、視覚的に相関関係を確認します。
分析の実行10:00
回帰分析を実行します。
実行して得られたグラフを散布図と重ねてみて視覚的に確認してみます。
残差プロット4:14
得られた予測結果を視覚的に評価する方法として残差プロットを消化しいます。
平均二乗誤差4:53
MSE（平均二乗誤差）を用いて線形回帰を評価する方法を紹介します。
決定係数4:15
決定係数（R2スコア）を用いて線形回帰を評価する方法を紹介します。
問題4:21
線形回帰（単回帰）に関する問題です。
問題（解答）11:30
単回帰分析の問題の解答です。
【参考】回帰分析に関しての補足7:52
回帰分析に関する補足事項を説明します。

重回帰分析とは・データの準備6:56
重回帰分析とは何かについて説明し、ボストンのデータで重回帰分析を行う準備を行います。
手始めに、scikit-learnのモジュールを利用して米国ボストン市郊外における地域別の住宅価格のデータセットを読み出します。
2-2_linear_regression2.ipynbを開いて学習を開始してください。
データの標準化9:34
重回帰分析を行う前にデータの標準化を行います。これにより計算誤差を最小化し、より正確な予測を行います。
回帰分析の実行7:50
実際に回帰分析を行ってみます。
単回帰分析の場合と同様に、残差プロット、MSE、R2スコアの計算を行います。
汎化性能と過学習4:47
汎化性能と過学習の概念について説明します。
問題3:44
重回帰分析の問題を解いてみます。
問題（解答）12:39
重回帰分析の問題の解答と解説です。

ロジスティック回帰の方程式4:18
分類問題を解くもっとく簡単なモデルであるロジスティック回帰の方程式について説明します。
2-3_logistic_regression.ipynbを開いて学習を開始してください。
ダミーデータの生成7:37
分類問題の学習をするためにダミーデータを生成する方法について説明します。
学習と結果の確認8:52
ロジスティック回帰による学習と評価を視覚的に行います。
混同行列6:52
分類問題を評価するための指標である混同行列（こんどうぎょうれつ）とscikit-learnでそれを求める方法について説明します。
様々な評価方法4:01
分類結果を評価するための指標である正解率（accuracy）、適合率（precision）、再現率（recall）、F1スコア（F1-score）とそれを求める関数について説明します。
乳癌のデータ4:04
続いて実際のデータを用いてロジスティック回帰を用いた分類を行ってみます。
手始めに使用する乳癌のデータを読み出します。
乳癌データの分類7:07
読み込んだ乳癌のデータを実際に分類し評価してみます。
説明変数の標準化5:59
説明変数を標準化し、さらに精度の高い分類を行います。
交差検証法8:10
最後に交差検証法（こうさけんしょうほう）を紹介します。
少ないデータで汎化性能の高い分類を行います。
問題3:07
ロジスティック回帰の問題にチャレンジしましょう。
問題（解答）8:57
ロジスティック回帰の問題の解答と解説です。

SVMとは何か8:33
SVMについて説明します。
SVMは回帰・分類両方に使用できますが、ここでは分類で用いる場合について説明します。
ここでは分類のケースについて学習します。
2-4_SVM.ipynbを開いて学習を開始してください。
ライブラリの読み込み4:21
ライブラリを読み込みダミーデータを用意します。
SVMによる学習と評価5:55
SVMを使ってダミーデータでの学習と評価を行います。
SVCによる予測（RBFカーネル）5:04
RBFカーネルを用いたSVCによる予測について学習します。
実際のデータを用いた実例（乳癌のデータ）4:30
実際のデータを用いた実例（乳癌のデータ）について解説します。
説明変数の標準化3:07
説明変数の標準化をしてみます。
グリッドサーチ5:58
グリッドサーチを用いて予測精度を上げてみます。
問題5:51
SVMに関する問題です。
問題（解答）13:17
問題の解答です。

Requirements

基本的なプログラミング能力およびコンピュータに関する知識
python言語でのプログラミング能力
中学3年から高校２年生程度の数学の能力と用語の知識

Description

近頃話題の人工知能（じんこうちのう）や機械学習（きかいがくしゅう）、データサイエンスといった内容について興味があり、

仕事や学習に活かしたい、そう考えている学生や社会人のためのやさしい入門講座です。

機械学習の専門書を開いてみると難しい専門用語や数式が羅列されて、

難しくて挫折した経験をお持ちの方も少なくないのではないでしょうか。

この講座では、パソコンを操作できる知識をお持ちであり、かつPythonの基本的な知識をお持ちの方を対象とし、

人工知能や深層学習のプログラミングは、高校１〜2年生程度のレベルの数学知識があれば十分です。

また、扱う数学のトピックもなるべく最小限にし、図やグラフなど、機械学習のアルゴリズムを直感的に理解しやすいように噛み砕いて説明しています。

学習終了後には、機械学習およびscikit-learnについての知識が身についています。

扱う内容は、プログラミングに関しては以下の通りです。

・Jupyter Notebookの使い方

・数学用ライブラリnumpyの基本

・基本統計量のプログラミング

・matplotlibによるデータの可視化

・pandasによるデータの前処理

・scikit-learnによる機械学習ライブラリの利用

なお、扱う機械学習のトピックは以下の通りです。

・k-means法

・PCAによる時限削減

・線形回帰（単回帰分析・重回帰分析）

・SVM（サポート・ベクトル・マシン）

・ランダムフォレストによる分類

といった内容です。

さらには、多くの演習問題を用意し、理解をより深くすることが可能です！

です。これらについて学習したいかた、もしくは一度学習しようとして挫折してしまった方はぜひこの講座でトライしてください！

Who this course is for:

データサイエンスに興味を持つPython技術者
AIや人工知能に興味があるプログラマー
Python言語を学習し次のステップとして機械学習を学びたい人
ビッグデータ解析を行いたいと考えている技術者
学習や研究に機械学習を活用したいと考えている大学生・大学院生

scikit-learnで学ぶ機械学習

What you'll learn

Explore related topics

Course content

紹介3 lectures • 18min

JupyterNotebook11 lectures • 1hr 5min

numpy13 lectures • 1hr 21min

matplotlib12 lectures • 1hr 21min

pandas9 lectures • 1hr 3min

基本統計量7 lectures • 43min

線形回帰①(単回帰分析)11 lectures • 1hr 11min

線形回帰②(重回帰分析)6 lectures • 46min

ロジスティック回帰11 lectures • 1hr 9min

SVM(サポート・ベクトル・マシーン)9 lectures • 57min

Requirements

Description

Who this course is for: