Rでの実践的なデータ可視化・探索的データ解析
4.0 (1 rating)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
19 students enrolled
Wishlisted Wishlist

Please confirm that you want to add Rでの実践的なデータ可視化・探索的データ解析 to your Wishlist.

Add to Wishlist

Rでの実践的なデータ可視化・探索的データ解析

教師有無の機械学習よりも汎用的なデータサイエンス
4.0 (1 rating)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
19 students enrolled
Created by 鈴木 瑞人
Last updated 7/2017
Japanese
Price: $60
30-Day Money-Back Guarantee
Includes:
  • 5.5 hours on-demand video
  • 1 Article
  • 89 Supplemental Resources
  • Full lifetime access
  • Access on mobile and TV
  • Certificate of Completion
What Will I Learn?
  • Rでの基本的なプログラミングができるようになる。
  • データの集計・可視化ができるようになる。
  • 不偏的なデータ解析の概念がわかるようになる。
  • データを解析しやすい形に整形できるようになる。
  • 欠損値の可視化と適切な処理ができるようになる。
  • 探索的データ解析ができるようになる。
View Curriculum
Requirements
  • 高校卒業レベルの数学力(数ⅠⅡABC)
  • 英検2級~準2級程度の英語力
  • 基本的なWindowsやMacの使い方(ドラックアンドドロップによるファイル移動など)
  • エクセルデータのようなデータ形式のデータ解析がしたい方
  • 大学1年生程度の基礎統計(平均値・中央値など)
Description

データサイエンスの分野において、R言語とPython言語が二大言語となっていますが、今回はR言語を用いて、データサイエンスの講義を行います。

R言語の強みは、データ可視化・データ解析・統計処理、であり、これらを有機的に組み合わせることで、データから情報を効果的に取り出す”探索的データ解析(Exploratory data analysis)”を行うことができます。

今回は特に、データ可視化にフォーカスした講義を作成しました。Rのデフォルトの可視化機能と、高度な可視化機能であるggplot2パッケージによる可視化とGGallyパッケージによる可視化を扱います。

難しい概念や数式、数学を使う統計を極力排除し、"とりあえずこれだけ知っていれば動かせる"最低ラインの知識をまとめました。

以下が本講義の内容になります。

ーRプログラミング入門ー
R紹介とhead関数とhelp関数
Rでの計算とデータ構造
データ型と要約関数
Rの比較演算子
データフレームの扱い方
ディレクトリ移動とデータの入出力
Rパッケージ関連
for文による繰り返し処理
sample関数によるサンプリング

ーRによる可視化基礎ー
質的変数の可視化
量的変数の可視化
散布図行列
stars関数による可視化
parcoord関数による可視化
rglパッケージによる三次元の可視化
tabplotパッケージによる可視化

ーRによる高度な可視化ー
ggplot2パッケージによる一次元の量的変数の可視化
ggplot2パッケージによる二次元の量的変数の可視化
ggplot2パッケージによる一次元の質的変数の可視化
ggplot2パッケージによる二次元の質的変数の可視化
ggplot2パッケージによる質的変数と量的変数の可視化
散布図行列の発展
平行座標プロットの発展版
階層構造があるデータの可視化

ーデータ変換技術ー
filter関数による行の抽出
select関数による列の抽出
mutate関数による列の作成
group_by関数とsummarize関数
パイプ演算子

ー欠損値の対応ー
欠損値の集計と可視化
欠損値の対応1(リストワイズ法)
欠損値の対応2(ペアワイズ法・完全情報最尤推定法)
欠損値の対応3(miceパッケージでの代入法)
欠損値の対応4(miceパッケージでの代入法)

ー探索的データ解析ー
人事データの探索的データ解析
(今後8月中にいくつか追加予定)


最近流行りの機械学習(教師有なし)を使わなくても、十分に機械学習以上の成果を出せること(データから情報を抽出する)がお分かりいただけるかと思います。

データサイエンスプログラミングに関する重要なこととして、プログラミングの細かいことを覚える必要がないことがあります。どのコードを実行するとどんな結果が出てくるかのイメージだけを覚えておき、データを向き合ったときに、そのデータをどの手法で処理するかが分かればよく、その手法を書いたスライド(本講義で配布しています)に戻って、そのスライド中のコードを一部改変して使いまわせるようになることが、最終的な着地点です。本講義では一部を改変するだけで使えるコピペ用コードを必要量(多すぎず少なすぎない量)ご用意しました(pdfとtxtファイル)。ぜひご活用ください。


注意事項:本講義に向いていない方は以下の方々です。ご注意ください。
1,画像解析・音声解析・時系列データ解析をやりたい方。
2,数理モデリングをやりたい方。
3,手を動かさないで、データサイエンスを理解したい方。
4,数値やカテゴリの予測(回帰・分類)をしたい方。
5,DeepLearning(深層学習)を学びたい方(DeepLearningはPython言語が得意です)




Who is the target audience?
  • 最低限どこまでデータサイエンススキルがあればデータ解析できるか知りたい方
  • ゼロからR言語に入門したい方
  • とりあえずITスキルを身に着けたい方
  • 今までプログラミングをしたことがなくて、初心者向け言語であるR言語でプログラミング入門をしてみたい方。
  • データを可視化をする技術を身に着けたい方
  • 教師有機械学習や教師なし機械学習に限界を感じていてデータ可視化に可能性を見出している方。
  • エクセルのような形式(csv)の表データから有益な情報を抽出する技術を身に着けたい方
Students Who Viewed This Course Also Viewed
Curriculum For This Course
37 Lectures
05:27:44
+
レクチャーの概要説明
1 Lecture 06:07
+
Rプログラミング入門
10 Lectures 01:38:24

R紹介とhead関数とhelp関数
14:33

Rでの計算とデータ構造
17:52

データ型と要約関数
11:03

Rの比較演算子
06:24

データフレームの扱い方
09:05

ディレクトリ移動とデータの入出力
09:13

Rパッケージ関連
12:13

for文による繰り返し処理
05:33

sample関数によるサンプリング
08:16
+
Rによる可視化基礎
7 Lectures 59:57
質的変数の可視化
10:09

量的変数の可視化
08:21

散布図行列
13:11

stars関数による可視化
05:29

parcoord関数による可視化
07:43

rglパッケージによる三次元の可視化
06:16

tabplotパッケージによる可視化
08:48
+
Rによる高度な可視化
8 Lectures 01:15:26
ggplot2パッケージによる一次元の量的変数の可視化
11:52

ggplot2パッケージによる二次元の量的変数の可視化
07:38

ggplot2パッケージによる一次元の質的変数の可視化
06:24

ggplot2パッケージによる二次元の質的変数の可視化
09:10

ggplot2パッケージによる質的変数と量的変数の可視化
11:16

散布図行列の発展
10:49

平行座標プロットの発展版
09:50

階層構造があるデータの可視化
08:27
+
データ変換技術
5 Lectures 29:24
filter関数による行の抽出
05:44

select関数による列の抽出
04:48

mutate関数による列の作成
03:45

group_by関数とsummarize関数
09:23

パイプ演算子
05:44
+
欠損値の対応
5 Lectures 45:33
欠損値の集計と可視化
07:00

欠損値の対応1(リストワイズ法)
08:17

欠損値の対応2(ペアワイズ法・完全情報最尤推定法)
07:09

欠損値の対応3(miceパッケージでの代入法)
16:04

欠損値の対応4(miceパッケージでの代入法)
07:03
+
探索的データ解析の実例
1 Lecture 12:53
人事データの探索的データ解析
12:53
About the Instructor
鈴木 瑞人
4.0 Average rating
1 Review
19 Students
1 Course
機械学習、データサイエンス、生物学、脳科学

2010年4月 東京大学 教養学部 理科二類 入学
2012年4月 東京大学 理学部 生物学科 進学
2014年3月 東京大学 理学部 生物学科 卒業
2014年4月 東京大学大学院 新領域創成科学研究科 入学
2016年3月 東京大学大学院 新領域創成科学研究科 修士課程 卒業(医科学修士)
2016年4月 東京大学大学院 新領域創成科学研究科 博士課程 入学

学部の時は、ショウジョウバエの感覚神経のtiling機構の研究
修士論文は、次世代シーケンサーMinIONを使った肺腺癌ゲノム断片の検出

Python言語は、実質1年半程度使用
R言語は、実質2年程度使用