R言語によるデータサイエンス【データ操作, 最短習得コース】 (2021, tidyverse+α, 基礎+応用)
What you'll learn
- データ分析の初歩であるデータ操作方法
- R言語の使用方法とパッケージの機能紹介
- 最新のパッケージの利用方法
Requirements
- 基本的なITの知識(ITパスポートレベルがあると望ましい)
- 興味のある事柄を自ら調査するスキル
Description
データサイエンスの実務において、機械学習モデルの構築は全体の約2割に過ぎません。
残りの8割は、データの収集、クレンジング、探索的分析、可視化、レポーティングが占めています。
本コースでは、この「見えない8割」の作業を効率的に行うためのR言語の活用法を体系的に学びます。
R言語を知らない方にも「R言語を起点にデータサイエンスへ入門しよう」と思っていただけるよう、最先端の機能だけでなく従来まで使われてきた機能も振り返りながら紹介しています。
■使用環境:
Windows 10
R 4.0.5
RStudio 1.4.1717
利用パッケージ例:
nycflights13,palmerpenguins,devtools,remotes,usethis,vctrs,httr,tidyverse,tidyselect,here,janitor,skimr,lubridate,hms,slider,glue,broom,fs,data.table,dtplyr,tictoc,readxl,vroom,DBI,RSQLite,reprex,odbc,RODBC,reticulate,gapminder,dbplyr,prettycode,styler,testthat,bench,parallelly,parallel,furrr,multidplyr,rsthemes,scales,cowplot,patchwork,withr,ProjectTemplate,scatterplot3d,haven,kableExtra,knitr,xaringan,revealjs
■得られる知識:
・「RやRstudio」を使うと、どのようなことが実現出来るのかを知ることができる
・データサイエンスに利用する上で最低限どんな知識が必要かを知ることができる
・tidyverseをはじめとしたパッケージや、便利な機能を持った関数群をインストール方法から紹介する
・便利な機能や実践的な使用例をかみ砕いて紹介する
・様々なユーザーパターンを想定し、幅広いデータファイルへの接続方法や操作方法を紹介する
・スライドショーや報告レポート化する機能を使い、低ストレスで分析内容を資料化する方法を紹介する
Who this course is for:
- データサイエンスに興味を持っている方
- excelだけでないデータ分析をめざす方
- Tidyverseは知ってるが、まだ使ったことが無い方
- R言語は少しだけ触ったことがあるレベルの方
- データ分析言語についてまったく知らない方
Instructor
理系大学院にて創薬化学・有機化学専攻(修士)。製造業のデータアナリストとして、データ収集・分析・活用および社内データリテラシー教育、AIにかかわる案件のプロジェクトマネジメントを担当。
統計的学習(機械学習)や深層学習のアルゴリズム実装やソルバー利用による業務改善や開発プロジェクトに従事。RとPythonを主な開発言語として使用。
実際の仕事上で重要と感じた機能や有益なコード、専門的な知識を抽象化・濃縮して分かりやすく伝えることを意識しています。