What you'll learn
- データ取得とデータ可視化・分析の間にある、これまでなかなか一般向けに言語化されてこなかった、データをキレイにする行為。
- データ可視化をするための最低限の条件であるデータの状態とは何であるかが学べます。
- 無料ツールOpen Refineを用いたデータをキレイにするための実際のやり方を学びます。
- 実際公開されている公的なデータを用いて、クレンジングや整形をハンズオンで画面を見ながらやり方を学べます。
Requirements
- Excelを使ったことがある方。
- パソコンをお持ちの方。
Description
【本コースは、どんな内容か】
・Open Refineというオープンソースで無料のウェブアプリケーションを使用して「データをキレイにする」ための方法論と具体的な手法をご紹介します。
・全般的にマウスでの操作になりますが、一部、スクリプトとよばれる一行単位で完結するような短めのプログラミング言語を使う場面もあります。
・データがキレイになった結果として、可視化や分析に用いるツールの幅を広げ、打ち手を増やしていくことが可能になります。
・「データをキレイにする」ことがテーマであり、データ取得やデータ可視化については扱っていません(話の流れで登場している箇所はあります)。それらについては今後別のコースとしてリリースしていきます。
【本コースの特徴】
・本コースでは、作業全体を、クレンジングと整形、列と行にわけ、この4マスに作業を分類し、具体的な作業内容について、共有しています。
・ほかの書籍やツールなどで紹介されているクレンジング方法は、抽出/集約/結合などといったデータベースの操作をベースとしているため、一般の方には少し分かりづらいかなと思います。
・無料のツールを用いて、データ活用の専門家でない、一般の方がどなたでもデータを活用いただけるような体系化を試みています。
【本コースの受講順序】
・A...セクション1〜3:原理原則の紹介
・B...セクション4〜10:ツール操作方法の紹介
・C...セクション11〜13:サンプルデータを用いた演習
・D...セクション14:まとめ
という構成になっております。
※すべての動画を最初から最後までこの順序で見なければならない、ということはありません。
たとえば、
・A→C→B(基礎と実践をできるだけ最短で)
・C→B→A(座学は後回しでいいので、まずはサンプルを言われたとおりに操作しながら慣れたい)
といった順序でご覧いただいてもいいでしょう。
【本コースで対象とするデータ】
・リスト形式の表データを対象にしています。
・複雑な階層のファイル、ネットワークデータ、自然言語の文章や画像/音声/動画ファイルといったメディアファイルは対象にしません。
【本コースで対象としていない処理】
・機械学習のための前処理は対象にしていません。
・データの匿名化は対象にしていません。
Who this course is for:
- プログラマーでなくデータ分析の専門でもない一般の方。
- 効率よくデータを活用したい方。
- 普段Excelを使っていて、他のツールも使ってステップアップしたい方。
Instructor
多摩美術大学 情報デザイン学科 非常勤講師/東京大学空間情報科学研究センター 柴崎研究室 協力研究員/千葉工業大学大学院 デザイン科学専攻/コード・フォー・トウキョウ 代表/データ・ビジュアライゼーション・ジャパン 発起人/合同会社ノーテーション 代表社員/おもちゃコンサルタント。
株式会社ビジネス・アーキテクツにてデザイナー及びアートディレクターを7年間経験後、2008年に独立。近年では、データ・ビジュアライゼーションの実践と普及に関する様々な活動をおこなっている。共著書に「RESASの教科書」がある。