
この講座が目指しているゴール、つまり、受講を終了したとき、どのような状態であることを期待してるのか、また、どのような方を対象として作成されているのかを説明します。
本講座がどのようなセクション構成になっているのか、受講する場合にどのような進め方を想定しているのかを解説します。
---
・セクション構成
確立したデータ分析のプロセス「PPDACサイクル」に対応してセクションが構成されています。
---
・レクチャー構成
レクチャーは「講義」と「デモ」の2つのパートで構成されています(デモのないレクチャーもあります。)
デモは、エクセルとTableauを中心に展開します。「わかったような気になる」ことを防ぎ、具体像を身に着けていただくことを目的としています。
講師の自己紹介を致します。受講を検討していただいている方の参考になるかと考えています。
経歴
執筆した書籍
展開しているUdemy講座と評価
個人として持っているビジョン
データとは何か、データ分析とは何かという、「出発点」をお話致します。
企業におけるデータ分析は何を目的として行う(べき)なのかを解説します。
「データドリブン」や「デジタルトランスフォーメーション」の本質的な部分にデータ分析があります。なぜ、今、データ分析が必要とされているのかをお話します。
データ分析は闇雲に行うべきものではありません。既に確立しているPPDACサイクルを紹介します。PPDACサイクルとは以下の各ステップの頭文字から命名されています。
Problem - 問題
Plan - 計画
Data - データ
Analysis - 分析
Conclusion - 結論
PPDACサイクルの最初のステップ「Ploblem」で行う「問題の特定」を解説します。「問題」とはどのように定義できるのかを知識として身につけることができます。
問題を特定した次のステップに「仮説の立案」が来ます。仮説とは何かを解説した上で、仮説を立案するフレームワークを紹介しています。仮説の立案が苦手な方も、フレームワークを利用すれば筋の良い仮説を立案できるようになります。
PPDACの第二ステップ Planの解説として「分析計画の全体像」を紹介しています。計画にはどのような要素を含めるべきなのかを理解できます。
分析計画に盛り込むべき「スケジュール」について、分析を一つの「プロジェクト」とみなし、その構成要素を解説しています。
分析計画には、分析するべきデータについてどのように入手する方針であるのか、どのような項目を含むデータであるべきなのかを含めるべきです。そうでないと、分析プロジェクトが動き出した後で、分析するべきデータがなかったことに気づく、あるいは必要な項目がなかったことに気づくということにもなりかねません。
本レクチャーでは、どのような仮説に対し、どのようなデータを収集するべきかを学びます。
前ステップの「計画」に応じてデータを収集する際、代表的な5つのデータ収集方法について解説します。受講すると自分が行うべき分析にあたっては、どようにしてデータを収集するべきなのか、理解できます。
横持ちのデータを縦持ちに変換するデモを行います。利用するツールは、Tableau Publicです。Tableau Publicは無料で利用できます。また、デモに利用した横持ちのデータをエクセルで提供しますので、横持ちのデータを縦持ちに変換する作業について、受講生はお手元で再現することができます。
レクチャー13と14ではデータを「人力で集める」方法を紹介しました。本レクチャーでは残りの4つのデータ収集方法を解説します。データを人力で集める以外に、どのような方法があるのかを理解できます。
データを収集しても、そのままでは分析に利用するのに適していない場合も多いものです。そのような場合「データの整備」を行う必要があります。本レクチャーを受講すると、どのような種類のデータの整備作業があるのかを俯瞰して理解できます。
データ整備の一環である「集計」について、実際にはどのような作業になるのか、エクセルでデモをします。
データ整備の一環である「集計」について、実際にはどのような作業になるのか、Tableau Publicでデモをします。
データの整備の一環として、横持ちのデータを縦持ちに変換する「ピボット」という操作があることを学びます。
ピボットの操作をエクセルで行うデモです。実際にピボットの作業が必要になったとき、参照してください。
ピボットの操作をTableau Publicで行うデモです。実際にピボットの作業が必要になったとき、参照してください。
データ整備の一環として「結合」と呼ばれる作業が必要になる場合があることを理解します。データが一つのファイルではなく、2つ以上に分かれている場合に必要となる操作です。
結合の操作を、エクセルで見ていただくデモです。VLOOKUPという関数を利用します。
結合の操作をTableau Publicで見ていただくデモです。関数などを使わず、直接的に2つの表にまたがるデータを結合できます。
データ整備の一環として「ユニオン」と呼ばれる操作が必要となる場合があることを理解します。
同一フォーマットで、複数部署の売上や利益が記録されている場合、同一フォーマットで、複数の月の広告のパフォーマンスが記録されている場合などに必要となる操作です。
ユニオンをエクセルで行うデモです。デモは小さなデータなので、それほど大変なようには見えないと思います。一方、現実の、大きなデータでは、エクセルだとユニオンが比較的面倒な作業ということを理解できます。
ユニオンをTableau Publicで行うデモです。ドラッグ&ドロップでスマートにユニオンが完成することが分かります。実務上、大きなデータでユニオンを行う必要があれば、Tableau Publicを使えば良い。ということが理解できます。
このセクションで説明してきた各種のデータ整備の操作を、一つの専門のツールで行うことがあり、そのツールを、データプレパレーションツールと呼ぶということを学びます。
6つに分かれた、必ずしもそのままでは分析に利用できないデータを、データプレパレーションツールである、Tableau Prep Builderを利用して、分析に適した状態に変換していくデモです。
Tableau Prep Builderは、無償の環境がないため、手軽に試すことは難しいかもしれませんが、分析に関する業務が多かったり、データの整備に時間がかかるようであれば、こうしたツールを利用するべきだということが理解でき、また、ツールの基本的な操作感や、機能を学ぶことができます。
分析のフレームワークとして「データの要約」について学びます。データ収集後、データが示す全体像を俯瞰して理解するためのフレームワークです。
データを要約する際に、「散らばり(=分布)」の度合いを表現したくなる場合があります。その際に利用される代表的な指標が、分散と標準偏差です。本レクチャーでは、2つの指標を手計算、及び、関数で求めるデモをします。サンプルデータでそれらを求めることができるようになります。
分析のフレームワークとして「ディメンションとメジャー」について学びます。また、分析の結果を行動につなげる際にどのような事象に注目すればよいのかを学びます。
分析した担当者が「言いたいこと」に応じて適したグラフ表現があることを学びます。以下の6つ表現を8種類のグラフで表現します。グラフ作成のデモも、それぞれ、エクセルとTableauでお見せしますので、適切なグラフ表現を学ぶとともに、ダウンロード可能なデータを使い手元で再現して頂くことができます。
-表現したいこと
時系列の変化を表現する
項目別の大小を表現する
構成比を確認する
分布の概要を表現する
分布の詳細を表現する
2つの量的変数の相関を表現する
-取り上げるグラフ
折れ線グラフ
棒グラフ
円グラフ
帯グラフ
度数分布表
ヒストグラム
箱ひげ図
散布図
時系列での変化を表現するのに適したグラフは折れ線グラフであることを学びます。
また、どんな場合であれば、棒グラフを使って良いのか、についても学習します。
エクセルで折れ線グラフを作成するデモです。受講すれば、サンプルのエクセルファイルを利用して折れ線グラフを作成できます。
Tableau Publicで折れ線グラフを作成するデモです。受講すれば、サンプルのエクセルファイルを利用して、ピボットテーブルを作成し、ピボットグラフを利用して折れ線グラフを作成できます。エクセルとの操作感の違いを意識すれば、スプレッドシートとBIツールの差異についても「肌感覚」得ることができます。
項目の大小を表現するのに最適なグラフは棒グラフであることを理解できます。
サンプルのエクセルファイルをもとに棒グラフを作成するデモです。
フィルタ機能をあわせて理解できます。
サンプルのエクセルファイルをもとに、Tableauで棒グラフを作成するデモです。
Tableauのフィルタ機能をあわせて理解できます。
構成比を確認するグラフとして、円グラフ、帯グラフがあることを理解できます。
また、複数の項目(例えば複数年)に渡る構成比の変化には帯グラフが適していることも確認します。
円グラフ、帯グラフの2種類のグラフをエクセルで作成するデモです。サンプルデータを使って、2つのグラフを作成できるようになります。データは、令和2年、令和3年のサンマの水揚げ量の実データを利用します。
Tableauを利用して円グラフ、帯グラフを作成する方法をデモします。
円グラフはTableauの機能の一つである「表示形式」を利用します。帯グラフを「簡易表計算」を利用します。
受講するとTableauでの、円グラフ、帯グラフの基本的な作成方法を理解できます。
分布の概要を表現するには、表、グラフの2通りがあることを理解します。表で表現すると「度数分布表」となり、グラフで表現すると「ヒストグラム」となることを理解します。
エクセルで度数分布表、ヒストグラムを作成するデモを見ていただきます。レクチャー45のTableauのデモと対比することで、Tableauの方がスマートに度数分布表やヒストグラムを作成できることを感じていただけます。
Tableauで度数分布表、ヒストグラムを作成するデモを見ていただきます。
量的変数にもとづき「ビン」を作成することが、度数分布表の「階級」の作成に当たることを理解します。
分布の詳細を表現したいときに最適なのは「箱ひげ図」であることを理解します。また、箱と、ひげがどのように描かれるのかを理解します。受講後は、箱ひげ図を読み取れるようになっています。
エクセルで箱ひげ図を作成するデモです。複数年のヒストグラムを並べて比較すること、特定の年に絞り込むことも同時に学びます。受講後は自身で箱ひげ図を作成できるようになります。
Tableauで箱ひげ図を作成するデモです。レクチャー47のエクセルでの箱ひげ図と比較し、Tableauの方が、個別のデータまで表示されることを体感できます。
2変数の相関を表現するには散布図が適していることを学びます。また、相関とはそもそもどのような関係を指すのか、散布図を作成する際には、X軸、Y軸にどちらの変数を用いるべきか、また、それぞれがなんと呼ばれるのか等、散布図の解釈に必要な知識を学びます。
エクセルで散布図を作成するデモです。2つの指標を格納した列を指定してから、グラフを挿入し、散布図を描く、その方法を理解できます。
Tableauで散布図を作成するデモです。2つの指標を利用し、ディメンションを「詳細」にドラッグ&ドロップすることで簡単に散布図が描けることを理解します。
データ分析を行う上で、犯しやすいミスについて学び、実際の、業務上の分析ではそれらのミスをなるべく犯さないように備えることができます。
データ分析を行う上で、分析対象が「サンプル」である場合があります。そのような場合には、「点推定」ではなく「区間推定」が適していることを理解できます。また、区間推定を可視化するには、「エラーバー」チャートが適していることを学びます。
Exploratory Publicを利用してエラーバーを描くデモです。Exploratoryというツールの操作感について、おおまかな印象を得ることができます。また、エラーバーチャートを描きたい場合利用できるツールとしての認識を得ることができます。
データ分析の実務上、ツールを使うのが一般的であることを学びます。また、本講座で取り上げているツールについて整理します。
分析の結果を報告するための「報告書」や「プレゼンテーション」はどのような構成であるべきかについて理解し、効率よく「訴えたいこと」を受け手に伝えるスキルを身に着けます。
報告書やプレゼンテーションには、単純にグラフを貼り付けてはいけません。受け手を動かし、組織として行動を喚起するテクニックとして5つの訴求方法を紹介しています。これにより受け手を動かす効果的なプレゼンテーションが可能になります。
分析の結果が「継続してモニタリングするべきである」となる場合があります。その場合に利用するべきなのが「ダッシュボード」であることを理解すると同時に、比較的利用が容易なダッシュボードツールとしてLooker Studioがあることを理解します。
企業では、どんな部署に配属されようと、必ず「データ分析」により問題を解決するニーズがあります。一方、学生時代以降、体系だってデータ分析について学んだことがない方も多いと思います。
本講座では、データ分析の確立したプロセス「PPDACプロセス」を体系立てて学び、効果的で効率良い分析ができることをゴールとしています。(PPDACプロセスは、日本統計学会公認の統計検定4級対応の教科書でも紹介されています。)
効果的な分析とは、データ分析の結果、組織として問題を解決する行動を起こす力のある分析のことです
効率的な分析とは、手戻りなく、想定した時間内で目的を達することができる分析のことです
また、企業におけるデータ分析はツールを使って行われます。本講座は、ビジネスマンを対象としているため、「概念を知って分かった気になる」のでは不十分と考え、ツールの利用について多数のデモを含めています。また、そのデモのほとんどに対して、受講生が手元のPCで再現できるよう、講師が見せたデモと同じデータをサンプルデータとして提供しています。
デモの多くは、ビジネスマンとして全員が使える前提であるエクセルはもちろん、採用する企業が増えている、BIツールであるTableau(実際には無料バージョンであるTableau Public)で実施しています。「データの整備(セクション4)」や「データ分析(セクション5)」のデモを手元で再現することにより、「エクセルだとこういう方法でできる」、「Tableauだとこういう方法になる」という対比ができるようになります。
業務の内容に適した分析ツールを使えることも、現代のビジネスマンのデータ分析リテラシーに含まれると考えます。エクセル以外のツールを知り、それらツールの得意な分野を理解するという副次効果も期待できます。
講座で取り上げたツールは以下です。(ただし、ツールの操作スキル習得を目的とした講座ではないため、あくまでも、どのようなツールがあり、どんなことが得意か、を紹介する目的となります。)
エクセル
Tableau
Tableau Prep Builder
Exploratory
SQL
Looker Studio
講師は、個人的なビジョンとして、以下を掲げています。受講した方の「データ分析」の力が向上することを強く期待しています。
To C:データサイエンスで人生を拓きたいあなたの最高の教師
To B:データ分析のリテラシー向上により日本企業を強くする