
このコースで分析するデータとみなさんの役割について説明します
みなさんは、スマートウォッチメーカーである、Gannett社のマーケティング担当です
Gannett社は、販路をインターネットによる直販のみに絞っています
同じくスマートウォッチをインターネットで直販する競合が数社います
競合も含めた2016年~2018年の詳細な販売データが入手できました
しかし、データがあまりに膨大、且つ未加工であるため、生データのままだと内容がつかめません
そこでみなさんは、最新のBIツールであるPower BIにより、データの取り込み、加工、そしてビジュアリゼーションをすることにしました
このセクションのゴールを説明します
このセクションでは、下記のバラバラのエクセルデータをPower BIに取り込み、分析がしやすいように加工します
USA
Australia
Japan
Mexico
Factory_Names
International_ZipCodes
Products
取り込みと加工には、Power Query EditorというPower BIに搭載されている機能を使います
Power BI Desktopを起動し、保存します
Power BIを起動します
Power BIを保存します。拡張子は、pbixとして保存されます
Power Query Editorで作業中でなければ、上書き保存をしていただきコースを中断してOKです
アメリカの売上データをPower BIに読み込みます
USA.xlsxを読み込みます。
下記の3つのテーブルを読み込みます。
USA_2016
USA_2017
USA_2018
Power Query Editorの画面を紹介します
リボン
ホーム/変換/列の追加
クエリ
メイン画面
プロパティ(クエリの名前)
適用したステップ
注意!
Udemyのプラットフォーム側の不具合により、ダウンロードしたファイル名がOriginalやブランクになる、といった元の名前とは変換されてダウンロードされる事象が報告されています。その場合は、お手数ですがファイル名を USA と変更していただけますようよろしくお願いします。
データを取り込んだら2つのことをします
データ型の確認
データ型の説明
テキスト/数値/日付
計算しない数字はテキストにする
マスター番号は、データ型をテキストにする
Zip Codeは郵便番号であるため、テキストにする
テキストにすることで、本来Zip Codeの先頭にあったゼロが復活することに注意
2016~2018年まで3年分あるので忘れないように
クエリ名の確認
どういったデータなのか一目で分かる名前にする
閉じて適用により、Power BIにデータを取り込みます
フィールドに項目が出てきたことを確認します
プロダクトに関するデータを取り込みます
Products.xlsxを取り込みます
データを取り込んだら2つのことをします
データ型の確認
クエリ名の確認
1行目を削除します
1行目をヘッダーとして使用します
この上で再度データ型を確認します
マスター番号はテキストにします
Productをパイプ記号を境にしてProductとSegmentに分けます
ホーム/列の分割/区切り記号による分割
区切った後は、それぞれの項目名をProductとSegmentに変えます
注意!
Udemyのプラットフォーム側の不具合により、ダウンロードしたファイル名がOriginalやブランクになる、といった元の名前とは変換されてダウンロードされる事象が報告されています。その場合は、お手数ですがファイル名を Products と変更していただけますようよろしくお願いします。
Categoryの空欄をフィルによって埋めます
Priceを通貨と金額に分けます
例から列の追加により金額を抜き出します
同じ要領で、通貨(USD)を抜き出します
Price列を削除します
わざと他の列の削除を行い、適用したステップでもとに戻します
列の削除を行います
抜き出した列のヘッダー名、データ型を整えます
金額はPriceで固定小数点数、ヘッダー名をPriceにします
数値のデータ型について説明します
10進数は小数点を含む数字です
固定小数点数は小数点2位までの数です。ドル、ユーロなどセントの単位を持つ数に使います
整数は小数点がない数に使います
通貨はCurrencyでテキスト、ヘッダー名をCurrencyにします
閉じて適用をします
International_ZipCodes.xlsxを取り込みます
Power Query Editorからも取り込みができます
Power Query Editorを起動します
ホーム / 新しいソース / Excel
データを取り込んだら2つのことをします
データ型の確認
クエリ名の確認
クエリ名をCountry_Cityとします
最初の2行を削除します
1行目をヘッダーとして使用します
計算をする数値ではないので、ZIpcodeのデータ型をテキストにします
クエリをクリックし、他のクエリに切り替わることを確認してみます
閉じて適用をします
注意!
Udemyのプラットフォーム側の不具合により、ダウンロードしたファイル名がOriginalやブランクになる、といった元の名前とは変換されてダウンロードされる事象が報告されています。その場合は、お手数ですがファイル名を International_ZipCodes と変更していただけますようよろしくお願いします。
Factory_Names.xlsxの取り込みをします
データを取り込んだら2つのことをします
データ型の確認
クエリ名の確認
クエリ名をFactory_Nameとします
最初の3行を削除します
最後の1行を削除します
変換/入れ替えをします
1行目をヘッダーとして使用します
データ型を整えます
ヘッダー名を整えます
製造者の所在国はManufacturer_Countryとします
製造者の日本語読みはManufacturer_JPNとします
閉じて適用をします
注意!
Udemyのプラットフォーム側の不具合により、ダウンロードしたファイル名がOriginalやブランクになる、といった元の名前とは変換されてダウンロードされる事象が報告されています。その場合は、お手数ですがファイル名を Factory_Names と変更していただけますようよろしくお願いします。
3か国の売上データを一気に取り込みます
これまでは個々のエクセルファイルを一つづつ取り込みました。今回は、フォルダーにまとめられた同じ形式のエクセルファイルを一気に取り込みます
このレクチャーのダウンロードにある3つのエクセルを1つのフォルダーにまとめます
フォルダー名は、International_Sale にします
個々のエクセルを開き、中の形式、そしてシート名が3つとも全くであることを確認します
ホーム / データを取得 / 詳細 をクリックします
すべて / フォルダーをクリックします
フォルダーパスで、さきほど3つのエクセルファイルを格納したフォルダーを選択し、OKをクリック
取り込むファイルの一覧が出てきます。結合 / データの結合と変換をクリックします
サンプルファイルに最初のファイル、Sheet1をクリックして、OK
Power Query Editorが起動し、International_Saleがクエリに取り込まれます
注意!
Udemyのプラットフォーム側の不具合により、ダウンロードしたファイル名がOriginalやブランクになる、といった元の名前とは変換されてダウンロードされる事象が報告されています。その場合は、お手数ですがファイル名を Australia, Japan, Mexico と変更していただけますようよろしくお願いします。なお、国の判別は、Countryの列の国名を参照ください。
データを取り込んだら2つのことをします
データ型の確認
日付に注意!
クエリ名の確認
Source.Nameを削除します
Country列のフィルターにより3か国のデータが入っていることを確認します
Australiaをフィルターした上で、変換/日付を使ってデータの期間を確認します
同じ要領をJapanで試してみます
Zip(=郵便番号)がエラーなく表示されていることを確認します。データ型がテキストになっていないと、エラーがでることがあります
確認後は、フィルターされた行、のステップを削除します。削除しないとフィルターされたまま取り込まれることになります。例えば、Australiaをフィルターして、読み込むと、オーストラリアだけがデータとして残ります
閉じて適用をします
売上のデータを1つに結合します
下記の4つの売上データを結合します
USA_2016
USA_2017
USA_2018
International_Sale
オーストラリア
日本
メキシコ
まず、データビューにてこれから結合しようとする売上データのデータの形式が同じであることを確認します
全てのデータを合わせると3百万行程になります。エクセルの限界が百万行程です
Power Query Editorを開き、これから結合しようとする売上データのデータ形式が一致している旨を確認します
特にJapanのZipがテキスト型になっていることを確認します。ここがテキストになっていないと後でエラーが起こります
International_Saleを選択した上で、ホーム/クエリの追加/クエリの追加
3つ以上のテーブル
USA_2016~2018を選択し、追加、OK
結合されたかどうか、Countryでフィルターをかけて確認をします。下記の4か国のデータが入っています
Australia, Mexico, Japan, USA
Japanを選択し、Zipでエラーが出ていない旨を確認します。もし、前のレクチャーにてデータ型をテキストにしていない場合、ここでエラーが出ます
データが結合されて、何行のデータになったのか確認します。前のレクチャーで数えた行数と比べてみます
ホーム / 変換 / 統計 / 値のカウント
閉じて適用をします
データビューにて、International_Saleの行数を確認します
たとえ3百万行でもスムーズにスクロールバーで移動ができます
USA_2016~2018の売上データは既にInternational_Saleに含まれています。これら重複のデータを読み込まないようにします
Power Query Editorを開きます
クエリ/各クエリを右クリックし、読み込みを有効にする、をアンチェックします
閉じて適用をします
フィールドの項目からUSA_2016~2018が無くなっている旨を確認します
削除したわけではないので、読み込みしたければ、同じ要領で今度はチェックを入れると読み込まれます
International_Saleには、販売数量 Units はありますが肝心の売上金額はありません。Productsから単価を持ってきて、単価 X 数量により売上を出します。ここでは、Productsから単価を持ってきます
モデルビューに行き、International_SaleとProductsが、ProductIDによりリレーションシップが作成されていることを確認します
もしリレーションシップが作成されていなければ、作成します
Power Query Editorを起動します
クエリより、International_Saleをクリックします
リボン / ホーム / クエリのマージをクリックします
クエリの追加は、データを縦に延長、マージは横に延長するイメージです
ProductIDをもとに、Productsクエリとマージします
イメージはエクセルで、ProductIDをもとにVLOOKUP (or XLOOKUP)する感じです
Productsという列が出ますので拡張アイコンをクリック
単価であるPriceをクリックします
イメージは、VLOOKUPで持ってくる列を選ぶ感じです
元の列名をプリフィックスとして使用します、は試しにチェックをつけたままにします
列名をPriceにします
データ型を確認します
次のレクチャーにて、単価 X 数量を行います
単価 X 数量により売上を出します
列の追加/カスタム列
新しい列名をRevenueとします
カスタム列の式に、Units * Priceと入れ、OKとします
新しい列のデータ型を忘れずに、固定小数点数にします
試しにUnitsが1ではないところをフィルターし、Revenueがあっているか確認します
確認が終わったら、適用したステップで削除します
もし、再度フィルターをアンチェックしても、ステップ自体は残ります。データをリフレッシュする度に同じステップを行い、無駄な作業をさせることになるので注意しましょう
閉じて適用をします
おめでとうございます!以上で、このセクションのテーマであるデータの取り込みと加工は終わりました。次のセクションからは、データモデルによりリレーションシップについて説明します
このセクションのゴールを説明します
このセクションでは、リレーションシップが作成されていない、Country_Cityクエリと、International_Saleクエリの間にリレーションシップを作成します
完成版のモデルビューの画面を見てみます
モデルビューの説明をします
リレーションシップが作成されているもの、いないものの識別をします
画面を合わせる、アイコンの紹介をします
リレーションシップがされていない場合、作成する方法を説明します
一度リレーションシップを削除し、もう一度リレーションを作成します
リレーションシップを作成する場合はデータテーブルから繋ぐクセをつけます
こうしたリレーションシップを作成することを、データモデルを組む、と言います
データモデルのベストプラクティスとして、マスターテーブルは上に、データテーブルは下に配置するようにします
リレーションシップが作成されている、Productsのクエリを使って簡単なビジュアルを作成します
レポートビューに行きます
視覚化で集合縦棒グラフをクリックします
軸にProducts / Categoryを入れます
値にInternational_Sale / Revenueを入れます
軸にProducts / Segmentを入れます
軸にProducts / Manufacturer_IDを入れます
番号が出てくるだけであまり役に立ちません
モデルビューで、Products - Factory_Name間にリレーションシップが作成されていることを確認します
軸にFactory_Name / Manufacturerを入れます
軸にFactory_Name / Manufacturer_JPNを入れます
軸にManufacturer_Countryを入れます
International_Sale / Revenueをクリックします。リボンにメジャーツールが出てきますので、書式設定でドル表記にします
リレーションシップが作成されていないクエリを使ってビジュアルを作った場合にどうなるか検証します
モデルビューにて、Country_Cityにはリレーションシップが作成されていないことを確認します
レポートビューに戻ります
軸にCountry_City / Countryを入れます
ビジュアルに正しい結果が表れてこないことを確認します
International_SaleとCountry_Cityにリレーションシップを組みます
モデルビューに行きます
Internationa_SaleとCountry_City、両方ともZipという項目があるのを確認します
Zipでリレーションシップを作成します
リレーションシップが多:多であるためエラーになる旨を確認します
ZipのCountry_City側では、異なる国で、同じ郵便番号があります。そのため、どの国のZipとつないでいいのかPower BIは判断できず、エラーになります
例えば、Zip 22654をデータビューでフィルターしてみます。アメリカとメキシコで、同じ22654という郵便番号を使っています
International_SaleとCountry_Cityをつなぐため、CountryとZipを組み合わせて独自の項目を作り、それをもとにリレーションシップを作成します
Power Query Editorを開きます
Country_Cityのクエリを選択します
CountryとZipの列を選び、列の追加 / 列のマージを選びます
先にCountryを選んでから、Zipを選ぶようにします
マージの際、先に選んだものが先頭になります
区切り記号をコンマ
新しい列名をCountry_ZipとしてOK
データ型がテキストである旨確認します
閉じて適用をします。モデルビューにいき、Country_Cityに新しい項目、Country_Zipができていることを確認します
Power Query Editorを開きます
International_Saleのクエリを選択します
CountryとZipの列を選び、列の追加 / 列のマージを選びます
先にCountryを選んでから、Zipを選ぶようにします
区切り記号をコンマ
新しい列名をCountry_ZipとしてOK
データ型がテキストである旨確認します
閉じて適用をします
(モデルビューを開いていた場合)自動的にCountry_Zipを使って、Country_CityとInternational_Sale間でリレーションシップが作成されます
(もし自動的にリレーションシップが作成されない場合)Country_Zipを使って、International_SaleとCountry_Cityの間にリレーションシップを作成します
モデルビューに行きます
International_SaleとCountry_Cityの間に、Country_Zipによりリレーションシップが作成されていることを確認します
されていない場合は、リレーションシップを作成します
(覚えてますでしょうか?ずっと前のレクチャーで、Country_CityのCountryを使って棒グラフを作成してエラーになったことを)レポートビューに行きます
先ほどはエラーになっていた、軸にCountryを入れた集合縦棒グラフがキチンと表示されている旨を確認します
おめでとうございます!以上でこのセクションのテーマである、リレーションシップが作成されていない、Country_Cityクエリと、International_Saleクエリの間にリレーションシップを作成、ができました。次のセクションからは、Power BIの顔とも言える、ビジュアリゼーションについて説明します
このセクションのゴールを説明します
このセクションでは、Gannett社と競合他社との売上シェアの様子をビジュアリゼーションしながら、Power BIによるデータビジュアリゼーションの方法を説明していきます
視覚化のアイコンを変えることで、ビジュアルが簡単に切り替わることを確認します
集合縦棒グラフのビジュアルを作成します
軸にCountry_City / Country、値にInternational_Sale / Revenueを持ってきます
ビジュアル化の方法をいくつか見てみます
スマートウォッチの売上は、アメリカが圧倒的、次にオーストリアと続き、日本、メキシコは存在感が薄いのが見て取れますね
凡例にFactory_Name / Manufacturerをもってきます
視覚化のアイコンを集合縦棒グラフから、積み上げ縦棒グラフに変更します
フィルタ―を利用して、売上上位5社のみを表示するようにします
現在作成しているビジュアルをクリックします
フィルタ―のウィンドウを広げます
Manufacturerのところを展開します
フィルタ―の種類を上位N
アイテムの表示を上、5
値にInternational_Sale / Revnueを入れます
フィルタ―を適用をクリック
各国のグラフにて、凡例が上位5社に絞られたのを確認します
ビジュアル内のグラフの上にカーソルを置き、右クリック、テーブルとして表示をクリック
ビジュアルがその値とともに拡大表示されます
上位5社は下記の5社でした
Dornire
Gannett
Imad
Leckitt
Masimos
自社であるGannetに注目しつつ、他社とのシェア関係を見ていきます
レポートに戻るをクリック
フィルタ―にある消しゴムのアイコンでフィルターをクリアします
グループを作成し、オリジナルな視点でビジュアルを表示します
上位5社をGannettと競合4社に分けます
その他の会社は、その他とします
フィールド / Factory_Name / Manufacturer / 新しいグループをクリック
競合4社である下記の4社をコントロールキーを押しながらクリックします。その後グループをクリック
Dornire
Imad
Lekitt
Masimos
グループができますので、名前を競合4社、とします
Gannettを選び、グループをクリックします。グループ名はそのままでOK
その他は、その他とします。他のグループを含める、にチェックを入れます。OKと押します
積み上げ縦棒グラフをクリックします
凡例のManufacturerを削除し、先ほど作ったManufacturerを入れます
グループは、項目名の横に田んぼの田のようなマークがついています
Australiaにて、Gannetの存在感がかなり強い旨を確認します
ctl + Zで一つ前の作業に戻れます。グループ作成前後で、自社の存在感がどう際立つか?見比べてみます
アメリカでは、単独でのシェアは高いものの、競合4社よりはシェアが低い、一方でオーストラリアでは圧倒的なシェアを誇っているのがわかりますね
日本とメキシコでもシェアは高いものの、国としての全体売上が低い分、やはりアメリカ、オーストラリアと比べると見劣りします
作成したビジュアルの数値を確認する方法を紹介します
単にグラフの上にカーソルをホバーさせると、その数値が表示されます。これをヒントと言います
フォーカスモードを使うと、そのビジュアルが大きく表示されます
グラフの上にカーソルをホバーさせた上で、右クリックして、データポイントをテーブルとして表示、とすると、そのグラフの元データの明細が表示されます。
省略記号をクリックし、データのエクスポートとすると、csv形式でエクスポートすることができます
グラフの上にカーソルをオバーさせた上で、右クリックして、テーブルとして表示をクリックします
ビジュアルと、そのビジュアルの値が表形式で表示されます
縦方向のレイアウトに切り替える、をクリックするとこでレイアウトが変わることを確認します
レポートに戻る、でもとに戻ります
新たなビジュアル、ツリーマップを作成します
売上全体に占める、各メーカーのシェアをビジュアル化します
キャンバスにスペースを作り、ブランクのキャンバスをクリックした上で、視覚化 / ツリーマップをクリック
グループにFactory_Name / Manufacturerを入れます
値にInternational_Sale / Revenueを入れます
ツリーマップは、ある数値に占める割合をビジュアル化するのに適しています。同じ姉妹ビジュアルであるドーナツグラフ、円グラフと比べてみます
スペースの有効活用の点、そして、項目が多い場合の見やすさで、ツリーマップは優れていると言われています
2つ以上のビジュアルが1つのページにある時に使えるクロスフィルタ―について紹介します
まず積み上げ縦棒グラフをクリックします
凡例からManufacturer(グループ)を削除します
ツリーマップ中のGannettをクリックします
すると、積み上げ縦棒グラフに変化が起こります。各国のうち、Gannett分の売上のみを表示します。この作業をクロスフィルタ―と呼びます
クロスフィルタ―をオフにするためには、もう一度、ツリーマップ中のGannettをクリックします
同じ要領で、ツリーマップ中のDornire、Masimosなどもクリックしてみましょう
当然、ツリーマップで面積が小さい=売上が小さいものにいくにつれて、積み上げ縦棒グラフ中のシェアも小さくなります
今度は、積み上げ縦棒グラフのUSAをクリックします
ツリーマップの各Manufacturer中の各国のシェアが表示されます
USAとAustraliaをそれぞれクリックして、Gannettの売上がツリーマップ上、どう出てくるか見比べてみます。視覚的にもAustraliaの売上の方が大きいことが分かります
同じ要領で、Australiza、Japan、Mexicoもクリックしてみます
どの会社もメインの市場はアメリカ、オーストラリアで、日本、メキシコでの展開は小さいことがうかがえます
ページ単位でフィルターをかけることで、いちいちビジュアル毎にフィルターをかける手間を省きます
フィルタ―のウィンドウを展開します
このページのフィルターに、Factory_Name / Manufacturer(グループ)を入れます
Gannettと競合4社をクリックします
ツリーマップで、社名が全部で5社に絞られていることを確認します
フィルタ―を閉じます
日付データを軸にとるビジュアルを作成し、日付の階層とは何か?を説明します
スペースを整え、集合縦棒グラフを作ります
軸に、International_Sale / Dateを入れます
値に、International_Sale / Revenueを入れます
データビューで、International_Saleをクリックし、Dateは単なる日付であることを確認します
レポートビューに戻り、上記で作った集合縦棒グラフをクリックします
軸が、年 / 四半期 / 月 / 日 とPower BIが日付データをもとに、日付の階層を自動で作成してくれているのを確認します
もし、日付の階層をする必要がなければ、軸 / Dateの横にある下向き矢印をクリックし、Dateを選択します
日付の階層に戻したい時は、同じ要領で、日付の階層をクリックします
階層間の移動は、ビジュアル上部にある矢印のアイコンで行います。詳細は後のレクチャーで説明しますので、お楽しみにしてください
相互作用を編集により、クロスフィルタ―の動作設定をします
各国の売上を示す集合縦棒グラフの、各国のグラフをクリックします
年によるRevenueのビジュアルにて、全体に対してクリックした国のシェアが見えるのではなく、それぞれの国のグラフが見えると、より各国の売上の推移が見えそうです。
ツリーマップも同様に、各国における各Manufacturerの割合が見えると、また違った見方ができます
クロスフィルタ―をクリアします
リボン / 書式 / 相互作用を編集をクリック
現在アクティブではないビジュアルに、3つのアイコンが出てきます。これらにより、アクティブなグラフ発でクロスフィルターが起こった場合のフィルター方法を設定できます
じょうご付き棒グラフアイコン-フィルタ― 選択されたアイテムのみでビジュアルを表示
グラフアイコン-協調 選択されたアイテムが全体でどのくらいを占めるか?を強調表示
禁止アイコン-クロスフィルタ―をしない
各ビジュアルをクリックし、他ビジュアルで、相互作用をフィルターにします
設定されたアイコンは塗りつぶしされます
ツリーマップ上、最もシェアが小さいLeckitt / Imadについて、強調表示では年によるRevenueでほとんど変化が見られませんでしたが、フィルター表示にすると着実に成長していることがうかがえます。何か魅力的な商品が出たのか?チェックが必要かもしれません。同じ要領でDornireは、強調表示ではさほど売上に変化がありませんが、フィルターにすると右肩下がりであることがわかります
設定が終わったら、リボン / 書式 / 相互作用を編集を再度クリックして、アイコンを消します
相互作用を編集した後のクロスフィルタ―がどのように動くのかを見てみます
CountryによるRevenueビジュアルにて、各国のグラフをクリックし、ツリーマップビジュアルと、年によるRevenueがどう動くのか?を確認します
先ほどと違って、強調ではなく、クリックした国でフィルターがされています
同じくManufacturerによるRevenueビジュアルにて、各Manufacturerをクリックして、他ビジュアルがどう動くか?を確認します
ツリーマップ上、最もシェアが小さいLeckitt / Imadについて、強調表示では年によるRevenueでほとんど変化が見られませんでしたが、フィルター表示にすると着実に成長していることがうかがえます。何か魅力的な商品が出たのか?チェックが必要かもしれません。同じ要領でDornireは、強調表示ではさほど売上に変化がありませんが、フィルターにすると右肩下がりであることがわかります
このようにすることで、各国におけるManufactureのシェア、また各Manufacturerの主要マーケット並びに販売の時間における推移が簡単に把握できます
クロスフィルタ―は、コントロールキーを押しながら、別のビジュアルの要素をクリックすることで複数の要素に対してフィルターをかけることができます
Gannettのマーケティング担当として、Gannettに特化した各国、そして時系列な売上推移が知りたいところです
ツリーマップのGannetをクリックした後に、コントロールキーを押しながら、Australiaをクリックしてみましょう
同じ要領でUSA他をクリックしてみましょう
もっとも売上の多いAustraliaでは、2017年から2018年にかけて急激に成長していることが分かります
他も概ね右肩上がり、一方、日本では頭打ちな様子がうかがえます
ドリルダウン機能を使って、ビジュアルの要素を詳しく見ていきます
GannettのAustraliaにおける、2018年の売上の急激な成長の背景をさぐっていきます
ツリーマップのGannettをクリックし、コントロールキーを押しながら、CountryによるRevenueのAustraliaをクリックします
年によるRevenueのビジュアルの上にカーソルをホバーさせます
1本の下向き矢印のアイコンをクリックします。これでドリルダウンモードがオンになりました。アイコンが塗りつぶされたことを確認します
すると、2018年が、1つ階層を落とした2018年の四半期単位になります
グラフにカーソルをホバーさせると、2018年の各四半期である旨が分かります
第四四半期で急激に売上が伸びていることが分かります
具体的に何月で売上があがっているのか?を探っていきます
今度は、2本の下向き矢印のアイコンをクリックします
どうやら、9月、10月で急激に伸び、11月で落ち込んだものの、以前の月のレベルよりも高いレベルをキープしたまま12月を迎えたことが分かります
他の年でも同じように、第四四半期、そして9月、10月での伸びがあるのか?確認してみましょう
上向き矢印をクリックすることで、1つづつ上の階層に戻ります。年単位まで戻りましょう
階層内の1レベル下をすべて展開機能を使ってビジュアルの要素を詳しく見ていきます
引き続き、GannettのAustraliaにおける、2018年の売上の急激な成長の背景をさぐっていきます
ツリーマップのGannettをクリックし、コントロールキーを押しながら、CountryによるRevenueのAustraliaをクリックします
年によるRevenueビジュアルにある下向き二股に分かれているアイコン、階層内で1レベル下をすべて展開します、をクリック
すると、2016~2018年までの売上が、四半期単位で表示されます
いずれの年にも第四四半期に大きな波があることが分かります。しかしながら2018年の伸びは、それより以前の年よりも急激なことが見て取れます
さらにもう一つ下の階層に移動します。もう一度、階層内で1レベル下をすべて展開します、をクリックします
スペースが足りず、全ての年の全ての月を一覧するために、フォーカスモードをクリックします
どの年も9月と10月で急激な伸びがあり、11月、12月は落ち込むものの高い水準を維持、その後、5月、6月の底に向かって売上が落ち込む、というトレンドが見て取れます
しかしながら、2018年の9月、10月は脅威的です。ここで何が起こったのか、さらに調べてみる必要がありそうです
フォーカスモードでも、ドリルアップが使えます。年の階層までドリルアップした後に、レポートに戻ります
クロスフィルタ―をクリアします
おめでとうございます!以上でこのセクションのテーマである、Gannett社と競合他社との売上シェアの様子をビジュアリゼーションしながら、Power BIによるデータビジュアリゼーションの方法を説明する、は終わりです。このセクションでは、特にGannettと競合他社との関係を見ていきました。次のセクションでは、Gannettにフォーカスをあてつつ分析を進めていきます
このセクションのゴールを説明します
このセクションでは、Gannettにフォーカスをあて分析を進めつつ、Power BIによるデータビジュアリゼーション、そして各種分析の際に役立つ機能をさらに紹介していきます
このセクションでは、Gannettに着目してさらに詳しく分析をすすめます
Gannettのみを切り出して分析するために新しいページを用意します
既存のページ名を、市場分析と名前を変えます
市場分析のタブを右クリックし、ページの複製をします。複製したページの名前を、Manufacturerとします
スペースを作った上で、ブランクのキャンバスをクリックし、スライサーをクリックします
Factory_Name / Manufacturer をスライサーに入れます
右上の下向き矢印をクリックし、一覧からドロップダウンに変えます
Gannettをクリックします
ページ単位、全ページ単位のフィルターについての補足をします
ページ単位のフィルターでは、そのページだけでフィルターがかかります
全ページ単位のフィルターでは、既存の全てのページに対してフィルターがかかります
スライサーにて、Gannettを選択したことにより、ツリーマップをカードビジュアルに変えます
ツリーマップは売上の構成をビジュアル化しますが、1つのManufacturerしか表示していない今、ツリーマップは有効ではありません
ツリーマップをクリックし、視覚化よりカードを選びます
カードビジュアルで示されるのは、スライサーで選択されたManufacturerのRevenueになります
これまで、日付データは、International_Sale中のものを使っていました。しかし、往々にして売上は毎日計上されるとは限りません。売上が無かった日も、ビジュアルに反映できるようにするために、日付マスターを作成します
例. ある1日の売上が無かった時、売上データにはその日のデータは無い。折れ線グラフを作った時に、その売上が無かった日は売上ゼロとなるハズが、その日自体がグラフには出てこない
新規のエクセルを立ち上げ、Calendarと名付けます
エクセルのA1セルにDateといれます
今回の資料の範囲は、2016年~2018年までです。ですので、A2に2016/01/01と入れます
ホーム / フィル / 連続データの作成を利用して、2018/12/31までの連続データを作成します
作成されたカレンダーをテーブルとして設定します
テーブルデザイン / テーブル名で、テーブルの名前を、Calendarとします。このテーブル名が、Power BIに取り込んだ時のクエリ名になります
保存して閉じます
Power BIを開きます
データの取得 / Excelで先ほど作成したCalendarエクセルを取り込みます
モデルビューに行きます
先ほど取り込まれたCalendarクエリのDateと、International_SaleのDateをリレーションシップでつなぎます
リレーションシップでつなぐ時は、データテーブルからリレーションシップを伸ばすクセをつけます
作成したCalendarクエリを使い、既存のDateを置き換えます
DateによるRevenueに入っている、International_Sale / Dateを削除し、Calendar / Dateに置き換えます
フィールドに表示される項目を、非表示を使って整理します
DateによるRevenueに入っている、International_Sale / Dateを削除し、Calendar / Dateに置き換えます
フィールドのクエリのうち、重複する項目や、マスター番号といった項目を非表示により整理します
ビジュアルの軸に階層を設定し、階層を下りつつビジュアルの分析ができるようにします
CountryによるRevenueをクリックします
軸のCountryの下に、Cityをドラッグ&ドロップします
CountryによるRevenueの、ドリルダウンモードをオンにします
Australiaをクリックします
Australiaの売上が、Cityレベルで見れるようになりました
年によるRevenueの各年度をクリックし、それぞれの年の推移を確認します
どの年も、Australiaの売上は、Sydneyがけん引していることがうかがえます。しかし、各年度で同じような光景が見られ、どうやら2018年の売上の伸びは、特定のCityが関係しているわけではなさそうです
CountryおよびCityによるRevenueビジュアルをドリルアップし、再度Countryレベルに戻します
前のレクチャーでは、CityではAustraliaにおけるGannettの2018年の伸びが説明できないことが分かりました。今度は、Productから探っていきます
Products / Productに階層の設定をします。こうすることで、わざわざ軸に複数の項目を持ってきて、階層を作る手間が省けます
Products / Productの横の省略記号をクリックします
新しい階層をクリックします
Product階層という新しい項目ができます
Segmentを右クリックし、階層に追加します
Categoryを右クリックし、階層に追加します
Product 階層には、Category、Segment、Productという3つの項目が入っています。これを階層の順位から下記のようにドラッグして並び替えます
Category / Segment / Product
集合横棒グラフでProduct 階層をビジュアル化します
スペースを作った上で、集合横棒グラフをクリックします
軸に、Products / Product 階層を入れます
値に、International_Sale / Revenueを入れます
Categoryでは、Gannettは、Cityで存在感が際立っていることがわかります
今度はCity CategoryのどのSegmentが強いのかを見てみます
CategoryによるRevenueのドリルダウンモードをオンにし、Cityをクリックします
Convenience, Moderation, Extremeの3つのSegmentが際立っています
国別の傾向をみてみます。CountryによるRevenue / Australiaをクリックします
同じくUSAをクリックします
AustraliaとUSAを比べた時、AustraliaではExtremeのSegmentが非常に強いです
次に、年における推移を見てみます
CountryによるRevenueをクリックします
コントロールキーを押しながら、年によるRevenueの各年をクリックします
どの年もExtremeのSegmentが非常に強いことが分かります
Australiaでは、Extreme Segmentが強いことが分かりました。この傾向は、AustraliaのCity、年で変化があるのか?を探ります
CategoryによるRevenueのドリルダウンをオンにして、Cityをクリックします。ドリルダウンができたら、ドリルダウンモードをオフにします
CountryによるRevenue で、ドリルダウンモードをオンにします。Australiaをクリックします
CategoryおよびSegmentによるRevenueのExtremeをクリックします
コントロールキーを押しながら、年によるRevenueの各年をクリックします
こうすることで、Extremeの各年における、City別の売上割合を確認できます
残念ながら、常にSydneyがダントツであり、特に他のCityで際立った動きはありませんでした
クロスフィルタ―をクリアします
ビジュアルをドリルアップし、もとの階層に戻します
マトリクスビジュアルを使い、Product 階層の詳細なデータを見ていきます
スペースを作った上で、ブランクのキャンバスをクリックした上で、マトリクスをクリックします
行に、Products / Product 階層を入れます
値に、International_Sale / Revenueを入れます
マトリクスにてドリルダウンをしてみます
マトリクスビジュアルをクリック、ドリルダウンモードをオンにします
Category / Cityをクリックします
数字を大きくして見やすくします。視覚化の書式アイコンをクリックします
グリッド / テキストサイズを12にします
マトリクスビジュアルでは、値に同じ項目を入れ、もう一つは合計とは別の計算をすることができます
マトリクスビジュアルをクリックし、値にもう一つInternational_Sale / Revenueを入れます
値中の2つ目のRevenueの下向き矢印をクリックし、値の表示方法 / 総計のパーセントをクリックします
すると2つ目のRevenueの値が全体に対するパーセントに変わりました
各年で、AustraliaにおけるExtremeのシェアを見てみます
まずは、すべての国で見た場合のシェアを見てみます
年によるRevenueにて、各年をクリックします
全ての国においてのExtremeのシェアはだいたい3割程度と分かります
今度は、CountryによるRevenueでAustraliaをクリックします
コントロールキーを押しながら、年によるRevenueにて、各年をクリックします
CountryによるRevenueで、Australiaをクリックします。各年6~7割のシェアがあることが分かります
マトリクスビジュアルにて、更に詳しいデータを見ていきます
ドリルダウンモードがオンであることを確認した上で、Extremeをクリックします
これで最も詳細なProduct単位でデータが表示されます
売上総計におけるシェアの大きいもの順で並べ替えます
マトリクスビジュアルの省略記号をクリック、並び替え条件、Revenueの総計のパーセントをクリック
Australiaにおける各年のExtremeのどのProductが売れているか?を見ていきます
CountryによるRevenueのAustraliaをクリック
コントロールキーを押しながら、年によるRevenueの各年をクリックします
UE-04が、2018年にて大きく伸びたことが分かります
DAXを使って、対昨年成長率を計算し、ビジュアルに表示します
DAXとは、エクセルと非常に似た関数で、既存の項目を使って様々な計算を行い、新たな項目を作ることができるものです。こうしてDAXによる計算により新たに作られた項目をメジャーと呼びます
とにかく作成してみます。ここでは前年度の売上をDAXを使って計算します
フィールド / International_Saleの上にカーソルをホバーさせ、右クリック。新しいメジャーをクリックします
キャンバスの上部に計算バーが出てきますので、DAX式を入れます。新しい項目は、LastYear_Revenueという名前にします
LastYear_Revenue = CALCULATE(SUM(International_Sale[Revenue]),SAMEPERIODLASTYEAR('Calendar'[Date]))
フィールドのInternational_Saleのクエリ内に、新たにLastYear_Revenueという項目が増えました。DAXにより作成された項目の横にはそれを示す電卓のマークが入ります
International_Sale / LastYear_Revenue をクリックします。リボンにメジャーツールが出てきますので、書式でコンマ並びに通貨をドルとします
もし、この時点でRevenueの通貨がドルとなっていなければ、同じ要領で通貨をドルにします
前のレクチャーで作ったLastYear_Revenueの検証をします
マトリクスビジュアルにLastYear_Revenueを入れます
CountryによるRevenueでAustraliaをクリックします
コントロールキーを押しながら、年によるRevenueの2016年をクリックします
2016年におけるUE-14の金額をメモします
年によるRevenueの2017年をクリックし、LastYear_RevenueのUE-14の金額が先ほどメモした金額と一致しているか検証します
同じ要領でUE-17も検証します
検証が済んだら、一度マトリクスビジュアルから、LastYear_Revenueの項目を削除します
対昨年成長率をDAXを使って計算します
フィールド / International_Saleのクエリの上にカーソルをホバーさせて、右クリック、新しいメジャーをクリック
計算バーが出てきますので、DAXを入れます
vs.LastYear_Growth% = DIVIDE(SUM(International_Sale[Revenue])-[LastYear_Revenue],[LastYear_Revenue])
作成した成長率をマトリクスビジュアルに入れます
vs.LastYear_Growth%をパーセント表記にします。vs.LastYear_Growth%をクリックします
リボンにメジャーツールが出てきますのでクリックします
書式でパーセントをクリックします
マトリクスビジュアルにて、対昨年成長率を新しくDAXを使って出した2つの項目を使って見てみます
International_SaleのLastYear_Revenueとvs.LastYear_Growth%をマトリクスビジュアルに入れます
マトリクスビジュアルの省略記号をクリック。降順で並び替え、並び替えの条件が、Revenueの総計のパーセントになっていることを確認します
CountryによるRevenue / Australiaをクリック
コントロールキーを押しながら、年によるRevenueの2016年~2018年を順番にクリックして、Extremeの各Productの成長率を見てみます
UE-04の成長率が著しい旨が数字でも確認できました
マーケティング担当としては、UE-04のヒットの秘密をさぐり、他の製品にも応用できないか検討したいところです
マトリクスビジュアルに条件付き書式を設定し、成長率の増減をビジュアルで表現してみます
マトリクスビジュアルをクリックします。視覚化の書式をクリック、さらに条件付き書式をクリックします
ドロップダウンから、vs.LastYear_Growth%をクリックします
アイコンをオンにします
アイコンがどのように動くか、年によるRevenueの各年のグラフをクリックしてみてみます
アイコンは、詳細コントロールで変えることができます。他のアイコンも試してみます
条件付き書式を削除します。
視覚化のフィールド / 値にあるvs.LastYear_Growth%の下向き矢印をクリックします
条件付き書式の削除 / アイコンをクリックします
マトリクスビジュアルに条件付き書式を設定し、成長率の増減をビジュアルで表現してみます
今度は、別の条件付き書式を試してみます
前のレクチャーの要領で条件付き書式をvs.LastYear_Growth%に設定します
背景色をオンにして、詳細コントロールをクリックします
発散的にチェックを入れることで、色の変化をより多様にすることができます
ここでは発散的はアンチェックしておきます
おめでとうございます!以上でこのセクションのテーマである、Gannettにフォーカスをあて分析を進めつつ、Power BIによるデータビジュアリゼーション、そして各種分析の際に役立つ機能をさらに紹介していく、は終わりです。次のセクションでは、いよいよビジュアルを駆使して、ダッシュボードを作成します
このセクションのゴールを説明します
このセクションでは、これまで用意したビジュアル+αで、ダッシュボードを作っていきます。完成版を見て、ゴールイメージをつけていただきます
このセクションでは、これまで用意したビジュアル+αで、ダッシュボードを作っていきます
Manufacturerのページを複製します。新しいページをDashboardと名付けます
Manufacturerスライサーは、項目が簡単に選べるようにします
下向き矢印をクリックし、一覧をクリック
書式 / 全般 / 方向を横にします
書式 / 選択範囲のコントロールで、単一選択、Ctlキーで複数選択、[すべて選択]オプションを紹介します
スライサーでフィルターをかけすぎて、わけがわからなくなったら、消しゴムアイコンでクリアにします
日付データを使ったスライサーを作ります
ブランクのキャンバスをクリックします
スライサービジュアルを作成します
Calendar / Dateを入れます
日付データを使ったスライサーには、次の値より前、や次の値より後といったオプションがあります。ここでは、デフォルトの指定の値の間、を使います
ゲージビジュアルは、目標値と現状の差を視覚化してくれます。ゲージビジュアルを既存ビジュアルを使って作成します
カードビジュアルをクリックします
視覚化 / ゲージをクリックし、ビジュアルを変更します
目標値に、International_Sale / LastYear_Saleを入れます。こうすることにより、目標値である去年の売上に対する現状を視覚化することができます
書式 / ゲージの軸にて、最小値、最大値の設定がマニュアルでできます
ダッシュボードにタイトルをつけます
リボン / 挿入 / テキストボックスをクリックします
Market Analysisと入れます
人に見せるためにはもちろんですが、実務でも意外といくつもPower BIのファイルを作っていると、各ファイルで何をしているのか分からなくなります。タイトルそして、ファイル名を工夫しましょう
フォントサイズを36、ボールドに設定します
表示を使って、ビジュアルの配置整えがしやすくなります
リボン / 表示 / ページオプションで使える下記3つのオプションを紹介します
グリッド
グリッドに合わせる
オブジェクトをロック
ページの背景に壁紙を設定します
このレクチャーのダウンロードにある画像、world_map.png をダウンロードしてください
キャンバスのブランク部分をクリックし、書式 / 壁紙を展開します
イメージの追加をクリック先ほどの画像を選択します
イメージのサイズ調整で自動調整を選択します
透過性を調整して、背景としてなじむようにします
各ビジュアルをクリックし、背景をオフにすることで、各ビジュアルの白抜き背景を透明にできます
注意!
Udemyのプラットフォーム側の不具合により、ダウンロードしたファイル名がOriginalやブランクになる、といった元の名前とは変換されてダウンロードされる事象が報告されています。その場合は、お手数ですがファイル名を world_map と変更していただけますようよろしくお願いします。
各ビジュアルの配置を整えます
日付データのスライサーを自動で動かせるカスタムビジュアルをマーケットプレースよりダウンロードします
このレクチャーの作業は、サインインが必要となります
視覚化の省略記号をクリックします
Appsourceからインポートをクリックします
検索で、play axisと入れ、追加を押します
日付データのスライサーをクリックし、新しくインポートしたビジュアルに切り替えます
年によるRevenueを一つ階層を落とします。こうすることで、ビジュアルが動いている様子がよくわかります
新しいビジュアルを階層を1つ落とします
リボン / 書式 / 相互作用を編集で、新しいビジュアルに対する、CountryによるRevenueビジュアルの反応をフィルターにします
再生を押すことで自動で日付を進めることができます
Manufacturerのスライサーを使って、各Manufacturer毎のデータで再生することができます
Gannettは、以前の分析ではAustraliaの9月、10月で売上が跳ね上がっていました。データを再生すると、1~8月まではUSAの方が大きいですが、9月、10月では順位が逆転してAustralia売上がトップになる様子が動きのあるグラフでもみてとれます
プレゼンや、残しておきたいフィルターがある場合に使える、ブックマーク機能を紹介します
まず、ページ何の全てのクロスフィルタ―、ドリルダウンをクリアにします
消しゴムのアイコンを使うと便利です
リボン / 表示 / ブックマークをクリックし、ブックマークウィンドウを開きます
追加をクリックすると、現在の状態がブックマークされます。
できたブックマークの省略記号をクリックし名前を、デフォルト、に変えます
クロスフィルタ―や、ドリルダウンをしても、このデフォルトをクリックすることで、元のクリアな状態に戻ります
スポットライト機能とブックマークを組み合わせてみます
CountryによるRevenueをクリックし、書式 / データラベルをオンにします
USAをクリックします
省略記号をクリックし、スポットライトをクリックします。CountryによるRevenueビジュアルがハイライトされます
この状態でブックマークを追加し、名前をUSAとします
Australiaをクリックします
同じくスポットライトし、ブックマークを追加して、名前をAustraliaとします
ブックマークウィンドウの、ビューをクリックします
ページの下部分にでてくる矢印をクリックすることで、Power Pointのスライドショーのように、ブックマーク間を行き来できます
なお、ビューの順番を変えたい時は、ブックマークの順番をドラッグして入れ替えることで簡単に変えられます
これまでで、ダッシュボードはできています。最後にダッシュボードがより見やすいように各ウィンドウを最小化します
フィールド、視覚化、フィルター、リボンをすべて最小化します
おめでとうございます!これでダッシュボードは完成です。これでこのセクションのテーマであるダッシュボード作成は終了しました。
お疲れ様でした。これでこのコースのレクチャーは全て終わりです。このコースが、みなさんがPower BIを使いこなすきっかけになれば、こんなにうれしいことはないです。これまでご受講いただきありがとうございました!
このレクチャーでは、Power BIでグラフに最小値と最大値の幅を表示するテクニックをご紹介します。
単に「合計」や「平均」だけを見るのではなく、その数値にどれくらいばらつきがあるか?を、視覚的にわかるようにしたい。そんなときに使える方法です。
今回は、ある会社の顧客データを用意しました。このデータはこのレクチャーのダウンロードにも置いていますので、よかったら実際に試してみていただければと思います。
(エクセルを示す)
このデータには、顧客IDと年収、そしてその顧客がどのエリアに住んでいるかが記録されています。
目指すのは、地区ごとの特色をグラフで表すこと。
ここで言う「特色」とは、各地区の平均年収と、その最小値・最大値の幅です。
ではさっそくPower BIで操作していきます。私はすでに読み込んでいます。
まずは、X軸に地区(Area)、Y軸に年収を設定して、棒グラフ(縦棒グラフ)を作成します。
で、Annual Salaryがデフォルトでは合計ですので、これを平均とします。すると各地域の平均年収が出ます。どうやらC地区が一番高くて、B地区が低いようです。さらにこのビジュアルに、各地区の年収の上限と下限がどうなっているのか?どれだけの幅があるのか?を示すビジュアルを追加します。
それはどこかというと、ここなんです。
[視覚化]/[さらに分析をビジュアルに追加]するを使います。この真ん中の書式はよく使いますが、ここって私自身もあんまり使わないです。
そして、「誤差範囲」という項目を開きます。
ここがポイントです。この「誤差範囲」という名前、ちょっとわかりづらいですよね?
実は英語版では “Error bars” と表示されています。とはいえ、「エラー」とか言われると、なんだか怖い印象があります。日本語でも誤差ですし。この名前のせいで、このテクニックはあまり知られてないのではないか?と個人的に思っています。
ここでいう 「誤差範囲」 とは、「統計的なばらつき」や「データの幅」を示すためのもので、実際には最大値や最小値をグラフに加える機能なんです。
今回は統計の話は置いておいて、最小値と最大値の設定だけここでは行います。
「誤差範囲」のところで、「上限」と「下限」。ここにAnnual Salaryを入れます。入れただけだとビジュアルがなんだか変ですね。そして、この矢印のところで、上限は最大値。下限は最小値とします。すると、グラフに新たな線が入っていますね。
さらに「エラーラベル」もオンにすると、その数値も表示されます。ちょっと見づらいので、ボールドにしてサイズを大きくしておきます。
これで、ビジュアルは完成です。この棒グラフは各地域の年収平均です。そして、この線は、各地域の年収で一番高い人と一番低い線を結んだものです。高い、低いはあるとして、見るポイントとしては、この幅ですかね。年収は固まっているのか?それとも幅があるのか?
出てきた値を読み取ってみましょう。
C地区は、年収の最小値も最大値も高い。つまり、お金持ちばかりの地区です。
A地区は、幅がとても広くて、ばらつきが大きい。高所得者と中間層が混在している印象です。
D地区は幅が狭く、やや落ち着いた分布。ただ、B地区よりは全体的に高めですね。
B地区は全体的に年収が低めで、分布も狭い。比較的均質な中・低所得層のエリアと言えそうです。
このように、「平均」だけでは見えなかった特徴が、「誤差範囲=最大値・最小値」を加えることで、はっきりと見えるようになります。
以上、誤差範囲を使って、数値のばらつきを可視化するテクニックのご紹介でした。
このレクチャーでは、Power BI の主要なインフルエンサービジュアルについて、実務的な使い方を紹介します。
このビジュアル。旬であるAIも使っているし、すっごく見た目のよいビジュアルができるので、とにかく人に見せたくなります。個人的にはそれではもったいなくて、このビジュアルは、人に見せて“説得”するためだけでなく、みなさん自身が試行錯誤のヒントを得るためにこそ使っていただけたらと思います。
では、はじめていきます。これから御覧のデータをPower BIに読み込ませます。同じサンプルデータをこのレクチャーに置いていますので、もしよかったらみなさんも後で試していただければと思います。
このデータは、ある会社の顧客情報です。この会社はあるサービスを提供しています。ポイントはこの解約フラグです。もしこの顧客がもうサービスの契約を打ち切っていたら1、まだ契約が続いていたら0と出ます。会社としては、解約してほしくないですよね。ですので、ここでやりたいのは、何が顧客が解約することに影響しているのか、もしくは何がサービスを継続することに影響を与えているのか?を出したいわけです。
そのヒントを得るために、みなさんはこの主要なインフルエンサービジュアルを使うとします。
ここで注意していただきたいのは、このビジュアルで表示されるのはあくまで相関関係です。このビジュアルで結果と条件の関連性はわかりますが、因果関係を証明するものではありません。あくまで「関係が高そうだ」というヒントが得られるものだと思ってください。もし、この後、私の説明にて、このビジュアルが因果関係を出すような話ぶりに聞こえたとしても、意図はあくまで相関関係です。
では、やっていきましょう。Power BIを開きまして、エクセルでデータを読み込みます。ナビゲーターが開きました。データの変換をクリック。インフルエンサービジュアルを使う時の大きな注意点があります。それは、ヒントを得ようとするデータ項目が本来数値ではない場合は、テキストにしておかないとうまくいかない、ということです。インフルエンサービジュアルでうまくいかない時の理由はだいたいこれです。
どういうことか?今回、ヒントを得ようと思っているのは、この解約フラグ部分です。ここは0が継続で、1が解約でした。今、数値しかこの列には入っていないので、Power BIが自動でデータ型を数値にしています。この状態だとマズいです。0と1というのは、数値というよりも「解約した/しない」の代わりに入れているものですよね。こういう場合に数値のままにしておくとインフルエンサービジュアルはうまく動きません。
ですので、データ型をテキストにします。もしくは、フラグを変換して「0=継続」「1=解約」と文字にしてもOKです。ベストプラクティスとしては、この後ビジュアルでの見やすさも考え、かつ必ずデータ型がテキストになることを考えて、変換しておきます。なお、変換の場合は、一度データ型をテキストにしてからでないとできません。では変換しておきます。
ただ、もしこのヒントを得ようとする項目が本来から数値である場合、代表的なのは売上などですね、この時は、数値のままでOKです。あくまで今回のように、本来的に数値でないものが数値型になっているのが問題です。
はい。これで閉じて適用をします。
インフルエンサービジュアル自体は超簡単に作れます。
レポートビューにて、主要なインフルエンサービジュアルをクリックします。すると、入力項目として「分析」と「説明」と出ます。配置方法はここでは重要でないので放っておきます。
この「分析」というところに、みなさんがズバリ知りたいデータ、ヒントを得たいデータを入れます。今回は「解約する人としない人の違い」を知りたいわけです。ですので、解約フラグを入れます。
そして、この解約に何が影響しているか?「影響」というのが英語でInfluenceなので、名前が主要なインフルエンサーです。その影響の候補になりそうなものを、この「説明」に入れていきます。解約にはサポートの問い合わせ件数が影響しているかもしれませんし、プランが影響しているかもしれません。契約年数なんかモロに影響していそうです。ですので、解約フラグと顧客ID以外は、今ある項目を全部入れます。
(失敗のスクショを見せる)
もしこの時、ビジュアルの代わりに御覧のようなエラーメッセージが出た場合、おそらく先ほどお話した「解約フラグが数値のまま」である可能性が高いです。
ご覧のような画面が出たら正解です。AIがやることですので、もしかしたらみなさんが見ている数値と私が見ている数値は若干違うかもしれませんが、それはそれでOKです。
見方としては、上に「解約フラグに影響を与えるもの」と出ていますね。ここが「解約」になっていると、解約に影響を与えるものを示しています。ここは切り替え可能です。
「継続」にすれば、継続に影響を与えるものが出ます。
まず注目したいのは左側です。ここが分析結果です。
影響が大きい順に並んでいます。一番影響を与えるのは契約年数のようです。「契約年数が1以下だと、そうでない場合よりも2.24倍解約しそうだ」と出ています。
なんとなく「1年も続かないから解約しているんでしょ?」とも思います。その一方で、「まずは1年継続してもらえば解約率は低くなる。なんとか1年を乗り越える施策を考えよう」とも考えられます。
捉え方は様々です。ですので、出た結果は鵜呑みにするのではなく、あくまでヒントとして捉えてください、という話を冒頭にしました。
この結果をグラフで示したのが右側です。なので、左側の話を図示しただけです。
もう一つの項目を見てみましょう。クリックするとグラフも切り替わります。「サポートの問い合わせが4を上回ると、そうでない場合よりも2倍近く解約に至りそうだ」と出ています。
サポート件数が多いということは、それだけ不満を持っているとも言えます。すると、今後サポート件数が3回目の顧客に対しては、より手厚くフォローして離脱を防ぐ施策を行えば、解約率は減らせるかもしれません。
影響を与えるもので、今度は「継続」とすると、今度は契約を継続することに影響を与える要素が出てきました。内容的には、解約の逆ですね。「契約が1年を上回り、サポートの問い合わせが4以下である」と。
今回は、量が少なく単純なサンプルデータで、継続か解約か?の2つの結果だけでしたので、このようにお互い対になる結果でした。ただ、毎回こうとは限りません。みなさんが実務で使う時に、「分析」に入れる項目によって、さまざまな結果が出てきます。
以上、このレクチャーでは、主要なインフルエンサービジュアルを紹介しました。実はインフルエンサービジュアルには、ここで紹介した主要なインフルエンサーの他に、上位セグメントというメニューもあります。
次のレクチャーでは、この上位セグメントを説明します。
このレクチャーでは、前のレクチャーの続きです。
Power BI の主要なインフルエンサービジュアルのもう一つの機能、上位セグメントを紹介します。
前のレクチャーでは、今見ているこの「主要なインフルエンサー」を使って、解約に影響している要因を一つずつ確認しました。
今回の上位セグメント、これです。これは、その延長線上で「複数の条件が重なると、どんなグループが解約しやすいか?」を自動で探し出してくれる機能です。
では、実際にやってみましょう。画面上部に「主要なインフルエンサー」と「上位セグメント」というタブが出ています。ここで「上位セグメント」をクリックします。確認ですが、(ドロップダウンを示す)今は、解約の可能性を上げる要素を見ています。
すると、バブルが出てきて、セグメントと呼ばれるものが2つ並びました。セグメントはそれぞれグループと読み替えてもいいです。このグループの解約率は78%。こっちは55%。この母集団の数というのは、そのグループに当てはまる人が何人いるか?を示しています。ちなみに今回のデータの全体は200人です。
では、このセグメント、言い換えるとグループはどんな人がいるか?このバブルをクリックします。
すると、なんともかっこいいアニメーションが動いて、セグメント1の詳細が出てきました。
このサポートの問い合わせが4より大きい、そして契約年数が1以下、両方が当てはまる人がこのセグメント1にグループ分けされています。そして、この右側には解約率が高い点についてのグラフ。そして、下にはこういうグループは結局全体で何人いるか?を示します。
この「このセグメントに関する詳細の参照」を開くと、さらなる分析が展開されますが、ここは複雑すぎるので、ここでは説明しません。
もう一つのバブルをクリックすると、こっちのセグメントについても、同様にどういう人たちのグループなのか?そして、全体のうち、どのくらいの人数がこのセグメントに当てはまっているかを示しています。
実務での使いどころでいえば、具体的にこのセグメントに当てはまる人とはどういう人なのか?対象を絞って、深堀り調査対象の候補にできますね。
または、実務では何らかの施策をやるとしても、常に予算というものが付きまといます。限られた予算であるならば、ターゲットを絞って投資。そのターゲットの候補としても、このセグメントは使えるかもしれません。
これで、上位セグメントの説明は終わりです。ここでも強調しておきたいのは、このビジュアルが示しているのは 相関関係 だということです。「契約年数が短いから必ず解約する」とか「こういうグループは必ず解約する」という因果関係を示しているわけではありません。あくまで「こういう条件が重なると解約率が高くなりやすい」というヒントです。
以上、このレクチャーでは インフルエンサービジュアルのもう一つの機能、上位セグメントをご紹介しました。手軽に使えるPower BIのAIビジュアル。ぜひみなさんも実務で使っていただければと思います。
このレクチャーでは、スモールマルチプル機能を紹介します。
これは何かというと、ひとつのビジュアルを分割して一覧で比較できる機能です。
よく、Power BIと比較されるTableauだと、見かけることがあります。Power BIで同じことをやろうとすると、何個も同じビジュアルを用意する必要がありました。
スモールマルチプルを使うと、例えば「売上の推移」をカテゴリごとに分割し、同じ目盛りで横並びに表示できます。
スライサー切り替えによる、個々のチャートでは見えにくい“違い”を、分割して比較できるのが特徴です。
それでは実際にやってみましょう。今見ているのは、ある会社の2000年から2005年までの売上をまとめたPower BIファイルです。この会社には、5つの製品カテゴリーがあります。で、今、私は、カテゴリーごとの売上推移を比較したいと思っています。その時、普通やるのはこうしてスライサーで切り替えることですよね。
ただ、これは一つ一つ切り替えなので、比べるという点では難しいです。
じゃあ、ってことで、これは実際に私がやっていたことですが、ビジュアルをコピーして、個々のビジュアルにビジュアルレベルフィルターで個々のカテゴリーを表示します。実際これでいいんですが、作るのが手間です。また、何気にビジュアルレベルフィルターってタイトルに出てこないから、これなんのカテゴリだっけ?とタイトルをつけなおさないとか手間なんです。
ここで出てくるのが、スモールマルチプルです。これはカテゴリ別に分ける前のグラフです。
この下の方にスモールマルチプルってありますよね。ここに分割したい項目を入れます。今回の場合は、製品カテゴリーですね。すると、御覧ください。カテゴリ別に、こんな感じで一覧にしてくれます。
注意すべきは、軸です。X軸Y軸は分割前と同じです。ただ、御覧くださいY軸の尺度は同じスケールなんです。
家具と生活雑貨、そしてスクロールして、台所用品がほぼフラットです。ビジュアルレベルフィルターにいきます。これらの製品ってこんなに動きあるのに、なんか変です。
これはなぜかというと、これらの売上規模が小さいからです。スモールマルチプルは、X軸、Y軸ともに、同じ尺度を使います。今は、売上規模の大きい、コンピュータや家電に合わせているので、御覧のようになっているわけです。これも一つの気づきと思います。個々のカテゴリでは動き大きいけど、一覧にすると規模的にはほとんど動きがないように見える。逆もしかりですね。一覧にすると見えないが、実はここでみると動きがある、そんな感じですね。
今回は説明の便宜上、このグラフしか入れていませんが、実務だと他のビジュアルもあるのでもっと小さく使うと思います。そうすると、グラフが小さくなって変化が見えにくいです。実務で、特に人に見せながら説明する時は、フォーカスモードに切り替えると、画面いっぱいに表示されます。これで説明するのも一つの方法です。
次に書式設定を見てみましょう。基本的に、色付けや軸の設定などはベースとなるビジュアル、この場合は折れ線ですが、その設定と同じことができます。
ここでは、スモールマルチプル独特のものだけ紹介します。書式のスモールマルチプル。この行と列。ここがポイントです。今回のビジュアルは5つあります。せっかく一覧で見えるのにスクロールで切れてしまってはもったいないですね。ここで調整して、一気に見れるようにします。今回は列を追加してみます。そうすると、御覧の感じで一覧にできました。パディングというのは、このグラフ間の隙間調整です。ちょっと詰め過ぎているな、と思ったらここでスペースを空けます。
右上の「…」メニューから、ソート方法も切り替えられます。
カテゴリ(文字順)で並べる
売上の大きさ(数値順)で並べる
こういった調整ができます。分析目的に合わせて、適切な順序に変えましょう。
最後に、
Small Multipleは、チャートの種類も簡単に切り替えられます。
棒グラフで規模の比較をすることもできます。棒グラフにすると、先ほどお伝えした売上規模が小さいがゆえに、折れ線の動きがほとんど見えない、というのが顕著にでます。
こうして、用途に応じて柔軟に見せ方を変えられるのも大きな魅力です。
ただ、すべてのビジュアルがスモールマルチプル対応ではありません。例えば、円グラフにしても出ません。
見分け方は、このX軸やY軸などに項目を入れる画面にて、スモールマルチプルがあるかどうかで判断しましょう。
個人的には、スモールマルチプルは、ぱっと見では「人に見せるための機能」に思えますが、実は自分で分析する時にとても便利です。冒頭にもデモしたように、スライサーをカチカチ切り替えたり、複数のビジュアルを作らなくても、一度に比較ができます。違いをじっくり観察したい時に、強力な武器になります。
以上、このレクチャーではスモールマルチプルの紹介をしました。分析の一歩目。違いを俯瞰する上で便利な機能ですので、ぜひ使ってみていただければと思います。
【どうせやるならNo1ツールを】
BIツール、かつては、分析業務にがっつり浸った一部の人のための【閉じた】ツールでした。今では、大小含めて様々なツールが登場し、【セルフサービスBI】ということで、みなさん自身がご自分でデータを抽出、加工し、その結果をビジュアル化するような時代になっています。
データ至上主義とも言われる現在のビジネス界において、一部では”Power BI is new Power Point. (Power BIこそ、次のPower Point)”、つまりこれからのプレゼンソフトのスタンダートは、Power BIになる、とまで言われています。
その中でもMicrosoft社が提供するPower BI Desktopは、IT業界で権威のあるガートナーマジッククアドラントで常にリーダーであり、ビジョナリーであり続けます。
このコースでは、そのMicrosoft Power BI Desktopを、全く使ったことがない、というレベルから、ダッシュボードが作成できるレベルまでをサポートします。
【どうせやるなら実戦的で楽しいコースを】
単なるぶつ切りの機能の紹介だけではつまらない。それならYouTubeでもできます。このコースはUdemyコースならではの一貫性のあるコースとしてデザインしています。みなさんには、スマートウォッチメーカーである架空の会社、Gannett(ガネット)社のマーケティング担当になっていただきます。そして、みなさんの手元には競合他社も含めた3年分、エクセルの行にして3,000,000行以上のバラバラの生データがあります。
このコースでは、こららの生データを抽出、加工し、そしてビジュアル化します。しかも、単にビジュアル化して終わり、ではなくビジュアル化した後のデータを更に分析する、というみなさんの日々のお仕事ですぐに応用できるように構成しています。コースの途中では、私の実務でのPower BI Desktopの経験談などを踏まえ、楽しく進められるように工夫しました。
【Nothing to Lose, But All to Gain】
このコースは、30日間無条件での返金保証がついています。そして、Power BI Desktop は Microsoft のサイトより無料でダウンロードできます。ですので、みなさんには、失うものはなく、一方でこれから必須のスキルと言われるBIツール、しかもNo1のPower BI Desktopを使いこなせるチャンスだけがあります。BIツールへの第一歩、このコースをきっかけにしませんか?
それではコースでお会いしましょう!