この記事では、
- Power BI (PBI)と接続できるデータベース、ファイルの種類
- ローカルフォルダのExcel、csvファイルの取得方法
- 取得したデータからグラフを作成する方法
について紹介していきます。
PBIにどのようなデータが接続できるのか、具体的な取得方法とExcelと同じようなグラフの簡単な作成/修正方法について理解を含めていきましょう。
PBIの概要とインストール方法については以下の記事を参考にしてください。
Power BIの特徴とインストール方法についてContents
結論
- Excel、Access、SharePointなどのMicrosoftの製品以外にもOracle、SQL、SAPなどからもデータの取得が可能
- 上記の異なるデータベースと同時に接続可能
- データの取得はフォルダ/データベースを選択して開く
- グラフ (ビジュアル)は取得したデータの各列をドラッグすることで編集可能
- 作成したグラフの修正が簡単なため、グラフ作成の時間も短縮可能
それでは詳細について説明していきます。
PBIと接続できるデータベース、ファイルの種類 (クリックで移動) ローカルフォルダのExcel、csvファイルの取得方法 (クリックで移動) 取得したデータからグラフを作成する方法 (クリックで移動)PBIと接続できるデータベース、ファイルの種類
PBIに接続できるサービス、ファイルを以下に示します。
非常に多くのデータベース、サービスと接続できます。
主に
- Microsoft Office関連全般…Excel、Access、SharePointなど
- オンラインサービス…SalesForce、Googleアナリティクス、Githubなど
- データベース…Oracle Database、SQL Server Database、SAP HANA Databaseなど
- Webサイトのスクレイピング
また、RスクリプトやPythonスクリプトを読み込むことも可能で、異なるデータベースに販売実績や顧客リスト、担当者一覧などを保存している場合、簡単に接続して分析が可能です。
これらの複数のデータを簡単につなぎ合わせられることがPBIの強みの一つです。
データとの接続方法 (ローカルフォルダのExcel、csv)
今回は一番単純なデータの取得方法について説明します。
例として国内のCOVID-19陽性者と死亡者数のデータを読み込みます。
使用するデータは下記を参考に一部加工して、日別のデータにしています。
2次ソースですが、元データは厚生労働省の発表データのようです。
URL:https://toyokeizai.net/sp/visual/tko/covid19/
手順
1.まずPBIを起動し、データの取得の下矢印をクリックしExcelを選択、開きたいExcelを選択して開く
2.ナビゲーターが表示されるので、取得したいシートを選択 (raw_data)してチェックボックスにチェックして読み込みをクリック
読み込みが完了したら画面左側のデータをクリック、Excelの選択したシートのデータがPBI上に表示されます。
Csvも同様の操作で取得 (csvの場合シートの選択はありません)。
これでデータの取得は完了です。
取得したデータからグラフを作成する方法
データの画面からレポートに戻り、画面右側の視覚化ツールから折れ線グラフおよび集合棒グラフを選択
グラフを選択すると空のビジュアルがレポート上に表示されます。可視化の下部分でどのようなデータでグラフを作成するか選択できます。
縦棒グラフ系の場合 (日別の陽性者数と累計)
1.共通の軸はx軸を意味しています。今回は日付dateの列をフィールドからドラッグします。
各棒の値は棒グラフに表示したいデータを示し、今回は陽性者数を選択しましょう。
列を指定したことでビジュアルが表示されます。
2.このままだとビジュアルは2020年の表示のみなので、dateの横のした矢印をクリックしてdayにチェックすると、階層別表示から単純な日付表示に変更されます (ビジュアルのx軸上で次のレベルに展開でも可)。
※メモ:日付の列は年、四半期、月、日の階層に自動で分かれます。これはPBIで日付を参照する関数が多く、それに使用されるためです。
これでビジュアルも日別の陽性者数に変化しました。 縦棒は横に並べるデータの名称などを入れますが今は空のままでOKです。
3.線の値は折れ線で表示したいデータをドラッグします。今回の場合はCOVID-19累計陽性者数 (testPositive)を折れ線で表示します。
折れ線がシグモイド関数のように患者数が推移していることがビジュアルからわかります。 自粛解除後は頭打ちの状態からまた増加していますね…。
4.このままでは棒も折れ線も青色で見づらいのでデータの色を選択して累計の陽性者数の色を赤に変更しましょう。
書式を変更する場合はビジュアルを選択して、書式をクリックして、データの色やデータラベルY軸の2軸表記など操作できます。
無事2色に分けられたので、縦棒と折れ線の複合ビジュアルの完成です。
横棒グラフ系の場合 (都道府県別の累計と月ごとの内訳)
1.まずはレポート下部のプラスマークで新しいページに追加しましょう。
2.先ほどと同様に今度は視覚化から積み上げ横棒グラフを選択します。
3.横棒グラフの場合、軸はY軸方向で今回は都道府県別なのでprefectureを、値には陽性者数をドラッグしてください。
ビジュアルを見るとやはり東京がダントツで多いですね…。
4.凡例には月monthを入れて各県では何月に多いか確かめます。
東京は4月が圧倒的に多く、7月が二番目に多いことが分かります。先ほどの日別のデータと合わせて分析すると、まだまだ増えることが予想できますね。
作成したビジュアルを変更する
1.先ほど作成した横棒グラフのビジュアルをクリックし視覚化の積み上げ縦棒グラフを選択します。
2.ビジュアルが横棒から縦棒のグラフに変わります。
このように、1クリックで簡単にビジュアルを変更できます。
もちろん変換先のビジュアルによっては列の選択をし直すものもありますが、非常に簡便な操作で行えます。
まとめ
PBIは
- 様々なデータベースから簡単にファイルにアクセスしてデータのインポートが可能
- グラフの作成もビジュアルを選択して列をドラッグするだけでOK
- 一度作ったビジュアルを他のビジュアルに変更可能で手直しの手間が圧倒的に少ない
- 直感的にグラフの作成が行えます。
手元にある手付かずのデータを可視化する事で思わぬ発見やビジネスチャンスを発掘することができるかもしれません。データは可視化する事で分析前の誤った解釈を修正できます。 是非いろいろなデータを取得してビジュアル化してみてください!
コメントを残す