PowerBI入門
PowerBI 王子の清水優吾さんの書籍が出たのでPowerBIに興味があったので買ってみました!
BIの目的はデータを可視化することではありません。可視化は手段であり、その目的はユーザーに意思決定可能なネクストアクションの機会を提供すること。経営手段の仕組みづくり。
JSONやXMLからテーブル形式へ変換しなければならない。ETL (Extract 抽出、Transform 変形・変換、Load 読み込み)と呼ばれる処理のTransformにあたる。
セマンティックデータモデルの構築(業務的に意味のあるデータモデルを構築すること)が可能なツールはモデルベース型(model-based tool)と呼ばれる。1つまたは複数のデータソースを読み込んで最終的に1つのテーブルに集約するようなその他のBIツールはレポートベース(report-based tool)と呼ばれる。
BIとは何かの共通事項
知りたいこと、興味・関心。状況によって興味・関心は変わる。興味・関心のあることを人は知りたい。
一目でわかること。電光掲示板のようにパッとみて誰でも分かるようになっている。
ネクストアクションがある。見た人のその情報によって左右される次の行動(ネクストアクション)がある。判断しなければならないことがある。
BIとは、「あなたが興味・関心のあることをやり、その経験から知恵を得ること」または「その経験から得た知恵」
決まったタイミングで見るデータ、分析目的のレポート。「締め」処理の対象となるデータ。分析目的のデータ。業務で必要とされているレポートの9割がこのタイプ。
Power Queryエディターの上部にグラフが表示される。デフォルトではオフになっているため、リボン[表示] - [データのプレビュー] にある [列の品質] と [列の分布]にチェックを入れる。
PowerBIには、日付(Date)型、日時(DateTime)型の列を見つけると、自動的に内部で日付テーブルを作成するタイムインテリジェンス機能がある。自動で日付テーブルが作成されると、年/四半期/月/日という階層が作成される。
PowerQueryエディターでデータを編集しても、データソースには影響を与えない。データを読み込んでコピーしているので、元のデータには影響を与えないようになっている。
PowerBIのモデルでは、2つのテーブル間で有効なリレーションは1つのみ。
値の置換をする。例えば、ハイフン( - ) を不明と置換したりして、分かりやすいデータにする。
日付テーブルに必要なのは、日付の抜けがなく、日付が一意になっているテーブル。365行以上は必要になる。連続した1年分が揃っていれば良い。
行数をカウントする、COUNTROWS関数
PowerBIのグラフは、日付テーブルとのリレーションが適切に設定されていれば、軸に日付を指定することで、値は日付ごとに集計される。累計値もDAXで表現できる。
1週間の間隔は6を指定して集計をする。前週との比較は-7で比較できる。
円グラフの凡例はデフォルトだと右中央が、左中央に変更した方が見やすい。不要な軸のタイトルは非表示にする。情報の取捨選択を厳密にする。ノイズになりそうなものはとにかく無くす。引き算で考える。
スケジュール更新は、デフォルトだとオフ。PowerBI Proだと8回/日が上限。PowerBI Premiumは、48回/日が上限。更新が始まる時刻を指定する。集計に時間かがかかるため、何回かやって調整するといい。
できあがるデータモデルは、そのデータのビジネスを表している。データモデリングは、ビジネスアナリストやビジネスユーザーの仕事。
覚えるのではなく、考える。
PowerBIにおいて、テキストが表示できるということは、データを表示できることを意味する。文字列に値も一緒に表示して便利なタイトルなどつけられる。
色の指定、フィールドに基づいてルールベースで色の指定ができる。信号のイメージなどできる。
PowerBIの入門に、概念からわかりやすく書かれていて、とても参考になります。PowerBIでなくてもBIについての概要も把握できるので、一読するとレベルが上がると思います。BI入門には、とてもおすすめの1冊です。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?