見出し画像

文系が知りたいBIツール:[02] データの加工方法(Tableau Prep Builder vs. Power BI)

Tableau Prep Builderでのデータ加工:その1

★データの加工は、Tableau Prep Builderでの方法を最初にご紹介します。
その後、Power BIでご紹介します。その際、Tableau Prep Builderと比較できるところは比較してご紹介予定です。
★データの加工方法はここで紹介している限りではありません。できるだけ、効率よい方法を共有したいとは思っておりますが、他にもっと効率よい方法があるかもしれません。それを念頭に入れながら読んでいただけると幸いです。


「文系が知りたいBIツール:これから使用するデータの紹介」で、サンプルとして使用するデータを紹介しました。その際、『医療費と商業動態を都道府県で結合させる』と書きました。
それが以下のデータになります。

フィールド名(カラム・列)の紹介

2022年医療費:以下フィールド名(9カラム)

  • 都道府県No.

  • 医療費総額

  • 医科計

  • 医科入院

  • 医科入院以外

  • 歯科

  • 調剤

  • 訪問看護療養

  • 医科入院外+調剤

商業動態=2020年~2022年のコンビニ、ドラッグストア、ホームセンター:以下フィールド名(5カラム)

  • 都道府県No.

  • data種類(店舗数 or 販売額というフラグ)

  • 2020年(店舗数と販売額)

  • 2021年(店舗数と販売額)

  • 2022年(店舗数と販売額)

「2022年医療費」は特に加工する必要はないです。ですが、「商業動態」のデータは加工が必要です。こちらを加工した後に「2022年医療費」のデータを結合させることになります。

ユニオンを実施する=複数のテーブルやデータセットを縦に連結する操作

「商業動態」はコンビニ、ドラッグストア、ホームセンターそれぞれの1シートに2020年から2021年の『店舗数』と『販売額』が含まれています。(以下の画像を参照のこと)
そのため、『店舗数』の情報と『販売額』の情報に分割して、且つ、2020年から2022年の3列もにユニオンしましょう。
"ユニオン"とは、縦に連結する操作です。
ちなみに横に連結するのが、"結合"です。

店舗数と販売額のデータ

今回、皆さんと共有するデータ加工の操作のイメージは、以下の通りです。上の画像の赤線で囲った『店舗数』を例に挙げます。

  1. この作業の目的は、"[都道府県No.]と[data種類]、[年]、[店舗数]の列を作成する"  になる

  2. 前述した1を作成するために上の画像の赤線で囲ったA列、B列、C列を残し、新たに[年]のフィールドを作成する。C列のフィールド名は[店舗数]に変更する

  3. 次にA列、B列、D列を残し、新たに[年]のフィールドを作成する。D列のフィールド名は[店舗数]に変更する

  4. 続いて、A列、B列、E列を残し、新たに[年]のフィールドを作成する。E列のフィールド名は[店舗数]に変更する。

  5. 上記の2~4をユニオンで縦に連結する

いかがでしょうか。
操作する流れを整理することができましたでしょうか。
最終的には、2020年と2021年、2022年のテーブルが出来上がり、ユニオンで縦に連結することになるのですが、フィールド名が同じであることが大事になります。

なお、上記の操作が終わりましたら、『販売額』も同様に作成し、
『店舗数』と『販売額』のデータを、今度は、結合します。
そうすると、最終的に"[都道府県No.]と[data種類]、[年]、[店舗数]、[販売額]” と5つのフィールド(列)のデータとなります。

それぞれの加工が終わりましたら、最後にコンビニ、ドラッグストア、ホームセンターのテーブルもすべてユニオンで連結し、一つのテーブルにします。
「data種類」で何のデータか判別がつくので、連結したほうが集計しやすいと思います。

Tableau Prep Builderでデータ加工

それでは、早速、Tableau Prep Builderにデータを接続しましょう。
下記の画像は、「☆Raw_Data_Final.xlsx」を接続したTableau Prep Builderになります。
※ロウデータにある「ラベル」シートは今回は使用しません。

Tableau Prep BuilderにExcelファイルを接続させる

『コンビニ』のデータを加工しよう!

Tableau Prep Builderのフローに『コンビニ』と書かれたアイコン(テーブル)をキャンバスにドラッグしてください。(画像に書かれている通りw)
下記画像のようになります。
※Tableau公式サイトでは、こちらが詳しいかも。598ページもあるヘルプPDFがDLできます。

ドラッグアンドドロップ

他の『ドラッグストア』や『ホームセンター』も同じようにドラッグアンドドロップすると、以下の画像のようになります。

3つのテーブル

ステップを作成してテーブルを分割しよう!

次に『コンビニ』のステップを作成します。
最初のステップからいきなり加工することも可能ですが、私は、経験上、最初のステップは何も加工しないでそのままの状態にします。(以下の画像の「オリジナルのデータは残しておく」です)
なので、2番目のステップから加工開始します。
2番目のステップでは、『販売額』と『店舗数』の2つのテーブルを作成します。
※最初にご紹介した画像「店舗数と販売額のデータ」を思い出してください。

テーブルを2つに分割する

コンビニの『販売額』のテーブルを作成する

『販売額』のテーブルを作成する際は、『店舗数』の情報が不要になりますので、削除します。『店舗数』のテーブルを作成する際は、『販売額』の情報を削除します。

フローのキャンバスで作成した『販売額』のステップをクリックするとのキャンバスの下に『販売額』を構成しているデータが表示されます。
その中の『店舗数』のデータは不要ですので、削除します。削除方法は以下の画像を参照ください。

『店舗数』のデータを削除する

『店舗数』のデータを削除すると以下の画像のようになります。
おっと!すべてのフィールド名に「1」がついてますね。これは、Tableauの仕様なのですが、同一のフィールド名がある場合にオリジナル以外はナンバリングされます。ここで言うと『店舗数』のフィールド名がオリジナルですので、『販売額』のフィールド名には「1」がついてしまいます。
この「1」は後で纏めて削除しますので、今回は操作しません。

『販売額』のテーブルが出来上がったので、次に、2020年から2022年の3つの年代別のステップを作成し、フィールドの加工を始めます。

『販売額』テーブル誕生!

年代別のテーブルを作成する

以下の画像を参照ください。
年代別のステップを作成します。(画像の赤い枠です)
その後、先ほど『販売額』テーブルから『店舗数』の情報を削除したように不要なフィールドを削除していきます。(画像の緑色の枠から紫色の枠です)

『2020年』のステップでは、『2021年 1』と『2022年 1』のフィールド(販売額)は不要ですので削除します。
『2021年』のステップでは、『2020年 1』と『2022年 1』のフィールドを削除し、『2022年』のステップでは、『2020年 1』と『2021年 1』のフィールドを削除してください。

年代別のテーブルを作成

『年』というフィールドを新規で作成する

年代別のテーブルが出来たら、新規で『年』というフィールドを作成します。
「いよいよ、LOD 表現か!」と思ってらっしゃる方がいたら、ごめんなさい。😅
私は、最も楽な方法をで対応します。

以下の画像を参照ください。
既にある『data種類1』というフィールドを使用します。
これを複製し(画像の緑色枠)、『data種類-1-1』を作ります。
その後、『data種類-1-1』のフィールド名を『年』に変更し、『コンビニの販売額』とある値を『2020』と変更します。
※値が変更できることで、Tableau Prep Builderの利便性を感じてもらえると思っています。

新規のフィールドを作成

以下の画像のようになります。真上の画像と色を合わせている緑の枠から、変更したものが赤枠の情報になります。(少しわかりづらいかも。そうだとしたら申し訳ないです)
紫色の枠は『2020年 1』というフィールド名を『販売額』に変更したことを示しています。

値やフィールド名の変更

上記の操作を各年代で実施すると、年代別のステップが、以下のようなテーブルになります。

年代別テーブル

ここで、フィールド名に「1」がついている問題を解決しましょう。
3つ目のステップ『販売額』に戻ります。
以下の画像の手順で「1」を削除していきましょう。

フィールド名の不要な情報を削除する

他にも名前の変更方法はあるのですが、フィールド名の変更であれば、「リストビュー」にして変更すると、間違いが少ないと思っています。
(フィールドが多いと混乱することも多々あるので)
変更したいフィールド名の右端にある『・・・』を右クリックして、操作します(以下の画像の緑色の枠)
変更した結果が、紫色の枠線になります。

リストビューを活用する

実は、前のステップに戻って実施した理由があります。
年代ステップより前のステップで名前の変更を実施すると、年代ステップの名前も自動的に変わってくれるのです。
何て、便利なんでしょう……🤣

名前の変更の影響

『販売額』の2020年から2022年のテーブルが完成したら、それらをいよいよユニオンします。
が、今回の記事はとても長くなりましたし、キリも良いので、ユニオンは
Tableau Prep Builderでのデータ加工:その2
でご紹介します。

Tips:変更履歴も便利です!

この回の最後にTips!です。
ステップで加工した変更履歴(変更内容ペインの注釈)が左端にあります。
グラフィックソフトにあるレイヤーのようなものです。
変更履歴から削除したり、修正したり、履歴の順番を変えたりなどの操作が可能です。
こちらも便利なのでチェックしてみてください。

Tips1:変更履歴


Tableau Prep Builderでのデータ加工:その1は、いかがでしたでしょうか。
ステップの操作からフィールドの削除や名前の変更、値の変更、新規フィールドの作成にフィールドの複製をご紹介しました。
皆さんのお役に立てば幸いです。

なお、この記事が参考になった!という方は、
記事の下部にあるサポートボタンを押して、寄付していただけると幸いです。
寄付は100円から可能です。ご検討いただけると幸いです。

※お問い合わせは、フォームをご利用ください。
※当サイトの情報を転載、複製、改変等は禁止いたします。

いいなと思ったら応援しよう!

Watanabe
記事を読んでくださって、ありがとうございます。 ご支援いただいた資金は、BIツールなどの契約継続に活用させていただき、更に皆さんのお役に立つ記事を書いています。