ord1 HandsOn - Fundamental 【Data Saber】 Q11~Q17
さあ、続きを頑張っていきましょう
Q11
4年間を通じて、購入顧客数が最も多い曜日はどれですか?また、その人数は何人ですか?
「曜日(オーダー日)」と顧客数=「個別のカウント(顧客ID)」をそれぞれ行と列に入れたらいいと解釈
「オーダー日」を右クリックしたまま列に入れて曜日を選択
「顧客ID」を右クリックしたまま行に入れて個別のカウントを選択
もう一回「顧客ID」を右クリックしたままラベルに入れて、個別のカウントを選択
Q12
オーダー日の全ての曜日で、利益率が15%を切っている年はありましたか?
「曜日(オーダー日)」と「年(オーダー日)」をそれぞれ行と列にいれて利益率(sum(利益)/sum(売上))を色に入れればいいと解釈(赤色は利益率15%を下回っているから、すべての曜日で赤くなっている年はある?)
計算フィールドを作成してタイトル:利益率、計算式:sum(利益)/sum(売上)を入力する
曜日(オーダー日)と年(オーダー日)をそれぞれ列と行に入れる
作成した利益率を色に入れる
色の凡例の部分をダブルクリックすると色の細かい設定がでるため、そこでステップドカラー:2にし、詳細を開いて、中央値:0.15を記入する
好みでグラフの種類を四角にしたり、マークの詳細に利益率を入れるとより分かり易いグラフになる
計算フィールドについて
計算フィールドは独特の関数を使用しますが、使いこなせればビジュアルの幅が広がります。でもその前にそもそも計算フィールドどこにあるか知らない人もいるので一応説明。
①データソースのすぐ下にある小さい「▼」をクリックするとミニ画面が表示されるので、「一番上の計算フィールドの作成」をクリック
②上の白い四角が項目名になり、その下の広い空間に計算式を入力。どうしても関数がわからないときは右の真ん中にある「▶」をクリックすると関数を検索することができる
色の凡例の変更の仕方
色にディメンションやメジャーを入れると必ず右のところに凡例がでます。
凡例はいろいろと設定できるので覚えておくと便利。
①ステップドカラーは全体を何色で分けるかを決めれる。どっちかはっきりしたいときは2ステップがおすすめ
②詳細をクリックすると開始・中央・終了が入力できる。主に使用するのは中央の値に閾値を入れるとステップドカラーで2色にした意味が生きてくる。
Q13
サブカテゴリ・顧客区分の組み合わせで、割引率が相対的に高いと分類される組み合わせはどれですか。その組み合わせをグループとしてまとめてください。それ以外は「その他」とします。作成したグループごとに売上の伸びと利益率を年月の推移で比較して、割引率を上げるべきか下げるべきか教えてください。
最初に割引率の高いグループとそれ以外の2グループを作成し、その後に「年月(オーダー日)」を列に入れて、さっきのグループと「合計(売上)」と「集計(利益率)」を行に入れて、二重軸にして判断するのがよいと解釈(アンサーを見ると割引率が高いグループは軒並み色が赤い。赤い色は利益率が低いから、、、)
「サブカテゴリ」「顧客区分」をそれぞれ行と列に入れて「割引率」を右クリックしたまま色にいれて「平均」を選択
色の凡例をダブルクリックしてステップドカラー:2にする
色の濃いものが割引率が高いものなので、Ctrlキーを押したまま4つをクリックしていくと小画面が出るので、そこでセットの作成をクリック
新しいシートを作成して、列:「年月(オーダー日)」、行:さっき作成したセット、「合計(売上)」「集計(利益率)」を入れる
「合計(売上)」「集計(利益率)」のどちらか右クリックして二重軸にする
好みでグラフを棒➡線に変えたり、傾向線を入れたりする
Q14
2013年で一番売上が低い月と2015年で一番売上が高い月だけの平均金額は、全月の平均金額よりも高いですか?
「年(オーダー日)」「月(オーダー日)」を列に入れて、「合計(売上)」を行に入れて比べればいいと解釈(全月の平均は4,732,851、二つの頂点を選んだ平均は5,144,919でどちらが高い?)
「年(オーダー日)」「月(オーダー日)」を列に入れて、「合計(売上)」を行に入れる
アナリティクスのタブに移動して、要約-平均線を表の中にドラッグし、テーブルに入れる=全月の平均
Ctrlを押しながら、2013年の一番低い部分と2016年の一番高い部分をクリックする=2つ値の平均
平均線、定数線の入れ方
アナリティクスのタブにある平均線、定数線はほぼ同じ使い方をする。いろいろと使えるけど、今回は入れ方の違いについて説明。
①テーブル
見えてる表全体に平均or定数線が入る
②ペイン
1つ目のディメンションで区切られたごとに平均or定数線が入る
③セル
一番粒度の低いディメンションの値ごとに平均or定数線が入る
Q15
Q14で作成したチャートで年月の売上のトレンドを見ることができるようになりました。さらにブレイクダウンして、各年や月で何(カテゴリ、サブカテゴリ)が誰(顧客区分)に売れたのかをクロス集計表で確認したいです。2枚のシートを組み合わせてチャートをクリックするとフィルターされるダッシュボードを作りたいのですが、一つのマークをクリックしたときに月でフィルターするだけでなく年でフィルターするオプションを選ばせることはできますか?
まずクロス集計表を作り、その後ダッシュボードにQ14のグラフと一緒に表示しQ14を押すとクロス集計表が変わるようにするが、年月と年の2つフィルターをするで解釈
列に「年(オーダー日)」、行に「カテゴリ」「サブカテゴリ」「顧客区分」、ラベルに「合計(売上)」を入れてクロス集計表を作成
新しくダッシュボードを作成し、上にQ14のグラフ、下にクロス集計表を配置する
Q14のグラフ部分をクリックすると現れる×の2つ下のフィルターマークをクリックする=年月フィルターができる
グラフをクリックした状態で一番上にあるコマンド-ワークシートをクリックすると表示されるミニ画面の中のアクションをクリック
アクションの追加を押すと出てくるミニ画面でフィルターを選択
名前に年フィルターと入れて、ソースシートとターゲットシートに作ったダッシュボードを選択
アクションの実行対象をメニューにする
フィルターを選択したフィルターにして、今回は年フィルターなのでソースフィールドとターゲットフィールドを「年(オーダー日)」にする
好みで最初に作ったフィルターの名前を変更する
アクションフィルター
アクションフィルターはデータソースが複数あっても関連性を持たせてフィルターできるので便利だが、基本フィルターにするグラフ=ソースシートは
ターゲットシ-トよりも粒度が荒い方がよい。フィルターは大きいものから徐々に対象を絞っていく感じをイメージする。が、まずは作り方を紹介する。
1-1一番簡単なフィルター作成
グラフをダッシュボードに配置し、グラフ部分をクリックすると現れる枠の端にあるフィルターのマークを押す
※何も設定していないままだとグラフのディメンションと同じ粒度でダッシュボード内のその他のグラフにフィルターするため注意
年のグラフをアクションフィルターに設定した場合、例えば2015年をクリックすると、下の年月グラフも年月日も2015年分だけを表示する
年月日のグラフにアクションフィルターを設定すると、例えば2015年5月25日の値をフィルターすると当然年のグラフも年月のグラフも1個の値しか残らない。これは年グラフも年月グラフも2015年5月25日に該当する値が1個しかないからです。
2-1細かく設定する場合
①ダッシュボードのグラフをクリックした状態でワークシートーアクションをクリック(グラフの指定は無いが、グラフをクリックした状態でないとアクションのクリックができない)
②アクションの追加ボタンを押すとミニ画面が表示されるが、今回はフィルターを選択
③名前は必要であればつける(挿入を押すと、選択した粒度によって可変するフィルター名を付けることも可能)
④ソースシートとターゲットシートは基本同じダッシュボードを選択する
(同じ画面内でないと押した後の変化がわかりづらい)
⑤ソースシートで選ぶグラフはフィルターに使いたいグラフ
⑥ターゲットシートで選ぶグラフは⑤のグラフを押したら変わってほしいグラフ
⑦アクションの実行対象
カーソルを合わせる:カーソルを合わせている間だけフィルターされる
選択:グラフの値をクリックしたらフィルターされる
メニュー:ツールヒントの中に青文字でフィルター名が表示されるので、
その青文字をクリックしたらフィルターされる
シングルクリックのみ:選択を選んだ場合、シングルクリックで変わる
⑧選択項目をクリアした結果(グラフの値のない部分を選んだ時)
フィルターされた値を保持:フィルターされてない状態に戻らない
すべての値を表示:フィルターされてない状態に戻る
すべての値を除外:ターゲットシートで選んだグラフが空白になる
(ソースシートをクリックすれば、フィルターされた状態で表示)
⑨フィルター:複数のデータソースを使用していたり、特定の値だけフィルターしたい場合は選択したフィールドを設定する
Q16
「家具」カテゴリにおいて一番出荷までの平均日数が長い地域に面する地域の中で、最も出荷までに時間がかかる地域を調べてください。その地域の「事務用品」カテゴリでの出荷にかかる日数は何日ですか?
まず日本地図を作成し、地域情報を入れる。カテゴリ「家具」をフィルターに入れて一番出荷日数が長い地域に面する地域の中で一番出荷日数がかかる地域を調べる。フィルター「事務用品」に切り替えて、その地域の出荷日数を調べると解釈(カテゴリ「家具」のときの一番に出荷に日数がかかったのは東北地方で東北地方に面する中で一番出荷日数がかかったのは中部地方、カテゴリ「事務用品」に切り替えたときの中部地方の平均出荷日数は?)
「都道府県」を右クリックして地理的役割:都道府県にする
「地域」を右クリックして地理的役割:次から作成→都道府県にする
フィルターに「カテゴリ」を入れて家具を選択
自動生成された緯度を列、経度を行に入れる
計算フィールドで出荷にかかる日数を作成する(DATEDIFF('day',[オーダー日],[出荷日]))
一番出荷までの平均日数が長い地域に面する地域の中で、最も出荷までに時間がかかる地域を調べたら、フィルターの「カテゴリ」を事務用品にする
Q17
売上と利益の相関を、製品名とカテゴリごとの分布で見てください。クラスター分析を使用して売上が高いグループがどこまでか割り出したとき、売上の高いと思われるクラスターに属する製品名が少ないように見えるカテゴリを教えてください。厳密な個数を比較する必要はなく、目視で確認できるレベルで構いません。なお、クラスター数は自動のまま変更する必要はありません。
列に「合計(売上)」と行に「合計(利益)」詳細に「製品名」で散布図を作った後、アナリティクスークラスターをグラフに入れて、クラスター数2にで作成する。その後にカテゴリを列に入れて売り上げの多いクラスタで製品名が少なさそうなものを選ぶと解釈(ぱっと見、事務用品が少ないように見える)
列に「合計(売上)」と行に「合計(利益)」詳細に「製品名」で散布図を作る
アナリティクスークラスターをグラフに入れて、クラスター数2にで作成
カテゴリを列に入れる