DATA Saberを目指す物語(Day5_その2) Ord9編
引き続きOrd9に挑戦中。
気持ちOrd8よりは難しくはないかもと思ったが、
これはどうすれば?という問題があったので
メモ書き程度に紹介する。
出荷にかかる平均日数を週単位の推移で見せてください。社の方針として上方管理限界線(UCL:Upper Control Limit)を3σとして管理しているのですが、
Q8-1: この限界を突破して配送が遅延した週は何回ありましたか?
Q8-2: その週の配送先の市区町村を確認し、問題が起こった原因について調査してください。
こちらの問題はKTさんの動画や他のブログを参照頂ければと思います。
最終的には以下のように、標準偏差が3を超えてしまっている週で
どの地方が出荷が遅いのか分かればOK。
ただし、とあるブログ様の動画を参考に作成すると
一部の設問に答えらないことが分かった。
具体的には「出荷にかかる日数が多くかかっている市町村は、
果たして全国でも最もかかっているのか」どうかが回答が出来ない。
どういうことか説明すると、ブログ様の紹介通りに
出荷にかかる日数と市町村および地域との関係性を示してみる。
試してみれば分かるが、これだと降順しても並び替わらず
さらに最も日数がかかっていた富田林が4.130と
Q8-1の回答と一致していないことが分かる。
そのためKTさんと同じようなシートを作成しないといけない。
色々と試行錯誤を繰り返して何とか作成出来たのでご紹介。
「出荷にかかる日数」を行に追加し、不連続、メジャーを平均へ変更。
※出荷にかかる日数は以下の計算式で出せる。
都道府県、週(オーダー日)も行へ追加する。
するとよくわからない状態にはなるが、いったんはこれでOK。
あとは平均 出荷にかかる日数の並び替えをデータソース順に
チェック入れる。
すると以下のように、各地方の出荷にかかる日数が出てくる。
Ord9まで来たとしても操作方法が身に付いていなかったり
理屈がまだ分かっていないことが多い人も居ると思うので(私もその1人ですが)私と同じように迷った人に参考になれば幸いです。
この記事が気に入ったらサポートをしてみませんか?