見出し画像

「二つの山」統計手法の選択


夏の午後、佐藤スズは家電メーカーの会議室でノートPCを開き、画面に映るヒストグラムをじっと見つめていた。宇宙環境工学を専攻する大学3年生のスズは、夏季インターンとしてこのプロジェクトに参加していた。新型家電「インテリライト」の販売戦略を立てるため、過去の市場データを解析して需要予測を行うのが彼女の役目だ。

「インテリライト」は、省エネ設計を売りにしたスマート電球だ。明るさや点灯時間を使う人の生活パターンに合わせて自動調整する機能を持ち、少ない電力で効率よく照明を確保する。最近は家庭向けの電力節約プランやエネルギー効率が注目されており、この製品もその流れに乗った形で登場した。

だが、スズの感じる違和感は消えなかった。
「これ、どう見ても正規分布じゃないよね…。」

スズの目の前に表示されたヒストグラムは、一つの山が中央にそびえる滑らかな正規分布ではなかった。二つの山が並ぶ「双峰分布」だ。

「佐藤さん、どうや? そろそろ需要予測モデル、できそうか?」
声をかけたのはプロジェクトリーダーの藤川だ。40代のベテラン社員で、経験に裏打ちされた自信を持つ人物だった。

「あの…このデータなんですけど、正規分布に適合していないと思います。QQプロットも試したんですが、かなり外れていて…。正規分布を仮定して回帰分析するのはリスクがあるかもしれません。」

藤川は少し驚いた表情を見せたが、すぐに軽く笑った。
「正規分布? そんなん別に気にせんでええんちゃうか? これまでのやり方で特に問題なかったしな。」

「でも、残差が偏る可能性があって、モデルの精度が落ちるかと…。」

「まあまあ、気楽にやったらええやん。こういうのはな、これまで動いてたもんをそのまま使うほうが楽やねん。」

スズはそれ以上反論できなかった。自分の考えを伝えることの難しさを痛感しつつ、何とか別の方法を模索するしかないと思った。


販売開始から一週間後、スズの予感は現実になった。

「売上が思ったほど伸びてないんや…。」
藤川は会議室で集計結果を見ながら頭を抱えていた。ターゲットにしていた都市部の若年層での売上が予測を大幅に下回ったのだ。一方で、地方の高齢者層からは想定以上の注文が殺到し、物流が混乱しているという報告が相次いでいた。

「なんでこうなるんや…。若い人がメインターゲットやったんちゃうんか?」

その言葉を聞いたスズの頭の中で、ある仮説が浮かんだ。「やっぱり、あの双峰分布の特徴が原因だ…。」


翌朝、スズは市場データを都市部と地方、若年層と高齢者層で分類し直し、双峰分布の意味を探った。そして、彼女は二つの独立した需要層を発見した。

一つの山は都市部の若年層。もう一つの山は地方の高齢者層。それぞれが異なる購買傾向を示しており、一つの回帰モデルで全体を説明しようとしたことが失敗の原因だったのだ。

「やっぱり…。これを分けて解析しないと。」

スズは混合モデル(GMM)を用いてデータを解析し直した。モデルを再構築すると、それぞれの需要層に特化した予測が可能となり、残差の偏りも解消された。


藤川に再分析の結果を伝えた時、彼の反応は驚きだった。

「ほんまかいな? そんな手法があるなんて知らんかったわ。」

「正規分布が前提にならない方法なんです。二つの異なる市場を分けて解析するので、予測がより正確になります。」

藤川は考え込むようにうなずいた後、「これは重要な発見やな。リーダー陣にも説明してくれへんか?」と提案した。

数日後、スズはプロジェクトチームのリーダー層に向けてプレゼンを行った。双峰分布の特徴を視覚的に示し、新たなモデルが売上予測を大幅に改善することを説明すると、リーダーたちは次々に頷いた。

「ええ提案や。この内容を役員会に報告する。」


後日、役員会での報告を経て、新たな販売戦略が実行に移された。地方の高齢者層をターゲットにした広告キャンペーンが展開され、物流も見直された。売上は次第に回復し、最終的には予測を上回る成果を上げることができた。

スズは帰り道で夜空を見上げた。「データがきちんと語る声を聞く。それが大事なんだ。」

この経験を胸に、彼女は次の挑戦に向けて新たな一歩を踏み出すのだった。



いいなと思ったら応援しよう!

天乃零(あまの れい)
もしこの物語が少しでも楽しんでいただけたなら、応援の気持ちをチップでいただけるととても嬉しいです。いただいたご支援は、さらに良い作品を作る力になります。どんな小さな気持ちでも、心から感謝いたします! 零