見出し画像

マイベストのデータで正月の始まりと終わりを観測していたら1月が終わっていた件

汎用型データ人材の内藤と申します。毎日膨大なデータと戯れながら、素敵なサムシングを良しなに何かできないかを企んでいる者です。特技は草スタンプの時系列データから組織のコンディションを推定することです。

本業はマイベストという会社でデータまわりをまるっとよしなに頑張っています。


前回は入社エントリー兼アドベントカレンダーということでこんな記事を書きました。

https://my-best.com/

今回もマイベストのデータおもろいよ、という話を可能な限り具体的なデータを使ってお伝えできればなと思っております。
※見たよ!というお気持ち表明としてLike押していただけるととても嬉しいので心優しいみなさなよろしくお願いします

今年も無事正月が終わった件

さてさて、突然ですが毎年恒例のビッグイベントであるお正月が無事今年も終了しましたね。そしてみなさんもしかしたら気づいてない方もいらっしゃるかもしれませんが、実は1月はすでに終わっています。こんな調子であっという間に春が来て夏が来てまた年末になってしまうので、うっかり1月をすごしてしまった紳士淑女の皆様はジャネーの法則を思い出して気を引き締めていきましょう。

さて、弊社マイベストのデータを見ていても当然ながら年末はお正月に関する商品群ページの流入が大きく上昇します。そしてデータサイエンティストとして年末休暇中にこのデータを見てニヤニヤしながらお酒を飲んでいたのですが、ふと疑問に思いました。

そもそもお正月ってデータ的にはどうやって定義されるのだろうか?

「お前は正月も知らないのか。正月は1月1日に決まってるだろ!」という声が聞こえてきそうですが、中国では旧正月があるように、「正月」というのは社会の集合知によって決められた日付なわけです。つまりは1月1日なんていうものは人類がつけたラベルでしかなく、データで見たらそこには当然ながら始まりと終わりが定義できるのではないかと思ったわけですね。興奮しますね!

抽象的なことを言っていてもわからんと思うので具体的にデータを使ってお正月を観察してみましょう。

本当に「正月」は毎年来ていたのか?

以下がマイベストの「正月」に関係するセッション数の推移です。

※タイトルや概要、商品説明に「正月」というキーワードが入っているコンテンツを集計した推移

これを見ると高さに違いはあれど毎年確かにほぼ同じ時期にピークが来ていることがわかります。グラフだと細かい日付がわからないので、上記セッション推移の7日移動平均の最大となる日付を抽出してみると、どの年度もおおよそ12/31または1/1になっていることがわかりました。

7日移動平均のピークの日付を抽出

※一応の補足:7日移動平均って何?
上記でそのままの値ではなく7日移動平均というものを使用しています。これは日次の生データだと年ごとにランダムな季節変動が入ってくるため、結構ギザギザしてピークとかが分かりづらくなってしまいます。そこで今回のようなトレンドを把握するような場合は移動平均で滑らかにしてから判断します。少しデータに詳しい人であれば当たり前のことだと思うのですが、意外に生のギザギザのデータでトレンドを判断して重要な意思決定をしていたりする場面もまぁまぁ見るので、このあたりのちょっとしたテクニックとして使えるとデータ知っている感が出せます。

とにもかくにもお正月は過去数年間においては1月1日にちゃんと来ているということがわかりました。これでお正月なんか来てない!という陰謀論に対してはこのエビデンスをもって反論できると思うので是非活用してください。

トレンドの始まりと終わりはどうやって判断するのか?

さて、とりあえずお正月が毎年観測されていそうというのはわかりました。ここから本題なのですが、それではお正月はいつから始まり、いつ終わるのかという問題です
え、そんなの1/1に始まって1/3で終わりなんじゃないの?と思うかもしれませんが、もう一度2024年以降のログに絞って「お正月」をよく観察しましょう。とにかく事象を理解するには観察が大事ですね。

2024年1月以降に注目したセッション推移

遠くから見ると急激なスパイクのように見える波形ですが、よく見てみると実はその波の形には特徴があり、その波には始まりと終わりがありそうであることがわかります。つまりは「お正月」という抽象的なイベントにも始まりと終わりを定義できそうです。やったぜ!

さて、ここでちょっとみなさんに考えてもらいたいのは、トレンドってどうやって判断するのかという、実はビジネスでデータを扱う上で頻出する極めて重要な問いです。

「上昇トレンドが続いており、、」「今は季節トレンドで下がっていて〜」といった話をビジネスマンはよく耳にしますよね。でも、このトレンドや傾向との解釈は個人の感覚でなんとなく決めていることないでしょうか?ビジネスにおいてはこういったトレンドの判断が大きな利益や損失にも関わる重要な判断になる場合もあるので、ちゃんと個人の感覚ではなく可能な限りデータに基づいているほうがいいですね。

トレンドを判断する方法は数多くありますが、時系列データの分析には経済分野の手法を応用するのがよさそうです。その中で最もおおくのビジネスマンが実践できそうなのはゴールデンクロスとデッドクロスという手法です。株やFXなどをやっている人にとってはよく見るやつですね。詳細は以下のようなサイトの説明を参照してくださいませ。

ゴールデンクロスが来たら上昇のシグナルだ!

要は先ほど出てきたような移動平均線の短期と長期のクロスところを見ると上昇だったり下降だったりのシグナルになるよ、ということですね。確かに直感的にわかりやすいですし、名前もジャンプ漫画の技名みたいでかっこいいですね。ちなみに僕はダイの大冒険のヒュンケルのブラッディースクライドが好きです。

さて移動平均線は何日分を平均するのかという問題はあるのですが、そこは割と決めの問題のようで、株などの世界では5日、25日、75日などを使うようです。マイベストの場合はおおよそ7日間くらいで最小のサイクルになっていそうなので、以下では短期を7日、中期は30日として2つの移動平均がクロスしたタイミングに注目して正月の始まりと終わりをデータから観測してみたいと思います。

今年のトレンドをよく見てみる

さて先程の時系列グラフから2024年以降を抽出し、2つの移動平均線にしてもう一度観察してみましょう。

青線とオレンジのクロスするタイミングを注目してください。確かに青線が上回ったタイミングくらいから上昇トレンドが始まり、逆転すると下降していることがわかりますね!ちゃんとトレンドのシグナルとして解釈しても問題なさそうです。

ただしよく見てみると当然ながらゴールデンクロスのタイミングは年間でも複数個存在していそうです。そこで少し恣意的になりますが、ゴールデンクロス、つまり上昇が始まったタイミングは、デッドクロスから逆算して一番はじめのゴールデンクロスということにします。つまり上記のグラフだと10月中旬あたりですね。

正月はいつ始まり、いつ終わるのか

さて上記の定義であるゴールデンクロス及びデッドクロスの日付を抽出したのが以下になります。

過去4年の正月セッションのゴールデンクロスとデッドクロスの日付

まずわかりやすい終わりの方から見ていきましょう。
会社によって異なると思いますが、一般的には正月休みは1/3までだと思われるので1/4が仕事始めだと思われます。ただし2025年の今年は1/4が土曜日であったため、仕事始めが1/6でした。つまりここから解釈するに、お正月の終わりとは一般的な仕事始めの日付またはその翌日くらいといえそうです。まぁそりゃそうでしょ感ありますが、1/3ではないというがおもしろいところですね。

そして最後にお正月の始まりです。
多少季節変動変動はあれど、データから見るとなんとお正月はおおよそ10月くらいには始まっているようです!10月だとちょうど残暑が終わって秋めいてくる時期でしょうか。そんな早い時期から実はお正月の気配は始まっているのですね。確かに年末の旅行の予約、お節の予約などこのあたりから出てくる印象がありますね。ちょい肌寒くなったらもうお正月は始まっているのです!

最後にゴールデンクロスからデッドクロスまでの日数間隔を見てみましょう。

正月トレンドの継続期間

2024年の正月はなぜか始まりが9月からだった影響でちょっと長かったようですが、平均してみるとおおよそ95日間がお正月という感じですね。つまり一年のざっくり1/4はお正月に何かしら脳内の認知リソースを使われているわけですね!

これでようやくお正月の正体がわかりました。データ分析はおもろいですね。

まとめ

さらに細かく今年特に売れた商品とかの分析も見てはいるのですが、長くなりすぎるので一旦このあたりで知見をまとめます。

  • データ的な「正月」は10月から始まり、仕事始めの日まで

  • 正月の期間はおよそ3ヶ月!

  • 移動平均線のクロスする日にちに注目したらトレンドの開始と終わりが議論できるぞ!

とどのつまり、マイベストのデータ面白いよという話

マイベストのデータを見ると様々なトレンドが観測がいけそう、という話でした。今回はわかりやすい「正月」だったのでさもありなん感ありますが、他にも同様の分析観点で今まで捉えられなかったトレンド分析ができそうでして、いろいろな時系列変化を観測してニヤニヤしています。

弊社マイベストはこういったおもろいデータ分析ネタ、つまりはデータをつかった事業貢献の可能性が無限にあるのですが、正直全然分析者のリソースが全く足りていません。

ので、データアナリスト、データサイエンティスト、データエンジニア、諸々のデータ屋の方々是非ご興味ありましたらお声がけください!

https://x.com/njun_data


引き続きマイベストのデータおもろいよ、というのを発信していきたいと思いますので、よかったらLikeを推してくれたら幸いでござい。

マイベストのコンテンツを見ていて分析ネタのリクエストがあればお待ちしております。ではまたインターネットのどこかで!

※求人出しています

いいなと思ったら応援しよう!