時系列データとは何か
こんにちは。
税理士法人上坂会計 DXメンターチームの笹岡です。
データ分析の文脈の中で、「時系列データ」という言葉を耳にしたことがある方もいらっしゃるかと思います。
今回は、この時系列データについて内容解説をしてみたいと思います。
そもそも、時系列データとはなんでしょうか?
時系列データとは、以下のような特徴を持つデータのことを言います。
時間を表現する項目(年月日、時刻など)を1つ以上含んでいる
時間の幅が固定されている(日、月、年など)
固定された時間幅の単位で集計されている(1カ月合計、年間平均など)
具体例を出すと、売上の月ごとの推移データや、年毎の平均データ、といったものが時系列データと呼ばれるものです。
時系列データを作るためには、点過程データ(トランザクションデータ)が必要となります。点過程データとは、固定された時間幅で集計される前のデータのことです。売上の月ごとの推移データでいえば、販売管理ソフトの売上伝票データが点過程データです。時系列ごとにデータ分析するためには、まずは点過程データを手元に揃えなければなりません。社内で使っているシステムから、点過程データがCSV等で出力できないか、検証してみてください。
点過程データを一定の時間幅(月、年など)で集計して時系列データを作成することで、様々な用途に活用することができます。
代表的な用途として、以下のようなものがあります。
将来の数字の予測
数値の異常検知
顧客のLTV予測
将来の数値予測は、モニタリングしている数値(例えば販売数量など)が将来の特定時点においてどのぐらいあるのかを予測することです。将来の販売数量が予測できれば、それに合わせて生産計画を作成したり、販売員のシフトを決めたりできますので、大助かりです。
数値の異常検知は、数値が普段のものとかけ離れている場合に、それを早急に検知することです。将来の数値予測と同じように特定時点でのあるべき数値を計算し、その計算値と実際値を比較して、どれだけかけ離れているかをリアルタイムで確認することで、異常事態にすぐに気付き、対応することができます。機械のエラー検知がまさしくそうです。
顧客のLTV予測は、特定の属性で顧客分類を行い、分類カテゴリごとに時系列データからLTV(ライフタイムバリュー、顧客が全期間を通してもたらしてくれる利益の金額)を算出します。例えば、店舗顧客の購買データを時系列で集計し分析した結果、30代男性が継続して購買してくれる期間が平均3年で、その間にもたらしてくれる利益金額(=LTV)が10万円だとします。その場合、30代男性の客を獲得するために、1人あたり最大10万円までは広告費用をかけてもペイできるなど、広告戦略に活用することができます。また、3年で離脱する傾向があることが分かったのであれば、最初の購買から3年経った30代男性に対して再来店するインセンティブを与えるクーポン発行をする、といった離脱防止の施策を打つこともできます。
このように、時系列データを基に様々なデータ分析をし、ビジネスに活用することができます。
時系列分析の具体的な手法については、やりたい内容によって様々なので、ここでは割愛いたしますが、気になる方は関連書籍を読まれるか、専門家の方に相談してみてください!
今回の記事が、少しでも皆さんのDXの理解に役立てば幸いです。
弊社でも、企業のDX支援をお手伝いさせていただいております。DXについての相談を常時受け付けておりますので、お気軽にお問い合わせください。
弊社へのお問い合わせは、こちらからどうぞ