AIによる需要予測に必要なデータの種類とは?集め方についても紹介
人々がスマホを片手に生活するようになり、SNSへの投稿が活発になるなどして、企業は様々なデータを取得できるようになりました。 そうしたデータを需要予測をはじめとしたビジネスシーンに活用しようという動きが強まっています。
需要予測とは、市場において「会社の商品やサービスがどれくらい売れるか」「在庫がどれくらい必要になるのか」などを、予測することです。
この記事では、その需要予測を行うにあたり、どのようなデータが必要となるのかについて説明します。 また膨大な量となるビッグデータを扱うに当たって、欠かせないAIについての活用についても触れていきます。
需要予測に必要なデータ種類
需要予測に必要となるデータには、どのような種類があるのでしょうか。
その代表的な例について紹介します。
■時系列データ
時系列データとは、一つの項目について時間に沿って集めたデータのことです。
時間に沿った変化を分析できることが特徴です。
時系列データを分析する際には、季節による変動などに注意する必要があります。
例として、個人の身長のデータなどの折れ線グラフがあげられます。ほかにも株価、気温などに、よく使用されているデータです。
■コーホートデータ
コーホートデータとは、生まれた年ごとに記録し、経過時間に沿って集計したデータです。人口や就業率の推移を、世代ごとに比較・分析することが可能です。つまり同一世代を集団で追跡することによって、世代による変化を分析することができるデータです。
出生コーホートデータからは、その世代ごとの年齢別初婚率・出生率などを導き出すことができるため、世代ごとの傾向を読み取ることができます。
■パネルデータ
パネルデータとは、同一の対象を継続的に観察し、記録したデータのことです。
とあるA企業(同一企業)の従業員数、売上金額、仕入額を継続的に記したデータがそれにあたります。
需要予測に必要なビッグデータとは
ビッグデータとは「様々な形式の、様々な種類データ」のことを指し、通常のデータ管理ソフトでは処理が困難な膨大な量のデータを指します。ビックデータはデータの量(Volume)・データの種類(Variety)・データの速度(Velocity)」の3つの「V」から成り立っていると言われています。
ビッグデータは「構造化データ」と「非構造化データ(半構造化データ)」の2つに区分されます。
【補足】データは、以下のように分類されることもあります。
・数字で表すことのできる「定量データ」
・どう感じたかという数量的に判断が難しい「定性データ」
・SNSのように流れ去ってしまう「フローデータ」
・アーカイブされて蓄積される「ストックデータ」
■構造化データ
構造化データとは、文字通り構造化されているデータです。
ExcelやCSVファイルに代表される、「列」と「行」のあるデータのことです。このように整理されているため、集計・比較が行いやすい特徴があります。
データの解析・分析に最も適した構造をしています。
ERP(Enterprise Resources Planning)といった企業活動に欠かすことのできない「基幹系情報システム」や、SCM(サプライチェーンマネジメント)という原材料が調達されてから商品が消費者に渡るまでの生産・流通プロセスに多く使用されているデータ形式です。
■非構造化データ(半構造化データ)
一方、非構造化データとは、データベース化できない検索や集計、解析に不向きなデータのことを指します。Eメール、Word・Excel・PowerPoint・PDFなどの文書、音声、画像、動画などのデータ(ファイル)のことです。
データ単体で意味を持ち、用途も異なります。企業で扱われているデータの大部分が、この非構造化データと言っても過言ではないでしょう。なぜなら、人とのコミュニケーションには、これらのデータ活用が業務に組み込まれているためです。
続きは以下、MatrixFlow記事をご覧ください(無料で閲覧できます)。
MatrixFlowでは一緒に世界を変えるAIプラットフォームを作る仲間を募集しています!!