販売数量のスケールが異なる商品群を1つのモデルで表現するには?
小売店の商品の販売予測などでは、商品毎(あるいはSKU単位)の販売予測モデルを構築することが求められますが、近年では定番商品ではない商品のライフサイクルも短くなり、個別にモデル化できる十分な学習データを利用できないケースが多々あります。
そのような場合、商品属性(および販売トレンドとしての過去実績値)を説明変数として複数の商品をまとめたモデルを構築します。
その際に気をつけていただく必要があるのは、販売数量の多い商品と販売数量の少ない商品が混在する場合の評価です(例えば単価が安い売れ筋商品で1か月に100万セット、高価で販売数量が100セット以下など、桁数が大きく異なる場合)。
通常のように平均誤差を最小にするモデルを求めると、商品単位で見た場合、販売数量の多い商品の誤差率は非常に低い一方で、販売数量の少ない商品の誤差率は逆に非常に高い偏ったモデルが得られます(業務では一般に誤差値よりも誤差率で評価します)。
このようなケースでは、教師データとして与える販売数量の変数を対数変換(Log10)して扱うのが有効です。対数変換することで数値のスケールが同等となり、数量の大小に関係なく、一つのモデルで取り扱うことが可能となります。
弊社では、データ分析プロジェクトにまつわる様々なご相談に、過去20年以上に渡るプロジェクト経験に基づき、ご支援しています。
社内セミナーの企画等、お気軽にご相談いただければ幸いです。