ニューラルワークスによる時系列予測モデル開発におけるデータ構成
ニューラルワークス Predictとニューラルワークス Professional II/PLUSは、ともに時系列モデルの構築に使用することができます。
どちらの製品も、時系列データに対して、明示的な操作手段を提供しているわけではありませんが、それらを取り扱うための方法があります。
次に続くデータの例を考えましょう:
Excelインターフェイスでニューラルワークス Predictを使用する場合、入力データ、出力データの範囲に対して、行列で選択することができます。
’temp-9’から’flow-7’を含むセル群が、「最初の入力データレコード」となり、’yield-6’が最初の出力データセルとなり、’temp-0’(もっと正確に言うと’temp-2’セル)が「全ての入力データ範囲」となります。
ニューラルワークス PredictのコマンドラインインターフェイスあるいはProfessional II/PLUSデータファイルを使う場合には、入力と出力の組みが1行になっている必要があります。
したがって、上記データファイルは、それらのインターフェイス用には以下に示されるような形になっていることが必要です:
*********************************************************
temp-9, psi-9, flow-9, yield-9, temp-8, psi-8, flow-8, yield-8, temp-7, psi-7, flow-7, yield-7, yield-6
temp-8, psi-8, flow-8, yield-8, temp-7, psi-7, flow-7, yield-7, temp-6, psi-6, flow-6, yield-6, yield-5
temp-7, psi-7, flow-7, yield-7, temp-6, psi-6, flow-6, yield-6, temp-5, psi-5, flow-5, yield-5, yield-4
temp-6, psi-6, flow-6, yield-6, temp-5, psi-5, flow-5, yield-5, temp-4, psi-4, flow-4, yield-4, yield-3
temp-5, psi-5, flow-5, yield-5, temp-4, psi-4, flow-4, yield-4, temp-3, psi-3, flow-3, yield-3, yield-2
temp-4, psi-4, flow-4, yield-4, temp-3, psi-3, flow-3, yield-3, temp-2, psi-2, flow-2, yield-2, yield-1
temp-3, psi-3, flow-3, yield-3, temp-2, psi-2, flow-2, yield-2, temp-1, psi-1, flow-1, yield-1, yield-0
temp-2, psi-2, flow-2, yield-2, temp-1, psi-1, flow-1, yield-1, temp-0, psi-0, flow-0, yield-0, yield+1
*********************************************************
時系列予測において、全ての入力変数を使用してPredictを使用しようと考えれれるかもしれません。そのとき、どの変数が捨てられるかのテストを行うことにより、どの入力が出力に大きな影響を与えるかへの洞察が得られ、タイムラグに関するアイデアが得られることでしょう。
一般に、時系列データから入力列を導くことの方がよりよい結果を与えますので、時系列データの代わりに、計算されて導かれた入力を用いてください。
たとえば、2点移動平均、5点移動平均、10点移動平均の方が、時間のダイナミクスをよりよく捕らえることができます。もしそうであるならば、モデル構築に元のn時間ステップを用いるよりも、それらの3フィールドを使用するべきでしょう。
概して、上記のアプローチは3期間移動平均によるアプローチに似ていますが、我々は、単純平均モデルではなく、次の時点を予測するためにニューラル・ネットワークを使用できます。
弊社では、データ分析プロジェクトにまつわる様々なご相談に、過去20年以上に渡るプロジェクト経験に基づき、ご支援しています。
社内セミナーの企画等、お気軽にご相談いただければ幸いです。