Googleアナリティクスだけがデータ分析ではありません!
ビッグデータ時代の到来により
企業は自社のビジネスをより
有利に展開するため、
膨大な量の情報を
収集、分析、活用することが可能になりました。
そんな中、データマイニングを使って、
業務改善に役立つKPIを
出してくれと言われても・・・・
本題へ
データマイニングとは、膨大なデータから
有益な情報を発掘する技術です。
手法の意パン的な総称がデータマイニング
です。
知識や内包するルールなどをマイニングすることになります。
飛躍的なマシンパワーの増大、
ネットワークの拡大やSNSなどのオープンデータの増大に
よって、情報収集や保持コストが低下しています。
多様な質、種類を含む膨大な量の情報、
つまりビッグデータを企業だけではなく個人が収集し
分析することを可能にしました。
もっとも、扱える情報量が膨大ということは、
その中のノイズもまた膨大という意味でもあります。
そのため、データマイニングを行う前には、
分析の基礎となるデータからこのノイズを
取り除く作業が必要です。
細かいお話ですが、
例えば、
電話番号の桁を半角にするのか?全角にするのか?
苗字と名前にスペースを入れるか否か
などがそれに該当します。
収集した情報をデータマイニングに
使える形のデータに整えると、
ようやくデータマイニングを始めることができます。
仮説を構築する等の下準備の作業もとても面倒ですが、
必須事項になります。
また、人間の力だけではなく、
機械の力でもデータマイニングに可能になりました。
最近では数値型データだけでなく、
テキストデータなども
データマイニングの対象となっています。
そして、データマイニングでできるは
大きく分けると3点になります。
1)データ分類を行う
2)データの関連性を見つけ出す
3)事象の発生確率を予測する
です。
例えば自社の新製品の
マーケティング戦略を立てる際、
根拠となるデータを得る等の目的で、
データマイニングを実施することが多いです。
データマイニングを行う際に
使用する分析手法は複数あり
どの手法を使用するかは
分析目的によります。
よく使われる分析手法には、バスケット分析
回帰分析・決定木分析・クラスター分析
で、これらの手法は通常、組み合わせて使われます。
バスケット分析とは、
データ同士の関係性を分析できます。
どの商品とどの商品をどのような
顧客が同時に購入したかを分析する手法です。
デジタルマーケティングでは、
ECサイトで、レコメンド機能に
応用をきかせることができます。
データを分類できるクラスター分析を
共有いたします。
クラスター分析は、
・階層クラスター分析
・非階層クラスター分析
の2種類にわけられます。
階層クラスター分析は、
最も似ている組み合わせから
順にまとめていくことが
クラスター化する方法です。
一番の長所は、近いものから
順にまとめるため、クラスター数を
事前に決めずに済むことです。
しかし、分析対象が数十個以下で
なければ結果が不明瞭なので
ビッグデータの分析には向きません。
このように何をどのような方法で
組み合わせるかを少し学習が必要です。
しかしながら、経営上KPIを決定する上においては
重要な役割をデータマイニングは担うことも
可能になるので軽視はできません。
追伸:#ビッグデータの活用法 西村公児