見出し画像

データマイニングで得られる4つの知識とは

LTVを上げるためには、CRMは必須になります。
そのCRMを極めるためには、データを分析する必要があります。

本題へ

データを分析するためには、技術が必要になります。
その一番のスキルは、データマイニングです。

データマイニング (Data mining)とは、
大量のデータを統計学などの分析手法を駆使して、
知識を見出すための技術です。

データマイニングという言葉の示す通り、
情報(データ)から有益なものを
採掘(マイニング)できます。

ITビジネスの分野では、
ビッグデータが注目を集めています。

ビッグデータを有効に活用するための手段として、
データマイニングにも注目が集まっています。

ビッグデータの定義は、3Vで語られます。

3Vとは、はやい (velocity)、でかい (volume)、多彩 (variety)
のVを取っています。

他にもCRMで顧客情報を
管理する際にもデータマイニングが使われています。

データマイニングを行うことで得られる知識とは、
どんなものなのでしょうか?

情報を分類すると以下の4つに分けられます。

■データ:整理されていない数値
■情報:データを整理・カテゴライズしたもの
■知識:情報から得られる傾向・知見
■知恵:知識を利用して人が判断する力

これはDIKWモデルと呼ばれています。
下に行くほど実践力や有用性の高いものと判断されます。

ビジネスにおいては、ほとんど、知恵レベルを求められます。

データマイニングで行えるのは
知識を見出すところまでであって、

実際にその知識に有用性があるか否か
どう活用するのかは判断力というスキルにかかってきます。

データの蓄積から分析を生かして課題を
解決するのが、データサイエンスの領域になります。

準備その1: データマイニングの元となるデータの収集
データマイニングを行うために、
まずは実際にデータを収集することが必要です。

一般的には、元となるデータが多ければ多いほど、
有益な情報をマイニングできる可能性が高まります。

そのためデータマイニングに先んじて、
データウェアハウスを設けるケースも多いです。

最低でも800以上のデータが必要です。

データウェアハウスとは
データウェアハウスはまさに情報の倉庫です。
大量のデータを保管するために設けられます。

しかしいわゆるデータベースとは、違います。

データウェアハウスはデータベースとは異なり、
登録されたデータの削除や
更新を原則として行いません。

データウェアハウスは、
データを蓄積することが目的だからです。

準備その2: 収集したデータの加工

収集されたデータは、データマイニングを
行えるように加工されています。

データマイニングはコンピュータシステム
上で行うことがほとんどです。

データマイニング用のシステムに合わせて、
システム上で動作可能な状態へと
加工する必要があります。

特に、数値データや記号データといった
データ形式は、統一する必要があります。

また正確な結果を出すには、クレンジング
してデータを整理整頓する必要があります。
大文字や小文字など、ハイホンありなしなど。


事前に仮説を用意しない機械学習というのがあります。

データの収集と加工が完了すると、
実際にデータマイニングを実施することになります。

さまざまな手法や技術が用いられますが、
代表的なものはAIを活用した機械学習
といわれる手法があります。

機械とはコンピュータのことです。
コンピュータの性能が上がり、
ビッグデータの時代になり急速に発展している手法です。

機械学習は、事前に仮説を
想定する必要がありません。

データの中からコンピュータが
自分で学習しながら相関関係などを導きます。

人ではできない新しい分類を
発見してくれます。

事前に仮説をたてる統計分析
統計学や確率論などを活用した
データマイニング手法です。

代表的な統計手法は回帰分析・主成分分析・因子分析
などがあります。

統計分析では多くの場合、
事前に仮説をたて、必要なデータを集め
検証したい課題や事象に合わせて
適切な分析手法を選定して分析します。

分析結果を人が読み解き、
このサイクルのPDCAを繰り返し実行します。

追伸
詳しくは、ミニマム通販の全貌より


インターネットを活用して自分の商品・サービスを売りたい! でもなかなか売れずにモヤモヤしている問題を解決する アドバイスをしています。 https://www.youtube.com/channel/UCxrQWY0HlXqFcOfe02_uztg/videos