技術士(経営工学・情報工学)が教えるDX(デジタルトランスフォーメーション)講座35デジタライゼーション(③SoI)の実践-Excel散布図だけでできるデータサイエンス-
SoI-分析のためのシステム-と言うと、難しそうな感じがしますが、実はExcelだけでもできることが多くあります。それどころか、今後のバージョンアップにおいて、AIの組み込みやPython関数の追加など、ExcelがSoIにおける重要ツールとして活用されることが予測されます、
しかし、最新バージョンの登場を待たなくても、Excelには昔からデータ分析のための機能が豊富に用意されています。今回はそうした今すぐにでもできるExcelの散布図を使ったデータ分析の方法についてご紹介したいと思います。
散布図は二つのデータの値をX座標、Y座標として点描画したグラフであり、二つのデータの関係性を視覚的に確認することができます。ビジネス用途でよく使われる場面としては、二つの商品の売上金額の時系列データを比較することによって、商品間に関連性があるかどうかを見るというものがあります。
アマゾンや楽天で買い物をするとき、「この商品を買った人はこちらの商品も買われています。」というお勧めメッセージ(レコメンデーション)が表示されるのも、この商品間の関連性分析にもとづいています。
商品間の関連性分析のことを統計学では相関分析と呼んでいます。そして、その関連性に順序―因果関係―がある場合は回帰分析と呼びます。散布図は関連性を比較する対象データが二つの場合だけ、相関分析にも回帰分析にも使うことができます。比較する対象データが三つ以上の場合は散布図で描画することができないため、「データ分析」というアドオンの中の相関分析、回帰分析という分析機能を使うことになります。
散布図で相関分析する場合は、描画された点が右上がりか右下がりの傾向があるか、バラバラに散らばっているかで判断することができます。右上がりの場合は、「正の相関」といって、片方が上がるともう一方も上がるという関係、右下がりの場合は、「負の相関」といって、片方が上がるともう一方は下がるという関係、バラバラに散らばっている場合は二つのデータの間には関係はないということがわかります。
散布図を使えば、二つのデータの間に何らかの関係があるかどうかを簡単に調べることができます。難しい高度なデータ分析に時間をかけるよりも、散布図による相関分析をスピーディーかつタイムリーに行うことによって、チャンスやリスクをすばやく察知することができるようになります。
商品間の同時購買性だけでなく、広告回数と売上金額、天候や気温と来客数、顧客満足度とリピート率など、ビジネスにおいて相関分析が活躍する場面は多いはずです。Webマーケティングにおいてもランディングページのページビュー数とコンバージョン率やリファラーごとの流入数と直帰率など相関関係をみるべきことは少なくありません。
相関関係にある二つのデータの間に因果関係もあることがわかっている場合、近似曲線というオプションを使うことによって、一方の値からもう一方の値を予測できる近似式(回帰式)をつくることができます。近似曲線オプションを使って得られた近似式(回帰式)を元にExcelの式に展開すれば計算結果を得ることができます。
現代はあらゆることが急速に変化していく時代です。競合他社がまだ気づいていない間に、トレンドになりそうな動きに気づくことができれば、大きな優位となるでしょう。反対にトレンドに気づくことが遅れてしまえば、競合他社に追いつくことが難しくなるかもしれません。
DX時代におけるデータ分析にはスピードが必要です。そのためには、長い時間をかけて高度なデータ分析をするよりも、相関分析のようなシンプルなデータ分析を数多くやれるビジネススタイルの方が圧倒的に有利なのです。
高額なBIツールを使っても、基本的にはExcelを使う場合と大きく変わるわけではありません。大事なことはどんなツールを使うかではなく、データ分析に有用なデータを収集し、分析可能な形に整えることが重要です。BIツールを入れたけれども使っていないという状況にならないように、まずは手元にあるExcelの活用を考えてみてはいかがでしょうか。
この記事が気に入ったらサポートをしてみませんか?