データを見るうえで大事な3つの視点DCV(定義D、比較対象C、表現方法V)
データを見るときに自分がチェックしている三つの視点があります。
・データの定義を確認する
・比較の妥当性
・表現の意図を考える です。
簡単に言うと、定義、比較対象、表現方法。それっぽく英語でいうとDefinition, Comparison, VisualizeなのでDCVなんて言ってみます。
それぞれ説明してみます。
データの定義を確認する
以外かもしれませんが、データは定義次第で結構変わることをご存じですか。特に○○率のようなものは、○○/△△ と分子と分母の定義が必要になるので変化は大きくなります。
ソシャゲのダウンロード数も端末数でカウントするのか、総ダウンロード数(最初に良いキャラをゲットするために、削除、チュートリアル、ガチャを繰り替えすリセマラという取り組みで)数字がかなり変わります。
いろいろな場面で聞く継続率という数字。これは、まず、継続している状態を定義する必要がありますが、そのためには、離脱した状況をまず定義することが必要になります。そこで継続者数が定義できたときに、分母を何にするかによって数字は大きく変わります。期間中のユーザー数全員にするのか、過去からの累計数にするのかなどで出し方、傾向、データの見方が変わってくることになります。
ちなみに率の場合は、分母の変化が少ないものを選んだほうが変化を見やすいというのが持論です。
ちなみにの2、データって何かって考えることがあるのですが、個人的見解としては、定義を決めたうえで集められた情報の集合(ローデータだろうと集計されたものだろうと。数値だろうと、数値以外のものも)だと考えています。逆に定義もなく集めれているとそれは情報なのかなと。
比較の妥当性
100点を取りました。 と言われたとき、それは良かったのでしょうか?
小学校の一般のテスト(100点満点)を持ってきた娘の場合だったらよかったねぇということになります。
センター試験。(今はそう言わないんでしたっけ?)の英語とかであれば、どうでしょう。満点200点の100点とすれば、半分しかとれておらず、むーんとなるかもしれません。
TOEIC 990点満点で100点だとすると狙ってもとれるかわからない低い点数です。
つまり、比較とする点数があって初めて、100点という点数がどうだったのか評価できるわけです。(平均点だったり、中央値の点数になることもあります。)
もちろんこの点数のようなことはすぐにわかるかもしれません。
ただ、キャンペーン実施して、○○円売上上がりました。良かったです。 というような報告を受けて、よかったよかったとしたことありませんか。
コストはペイできたのか。期待していたほどの成果だったのか比較するポイントはいくつもあるはずです。最初に何と比較するのか、そもそもその比較でよいのかを確認することが重要です。
表現の意図を考える
表現方法というのは、大半はグラフ化ですが、そのほかにも
日本の場合は、英数(xx,xxx,xxx,xxx)を使うか、万とか億とか感じを踏まえた数字で表現するかでも意外に印象は変わります。日本の場合3桁ごとにカンマで区切る数字に慣れていない人が結構いるため、細かい数字を書くと数字のインパクトが薄くなるのではと感じています。
(ちなみに、英数のところでかいた桁数は100億の桁までですね)
グラフ化についての説明やルール、見やすいグラフなどはいくつもルールやおすすめの方法などこちらは書籍なども多いのでぜひそちらでご確認いただければと思います。
個人的には、
①ゼロか始まっているか
②複雑(要素数)すぎないか。
③色とか数字とか一部の強調をし過ぎていないか などは無意識的にチェックしている気がします。
まとめ
以上いかがでしょうか。
このデータはどう定義されているのか(イメージと同じ定義なのか)、
このデータを比較している対象は今回のストーリに適しているものなのか、
表現方法で他の大事な情報が隠されていないか などを少し考えながらデータを見ていただくとより理解が深まるのではないかと思います。
ぜひお確かめください。
ここまで読んでいただきありがとうございます。 スキを押していただけると嬉しいです。 フォローしていただけるとさらにうれしいです。