見出し画像

平均に対する過剰な信奉

ある学校の二つのクラスで、算数のテストをしました。ともに40人の学級です。この二つのクラスのどちらが良い点数を取れているか比較する場合、あなたならどう判断しますか?

意外と多くの方が「両クラスの平均点を比較する」という発想をお持ちかも知れません。それはそれで正解なのですが、なぜ「平均する」という発想に至ったのでしょうか。

というのも、このケースはクラスの人数が一緒で40人なのです。平均は合計点÷人数です。つまり両クラスとも同じ40人で割ることになるので、それなら単純に合計点を比較すれば事足りるのです。割り算するだけ時間の無駄です。

こうしてみると、「平均」の正体はサンプル数の差異を補正した「合計」だということが分かりますね。平均はサンプル「一人あたり」のメルクマールにされるため「集合ではなく個にフォーカスされた指標」という先入観を抱きがちですが、これは大きな勘違いです。平均は集合を表す概念です。

その証拠に、平均からは二つのクラスにどういう特徴があるかなど、まるで分かりません。以前の記事でも言及したとおり、40人中20人が100点で残り20人が0点でも、40人全員が50点でも、平均は同じ50点だからです。個の違いなど、一切フォーカスされません。

なぜ、こんな話をするかというと、これまで多くの場面で「平均に対する過剰な信奉」を目にしたためです。

平均で評価することの危険性

ありがちな失敗例が、組織の管理指標に安易に「平均」を用いることです。そもそも管理指標の目的は何でしょうか。組織の統制です。統制とは、個々のバラつきや誤差をある一定の範囲内に収めることに他なりません。

たとえば、下の表のように東京・大阪の2支店の売上を見てみましょう。売上の合計は東京が 30,000、大阪が 22,000です。ただ、顧客の数が異なるため、これだけでは大小関係を論じることができません。顧客数で除して平均を算出すると、東京が 3,000、大阪が 2,750となります。

この2支店の管理指標を平均売上(または平均単価など)とするならば、この値でもって評価することになります。東京は大阪に比して平均が大きいという結果から、東京が優れた営業組織と言えるでしょうか。

僕からすると、東京支店は非常に危うい体質に映ります。なんせ10顧客のうち、AとDの2顧客しか売上がありません。つまり、競合の発生や顧客内の体制変更等により、たった2顧客から値下げを要求されたり、契約を打ち切られたりすれば、たちまち売上が崩れてしまうリスクがあるからです。東京支店の実態は収益源の分散が全く為されておらず、極めて脆弱な事業ポートフォリオといえます。逆に、1顧客当たりの売上は小さいものの広く顧客を開拓できている大阪支店は変動リスクの小さな安定した収益構造を構築していると評価されるべきです。

このように、平均では顧客ごとの売上のバラつきといった個の要素を扱うことができません。個の要素を扱えないということは、内部の構造に光が当たらないということ。東京支店は一発大きな顧客を当てる博打的な組織、大阪支店は広く収益を支える顧客を開拓する安定志向の組織なのですが、平均という指標からはそれらが全く評価できないのです。これでは組織の統制など取れるはずもなく、管理という最低限の目的すら達成されません。

この例では顧客数が10件程度なのでひとつひとつの売上をチェックしてバラつきを論じられますが、数百、数千以上となれば表の中身を見る気すら失せるでしょう。統計とはこんな時の強い味方なのですが、適切な評価手法でなければなりません。

個にフォーカスするには

では、東京支店と大阪支店の実態はどのような指標で評価されるのか。先ほどの表に、新たに標準偏差変動係数という、ふたつの指標を付け加えてみました。

まず、標準偏差とはサンプルのバラつきの絶対値を示す指標です。この値が大きいほど、バラつきが大きいというもの。計算方法を以下に示します。

まず各サンプルに対し、その値と平均との差を二乗します。顧客Aなら 20,000 - 3,000 = 7,000 の二乗、顧客Bなら 0 - 3,000 = -3,000 の二乗。これらの合計をサンプル数で割ると「分散」と呼ばれる指標が表れます。標準偏差は分散の平方根(ルート)により導かれます。平たく言えば、標準偏差とは各サンプルの平均との乖離を総和した値ということです。

次に、変動係数とはこの標準偏差を平均で割った値です。変動係数は標準偏差が平均の何倍程度までバラつきが広がっているかを示しています。つまり標準偏差と同様に、バラつきが大きいほど、値が大きくなります。

なぜ変動係数のような統計処理が必要かというと、同じ標準偏差でも平均値によっては、バラつきの有無や多寡の判定が変わるからです。たとえば標準偏差が 同じ100 だったとして、平均値が 100,000 か 100 かでは大きく意味が異なります。前者はほとんど無視できるバラつきですが、後者はたいへん大きなバラつきと評価されます。

これが学校のテストであれば変動係数など不要です。なぜなら、どんなクラスを比較しようとも、点数は必ず0~100点の範囲内に収まっているからです。ところが今回の売上のケースは上限が定められていません。最大値を比べてみても、東京が 20,000、大阪が 7,000 という差があります。この差が標準偏差の値に反映されてしまうのです。あくまで評価したいのはばらつきの「大きさそのもの」ではなく「程度」ですので、平均で除すことで値の大小の影響を排除することができます。

変動係数を見ると、東京が 2.13、大阪が 0.94 と、前述の「東京のリスクの大きさ」が一目瞭然で浮かび上がってくるのです。管理指標はこうした統計処理により導かれる内部の構造を見ていかなければ、何を改善すれば良いのか見えてきません。それどころか平均の大小を論じて、大阪支店に「もっと頑張れ!」という的外れな精神論を振りかざす愚挙すら想像できます。ここまでくると、無知に収まらない害悪です。

東京支店は新規顧客を開拓すること、大阪支店は既存顧客へのアップセル・クロスセルを狙うこと、バラつきを評価することで各々が検討するべき戦略目標が見えてきます。

「偏差値」という言葉を知っているのに

会社に入りたての頃、顧客のデータが意図した制御範囲内に均質化されているか評価する仕事に従事していました。その際に驚いたのは、周囲の多くの人間がデータを平均で評価していたことです。

ほとんど意図どおり均質化されたデータであっても、稀頻度の外れ値が平均を大きく変動させる可能性があります。逆に、データが大きく乱高下していても、上下方向に同程度の誤差であれば平均は綺麗な値を返します。前述のとおり、平均は集合の概念であり、均質化という「バラつきの程度」には何の関係もない指標なのです。それ以来、「物事の評価方法は適切か」というのは、社会でコンセンサスが取れていないことに気付きました。

ところで「標準偏差」という言葉、何だか聞き覚えがありませんか。賢さの目安のように使われている「偏差値」という概念にも、同じ「偏差」というワードが使われています。意味合いとしては全く同じで、偏差値も平均に対するバラつきを示しているのです。

ただし、同じバラつきを扱ってはいても、偏差値は標準偏差とは求めているものが異なります。偏差値はどんなテストでも平均点が50点、標準偏差が 10 だったと仮定されたときの、自分の点数の相対値です。これはすなわち、自分が集団の中でどのぐらいの位置に属するかを示すもの。標準偏差や変動係数はバラつき具合を求めていましたが、偏差値とはバラつきの中で自分の点数のポジションを見つけるという、逆の目的があります。また、自分の点数そのものは偏差値には関係ありません。自分の点数が100点だろうが50点だろうが、上位15.87%の中であれば偏差値は 60、上位2.28%であれば偏差値は 70 です。なぜ偏差値が徴用されるのか。それは、受験においては点数そのものよりも、上位何%に入るかという相対評価が問われるからです。

「偏差値」は「頭の良さ」を指すものとして何気なく使われていますが、その定義と意味する概念を理解している人はどれほどいるでしょうか。偏差値を正しく知っている人は、標準偏差を理解している人です。であれば、バラつきの程度を「平均で評価する」などという誤った発想は生まれません。こうした例は身の回りにいくらでも転がっています。

今回取り扱った概念を「難しい」と敬遠しがちな方には、『身近なアレを数学で説明してみる』をお勧めします。宝くじの当たる確率(期待値)、なぜ人工衛星は落ちないのか、新聞紙を100回折ったらどのぐらいの高さになるのか、黄金比とはどんなものか、微分積分とは…という、身の回りにある細やかな疑問を数学で鮮やかに証明してくれます。

「数学」という題名は付いているけれど、専門的な知識は必要ありません。数式自体を理解できなくても、感覚的に分かるような説明が随所に為されています。標準偏差をはじめ標準スコアやポアソン分布といった統計についても、後半でじっくり取り扱っており、理数系でも統計に疎い方は入門書として打って付けです。

今回は「平均」という切り口でしたが、同様のことは至るところで起きています。フランスの哲学者・ルソーの言葉に「私たちは無知によって道に迷うのではなく、自分が知っていると信じることによって迷う」というものがあります。信奉の正体は「それ以外に知らない」という無知よりも、「それで全てが説明できる」という誤った万能感なのかも知れません。

新しいことを学ぶことが億劫になると、人生を「分からない」で埋め立て、あるはずの姿が見えなくなります。先入観や中途半端な理解、手軽に使えるという理由で限定的な知識を使い続けているうちに、いつの間にか世界を捉える道具が貧弱になっていませんか。

難しそうな数学が実はとってもクリエイティブだった、それを知るだけで、僕たちの「新しいこと」は目の前に開かれるのです。

いいなと思ったら応援しよう!