定義の重要性を改めて考える
今回から、「(b) 数学・確率・統計がどのように使われているかを知ろう」を目的に書いてみようと思います。ただしその前に、強調しておきたいことがあります。「定義の重要性」です。数字に騙されないためには、何はさておきその数字がどのように定義されたのかを知ることから始める必要があるからです。「データを理解するためのヒント(1)」と重なる部分はありますが、今回はもう少し掘り下げてみようと思います。
定義は前提
数字に限らず定義を誤解していたら、議論できません。話がかみ合わない理由の1つは、前提が違っていることも多いでしょう。背景知識を同じにすることはできませんが、最低限、使っている用語の意味を共通にすることが必要です。数字において用語の意味にあたるのが、数字の定義です。
分かりやすい例として、就職率を考えてみましょう。就職した人の割合です。率なので、当然分母と分子の2つの数字の割り算になります。その分母に入れるべき人はどのような人でしょうか?就職した人とはどんな人を含むのか、実は意外に奥深いです。
例えば大学新卒の就職率
この定義は、混乱を招くとして「文部科学省における大学等卒業者の「就職率」の取扱いについて(通知)」を出しています。意外に最近で平成25年、2013年です。「「就職率」については、国、民間事業者、大学等の調査においてその定義や算出方法が不統一であることから、社会に対し混乱を招くのではないかとの指摘もあるところです。 」と書かれていることからもわかるとおり、いろいろあったようですね。
〇文部科学省における「就職率」の取扱いについて
「就職率」については、就職希望者に占める就職者の割合をいい、調査時点における就職者数を就職希望者で除したものとする。
「就職率」における「就職者」とは、正規の職員(1年以上の非正規の職員として就職した者を含む)として最終的に就職した者(企業等から採用通知などが出された者)をいう。
「就職率」における「就職希望者」とは、卒業年度中に就職活動を行い、大学等卒業後速やかに就職することを希望する者をいい、卒業後の進路として「進学」「自営業」「家事手伝い」「留年」「資格取得」などを希望する者は含まない。
「就職率」の調査時点は、「4月1日現在」とする。
これを見てわかるとおり、逆にこれだけ細かく書いてあるということは、ここまで言わないときちんと定義できない、ということです。
要点をざっくりまとめると、
・就職率の分母は就職希望者(進学、自営業、留年、資格取得等以外)
・就職率の分子は就職者(正規雇、または1年以上の非正規)
・4月1日現在で計算
ということですね。
特に注意したいポイントは、分母が就職希望者であること。留年も就職希望者から除外されます。重要なのは、希望しなかったら分母に入らないこと。希望できるのは、卒業予定者、かつその中から就職の意思があると表明できる場合、ということです。つまり、この基準は、かなり個人の意思が入りうるし、学校側でも制御できる数字なのです。例えば就職が難しい学生を卒業させない、または就職活動させない状態を作れば、分母を小さくできる、つまり就職率をいくらでもあげられる可能性があります。
これは、就職率だけでなく、卒業後の資格試験合格率などでも同じことが起きえます。(専門学校などで、入学者数と卒業者数を比較すると、いろいろなことがわかるとか・・・)
分子についても少しだけ。一応の定義がありますが、意外に厳密ではない可能性があります。採用通知が出ていればカウントされるのか。(辞退があったら反映できているのか。)
さらに、例えばすでに職がある社会人学生は、どうカウントするのか。進学希望で進学に失敗したら、何処にもカウントされないのか。実際の状況を考えると、いろいろな疑問が出て来ると思います。
失業率:
失業率でも同じような問題があります。「完全失業者」を説明する図:
そして式は、 失業率(完全失業率)=(完全失業者÷労働力人口)×100
ですから、「完全失業者」」はあきらめてしまえば労働力人口にも、完全失業者にも入らない(非労働人口に入る)ので、失業率は低くなります。
さらに、失業率の定義は、国によって違うという話もありますね。他国との比較をする場合には注意が必要です。
「就職率」「失業率」というものを、きちんと理解しようとすると、このように最低限の定義、そして分母、分子にはどんな人が含まれているのかを確認することが重要です。
それが理解できれば、どのような場合にその率が上がる(上げられる)か、下がる(下げられる)かを考えることができます。
粉飾:
さらに注意が必要なこと。それは定義を捻じ曲げて集計していないか、です。実際に、比較的最近注目をされた例がありました。2021年の話です。
N高等学校が粉飾|実際の進学率(実績)は?学費や偏差値も
4月1日発売の週刊文春でドワンゴが設立した通信高校『N高等学校』が進学率・就職率を粉飾していたと報じています。著名人による特別授業などもあるオンラインの高校として注目を集めており、進学実績も東大合格者を排出するなど非常に優秀です。しかし職員からの告発により、通常の高等学校の進学実績の計算と異なる方法で「粉飾」を行っていたことが発覚しました。
(このN高等学校は、かなりの有名人が特別講義を行っていることで有名です。例えば麻生太郎が「義務教育に微積・サインコサインいらない」と言ったのは、ここでした。)
普段、これを見極めるのは難しいでしょう。しかし、就職率や進学率を高く見せたい、という心理が働く場合、このようなことも起こりえることを少しだけ知っておくと、役に立つかも知れません。
ということで、定義をしっかり理解すること。それにより、数字に何か情報が隠されていないかを少し考えることができるようになるかも知れません。
(a) データリテラシーを向上させよう
デーの成り立ち、解釈、伝聞に注意/わからないことは、わからないということが正しい/発信者の発言目的も意識しよう/人は安心したい、騙されたとは思いたくない/人は自分が正しいと思う(思いたい)情報を探す
(b) 数学・確率・統計がどのように使われているかを知ろう
全数調査できないから一部を調査/幅のある推定を知ろう/「有効性あり」と科学的に主張するには仮説検定/因果関係と相関関係は別物/直接の因果関係が不明でも統計ならできることがある/人は無意識に数学を使っている(c) 多くの反論に耐えることが科学だ
反論こそが科学の発展を促した/嘘・捏造・作為的データも存在する/同じ方向を向く結果は信頼できる