![見出し画像](https://assets.st-note.com/production/uploads/images/64072432/rectangle_large_type_2_f6b3bb2016defa95a357e25fdf08eab3.png?width=1200)
日常の評価学2:M1グランプリは客観的な評価なのか?
毎年の年末恒例のM1グランプリについて評価学から考察してみたいと思います。M1を見るとお笑いの話し方の技術に毎年魅了されます。そして、M1グランプリも明らかに評価活動のひとつですね。評価活動なら、学術的な疑問もわきます。
(1)お笑いの客観的な評価は可能なのか?
(2)お笑いの点数化は可能なのか?
(3)出る順番に意味があるのではないか? (4)ひょっとしてM1の出場者は正規分布しているのか?
以下がその疑問に対する評価学からの見解です。
(1)客観的な評価は可能なのか?
10組のお笑いを客観的に評価することは可能なのでしょうか。5,000組から上位10組だけを選び出し、その中から3組を選んで、最終的に1組だけを選ぶことはそもそも可能なのでしょうか。これは「客観的」とはどういうことかを定義する必要があります。現代哲学は次のように定義しています。
第1の定義(伝統的な定義):
<客観的>物事が、認識する主体(人間)を離れて独立の存在する様。(例:衛星の存在と軌道など)
<主観的>判断が、個々の人間の心理に依存している様。(例:味の好き嫌いを述べるなど)
第2の定義(現代哲学の定義):
<客観的>特定の立場に囚われずに、ものごとを見たり考えたりする様。
<主観的>自分ひとりの物の見方や考え方に拠っている様。
・・・ということで、現代哲学によると、一人で評価せずに、立場が違う複数の立場の人たちで物の見方が合意すればそれは「客観的」だということになります。M1の審査員を見ると、もし関西出身の男性の審査員の価値観だけで審査していたら、その評価結果は客観的とは言えなくなるわけです。ところが、女性の上沼恵美子氏が入っていますし、東北出身の冨澤たけし氏が審査員に入っていますから、そのことにより、より客観的になっているわけです。ちなみに、この考え方に基づいて、アメリカでは、多様性は真実に近づくために重要と信じられ、人種もジェンダーも年齢もセクシュアルオリエンテーションも多様な方が真実に近づく判断ができるとして歓迎されるわけです。ちなみに、アメリカでHealthy discussionと言う時は、多様な意見が交わされて(つまりいろいろな立場から見て)最大公約数的な合意に近づく過程を言いますね。これは見習いたいものです。逆に今後、M1が関西出身の男性だけが審査委員になっていったら危険の印ですね。これがM1主催者が上沼恵美子氏を引き留めたい理由でしょう。
(2) お笑いの点数化は可能なのか?
結論を述べると、どんな場合でも点数化は可能です。そして点数化によって順位付けが可能になります。一方で、「たいへん面白い」「面白い」「どちらとも言えない」「面白くない」「まったく面白くない」という言葉による表現(ルーブリックと呼ばれます)は、腐敗する余地はありませんが、点数で表す場合には腐敗する余地があります。もちろん、ここで言う腐敗は金銭的な腐敗ではなく、学術的な観点からの(M1の場合はお笑いの精神からの)腐敗という意味です。
それに加えて、特定の立場に囚われた物の見方にならないための方法のひとつは、あらかじめ複数の視点を決めておくことです。日本の政府開発援助(ODA)の評価なら、「妥当性、有効性、効率性、自立発展性」などの視点を決めていますね。それが複数の視点の実例ですが、M1なら「笑いのテーマの妥当性、笑いの質と量、今後の芸の発展性」と言ったところでしょうか。そのうち、「笑いのテーマの妥当性」はさらに、(i)時代に即しているか(現代性)、(ii)人々に社会的テーマを考えさせる可能性、(iii)倫理的配慮の度合、などに細分化されるでしょう。次に、「笑いの質と量」は、(i)上質な笑いか(<―>下品な笑い)か、(ii)笑いの回数、(iii)笑いの音量(単位:デジベル)と細分化されるでしょう。(iii)今後の芸の発展性は、扱ったテーマが持続的に発展していけるか及びその芸人の芸が発展する可能性を感じるか、ということで「伸びしろ」と言われるものでしょう。
それで、細分化された項目を点数で表すことで、さらに特定の立場に囚われた物の見方にならないことが可能と思われます。ただし、「点数付け」とは、お笑いを100等分できると仮定していることになります。したがって、(i) 本来は意味が違うのに、上沼恵美子氏の1点と富沢たけし氏の1点が同じ意味だと仮定していることが弱点で、これが言葉は腐敗しないが、点数にすると腐敗するという意味です。また、60点から61点に上がる1点と、95点から96点にあがる1点は、同じ1点でも重みが違いますね。これが点数付けにおける「シーリング効果」と言われる弱点です。さらに、点数をつけると「順位付け」が可能となり、必ず最上位の人と最下位の人が決まります。本来は全員、「たいへん満足」かも知れませんし、逆に全員「たいへん不満足」かも知れませんが、点数付けだとそれが表現できなくなりますので、これも点数付けの弱点です。
(3)出る順番に意味があるのではないか(順番があとの方が有利なのではないか)?
理論的にはどの順番でやっても違いはあり得ません。Covid-19のワクチンの治験では、RCT(ランダム化比較試験)を適用していますから、真薬と偽薬をランダムに割り付けて、順番もランダムに注射することで、順番の影響は全く受けないようにしています。それが理想です。M1も努力していて純粋なくじ引きで順番を決めるので、そこにこれと同様のRCTの精神を見ることができます。さらに理想的なのは、10組の漫才をビデオに撮って、それを個室で採点者にランダムに見せて採点させるということです。それをすれば、会場の雰囲気や「流れを読む」などのバイアスが入り込む余地はなくなります。ただし実際にそれをするとエンターテインメントとしては成り立たなくなるでしょう。
(4)ひょっとしてM1の出場者は正規分布しているのか?
M1の採点者の採点は、毎回少なくとも80点以上になっていますね。これはもともとが高すぎるのではないかと思っていました。そのとき、研究仲間から、「お笑い」は正規分布しているのか?という問いかけをいただき、そのことからヒントを得ました。大学受験のときの個人の偏差値はどうやって計算しているかというと、平均点=50、標準偏差=10で計算されていましたね。この投稿のトップ画像の分布になります。これをM1に応用してみます。
2020年のM1の全参加者は5040組だったそうでそこから決勝に残ったのは上位9組でした(それに加えて敗者復活が1組)。全参加者が正規分布していると仮定して、上記の図で偏差値が80以上となる組の数を計算してみると、5040組x0.003/2=8組となります。ほぼ9組に近いですね。つまり、上位9組の偏差値を計算できるとすると偏差値80以上になるということです。なんと、M1の得点はほぼ偏差値だったと考えることができるわけです。偏差値80以上というのがどれだけすごいことかは、大学受験を経験したことがあれば骨身に沁みていますね。あれ?思ったほど面白くありませんね。世紀の大発見と思ったんですがね、「正規」分布だけに(笑)。
以上です。評価とM1の関係について書かせていただきました。M1をネタにここまで長々とどうでもいいことを書けるのか、と思ってもらえたら研究者冥利に尽きるというものです。2021年のM1グランプリが楽しみです。