【みちのくコミティア4新刊】月刊テキストマイニングレポートVo.015 「性器呼び」の研究――ツイッターにおける女性差別に関する一考察
本記事は、2018年7月15日に開催された「みちのくコミティア4 創作旅行」で刊行した同名のコピー本を元に作成したものです。
#Twitter #女性差別 #私たちは女性差別に怒っていい #みちのくコミティア #テキストマイニング
はじめに
このように独立した同人誌として「月刊テキストマイニングレポート」を出すのは久しぶり(前回は第3号の義家弘介研究だった)となります、後藤和智です。
さて、皆様は「性器呼び」というものを聞いたことがあるでしょうか。
特にネット掲示板のまとめサイトにおいては、女性を「まんさん」ないし「ま~ん(笑)」などと呼ぶようなタイトルや本文のものが見られます。これは、女性を侮蔑するときに使われる「女性」を指す言葉です。特徴的なのが女性器を示す俗称を基に作られていることで、そこから特に女性やフェミニストにおいてはこのような呼び方は「性器呼び」として批判されています。このような呼び方へのミラーリング(相手と所作を合わせること)として、男性を「ちんさん」「ち~ん(笑)」と呼ぶことも見られますが、女性への性器呼びに比べれば数としては圧倒的に少ないです。
特に「ま~ん(笑)」という表記は、「(笑)」が含まれているとおりさらに侮蔑的なものです。「ち~ん(笑)」は、主に「強く期待されていたが、散々な結果になってしまい、掲示板のスレッドなどが「葬式」状態になっていること」、例えば2008年のプロ野球セ・リーグの阪神タイガース(2位の読売ジャイアンツに最大13ゲーム差をつけて首位に立ちつつも後半大失速し最終的に巨人に優勝の座を明け渡してしまった)におけるファンの様子に関連して生まれたものとされており(ニコニコ大百科より《起源は恐らくアンチ阪神スレとして野球chに立てられた「くっさいくっさい珍カスの葬式会場はこちら(笑)」スレで、流行り始めた時期は時期は2008年9月下旬-10月初頭(つまり、13ゲーム差を逆転されての歴史的V逸)の頃と思われる。/当初はスレ内での限定的なスラングに留まっていたが、その秀逸さから野球板での阪神、阪神ファンに対する定番の煽り文句となっていった》)、ツイッターを検索しても、「葬式」状態を嘲笑する意味で使われていることも少なくありません(男性への性器呼びも全体の半数程度見られますが)。しかし「ま~ん(笑)」は女性蔑視の文脈でしか使われておりません。
この言葉はニコニコ大百科にも項目がありますが(ただし「ち~ん(笑)」からのリンクはなし。まあ当然だが)、《一部野球愛好者のコミュニティで使われていた「ち~ん(笑)」というフレーズを、ち~ん(チンコ)の反対はま~ん(マンコ)だろうという小学生並みの発想で捻ったもの》《ジェンダーをあげつらう性差別的な意味合いが非常に強いので、人によっては並々ならぬ嫌悪感を抱かせるフレーズである》と批判的に捉えつつも、他方でその差別的なニュアンスについて《元ネタのち~ん(笑)がお葬式の鈴(りん)の音をイメージしているのに、ま~ん(笑)は一体どんな音なのか皆目見当が付かない可笑しさが語感の良さを誘い、瞬く間に普及した》などと表現してしまっていたりもします。
しかし私が見た限り、このようなは、第一に女性や在日コリアンなどへの差別を扇動しているものが多いまとめサイトにおいて頻繁に使われていること、第二にこのような表現を使っている人は、概して社会的に弱い立場の人々に対して差別的に振る舞っていることが多いことです。例えば女性を性器呼びするような人が、現野党などをバッシングするようなまとめサイトの記事をリツイートしていることはよくある話です。
このたび私は、フリーの統計ソフト「R」を使って、「性器呼び」の背景にある差別意識について検証してみたいと思いました。RにはTwitter(ツイッター)のデータをAPIを使って取得するパッケージTwitteRがあり、これを使って何か分析ができないものかと思っていました。また私が2016年の冬コミで出した『間違いだらけの論客選び』、そしてその続編にあたる2017年冬コミの『間違いだらけの論客選び・改』から、テキストマイニングを用いた大衆言論の研究というものをテキストマイニングのテーマの一つに据えました。本書が属する「月刊テキストマイニングレポート」シリーズも、分析眼を磨くためのものとしての駅メモ(「ステーションメモリーズ!」)や東方Projectの分析を挟みながら、社会において言論とはなにか、というものを統計学を使って明らかにしていこうとする試みです。本書は、そのシリーズとして、初めてアクチュアルな差別問題に取り組むというものです。
私個人の持論として、差別に対抗できなくてなんのための科学的態度かと思っていますが、自分の態度は「科学的」であると僭称する人たちは、むしろ差別に抵抗する人たちにアドバイスするそぶりを見せつつも、実際には冷笑し、差別に荷担しているというものになっています。そのような「ニセ科学批判」の流れに抗うことも、また本書の目的でもあります。
第1章 「性器呼び」とは何か
1.1 はじめに
まえがきでも述べたとおり、本書ではネット上における「性器呼び」について分析し、その特徴について調べるものである。ネット上においては女性を「まんさん」「ま~ん(笑)」と、性器の俗称をもじった言葉で嘲笑する言説が度々見られる。それについて見ていくことにより、現代の我が国における差別の一側面を明らかにする。
1.2 TwitteRの活用
本書ではネット上において女性差別が行われる場の一つとして、Twitter(ツイッター)に着目した。ツイッターはソーシャル・ネットワーキング・サービスの一つとして、ユーザー同士の交流や、テレビ番組などの実況、短い論説を行うことなど様々な用途に使われているが、他方で女性や在日コリアンなどに対して差別的なリプライがつくことも少なくない。また、ツイッターはAPIを用いた検索を使うことによってデータを抽出することができることから、分析データの取得も容易であることから、分析対象としては優れたものであると言える。
APIを用いた検索によってデータを取得する手段として、フリーの統計ソフト「R」のパッケージ、「twitteR」がある。このパッケージを使って、ツイートのデータを取得する。ただし、検索にはAPIが使われているため、一定期間以前のデータを取得することはできないが、直近の話題についてどのような投稿が行われているかを調べるときには重宝する。
これを使って、「"まんさん"」「"ま~ん(笑)"」及び「"ちんさん"」を検索ワードとしてツイートを取得するが、単純に検索した限りでは、「ま~ん(笑)」についてはともかく、「まんさん」「ちんさん」については、例えば「○○まん」(「ばいきんまん」など)や「○○ちん」(「さっちん」「よっちん」など)といったユーザーへの挨拶なども含まれてしまう。それを排除するためには、機械学習などを使うことも考えられるが、現状分析者ができるのは、単語から判断することくらいである。ただ単語から判断する手法はもっとも単純でわかりやすいため、技術的理由と、明確性及び読者へのわかりやすさからこれを採用することとする。
なお、TwitteRについては、下記の書籍を参照されたい。
石田基広『Rによるテキストマイニング入門(第2版)』森北出版、2016年
なお、本書で使用するツイートは、ツイートを取得した時間とAPIの関係から、2018年7月2日~10日のものとした。さらに分析に用いるツイートは、リプライとリツイートを除いたものとした。取得したツイート全体における、リプライの割合と、リプライを除いたツイートにおけるリツイートの数を表1.1に示す。
1.3 単語のカテゴリ分け
twitteRによってツイートを取得したあと、スプレッドシートを用いてツイートの改行を削除し、さらに分析の公平性を図るため、ツイートに含まれている文字を全角・小文字に変換し、さらにスペースを消したものを用いる。このようにしてテキストファイルに貼り付けたものをデータとする。データの構造は次の通りである。なお「まんさん」を含むツイートを「単語A1」群、「ま~ん(笑)」は「単語A2」群、「ちんさん」は「単語B1」群とした。データの構造は次の通り(ただしツイートデータをテキストデータに変換する際に、段落数とツイート数に少量のズレが生じる場合がある)。
<h1>単語A1</h1>
(ツイート)
<h1>単語A2</h1>
(ツイート)
<h1>単語B1</h1>
(ツイート)
形態素解析は、日本語形態素解析エンジン「MeCab」を用いて、フリーのテキストマイニングソフト「KH Coder」で行った。検索ワード3つ(ただし「""」を取り除く)は、KH Coderで強制抽出単語として設定した。さらに「ー」(長音記号のみで表される単語)はノイズとして除外単語として設定したほか、絵文字については<f0>及び<u+0000>から<u+ffff>を全てまとめて「(Twitter記号)」、感嘆符としての「w」(1個~20個)は「(草)」、そして短縮URLである「https://t.co/ 」については「(メディア)」としてMeCabの辞書に設定した(実際にはそれぞれの抽出対象は全角に変換してある)。
ここから、出現数44以上の単語195単語を、多次元尺度構成法を用いて12のカテゴリに分類した。単語は、概ね相手への挨拶に使われるものと、まとめサイトのような話題や表現の単語に概ね大別された。そこから強制抽出単語を除外してコーディングルールを作り、各カテゴリの単語がどれだけの割合のツイートに使われているかを検討した。
その差は明確で、概して交流に関する単語(カテゴリ6,7,9)は単語B1群に、まとめサイトなどの話題に関する単語(カテゴリ2,4,8)は単語A1,A2群に使われていた。特にカテゴリ4については、2018年7月に逮捕された、2016年に横浜市の病院で患者の点滴に消毒剤を混入して殺害したとして逮捕された容疑者についてや(「【画像】大口病院元看護師のまんさん(31)「20人以上殺した<u+2661>」【植松超え】」という記事のまとめサイトの記事が観測された)、あるいは「盗る」と「撮す」があることから盗撮に関するものと思われるが、おそらくはまとめサイトの「ま~ん(笑)「職場で店長に盗撮された!見舞金は13000円ありえない!」」という記事を拡散する文脈で使われたものであると思われる。これらの単語を含むカテゴリ4の単語を含むツイートの割合は、単語B1群では1%に満たなかったのに対し、単語A1,A2群ではおおよそ20%見られた。
さらに、カテゴリ4の中には「帰化」という言葉があったため、これについて単独で調べたところ、単語A2,B1群には「帰化」を含む単語は見られなかったが、A1群に62件見られた。その内実をKWICコンコーダンスで調べると、まず出てきたのは「【悲報】twitterのまんさん、日本に帰化した外国人にま〇こぬれぬれになる」というまとめサイトの記事のみであった。ここから見ると、まず「性器呼び」の広がりにもっとも関与しているのはまとめサイトと思われる。特に「帰化」を含むツイートに見られたまとめサイトのタイトルには、複合差別(外国人差別と並列して行われている)の要素が見て取れる。
またカテゴリ8については、性差別的な表現に使われる単語が多く見られているが、それらについてもまとめサイトの影響が考えられる。例えば性差別的な単語に混じって入っている「鬼太郎」は、ほとんどが「【悲報】ゲゲゲの鬼太郎さん、ついにまんさんに媚び始める」「ゲゲゲの鬼太郎さん、ついにま~ん(笑)に媚び始めるwwwwwww(※画像あり)」という、執筆時点で放送中のアニメ「ゲゲゲの鬼太郎(第6期)」を嘲笑するものであり、「エロ」でも「まんさん「ビーチバレーのアニメが不快、女子スポーツはエロさだけだと侮辱された気分」」「【エロgif】お股ユルユル女子アナまんさんのエロハプニングをご覧くださいwwwwwwwww」「:【悲報】まんさん向けのハード系エロ本がこちらwwwww」などというもの、またカテゴリ2の「強要」についても「【驚愕】19歳まんさん、元彼氏を襲撃しセoクスを強要するwwwwwwwwww」というものであるように、まとめサイト系の話題の単語を含むツイートのほとんどはまとめサイトの記事のタイトルないしそれに類するものであった。
1.4 まとめ
以上から、少なくとも2018年7月2~10日に投稿された、「性器呼び」表現と性差別的な単語を同時に使っているツイートは、ほとんどがまとめサイトの記事のタイトルであった。そのためまとめサイト的なるものと性器呼び、さらには他の差別の関係についてはある程度立証できたものと考える。単語から判定した場合は、(交流ではなく)「性器呼び」と判定されるツイートの多くはまとめサイトのタイトルの拡散と考えられる。
ただし、まとめサイトのタイトルの拡散の物量に圧されて、そうでないツイートにおける性器呼びの特徴が分析できなかったのが今回の課題となるだろう。例えば「まんさん」という表現を、観測期間中に最も多く用いたアカウントは、まとめサイトやアンテナサイトのアカウントでもなく、さらに言うとまとめサイトのタイトルを拡散したものではなかった。だが、そのツイートには、明らかに女性を貶めている表現が見られる。
男が色んなものを隅々まで便利にしてきた現代の世の中で、まんさんに任せてた育児とかの分野だけが旧時代的なシステムしか持たずボトルネックと化してるの、さもありなんという感じ。
マンコパワー使うまんさんとブスフェミ系まんさんとの間に相反する要望があって、それを無理矢理両立させるためのまんさん特権によって男が割を食う、ってパターンは多い。
雇用(採用)における性差別を本気でなくすなら、面接は姿が見えないようにツイタテ置いて変声機でも使えばいいと思うんだけど、まんさんサイドからそういう話が上がってこないのは、マンコパワーで就活したい女が困るからなんだろうな。
少なくともこのような書き込みをするものも複数いるわけで、そこから性器呼びの特徴をどのように分析していくのか。
第2章 誰が性器呼びを行うのか
2.1 はじめに
前章の問題を踏まえた上で、今度は「まんさん」「ま~ん(笑)」というツイートを多くしているアカウントがどのようなものであるかを見ることとした。これらの単語を多くツイートしているアカウントの中には、まとめサイトやアンテナサイトのアカウントもあるが、そうでないアカウントも多いと見られる。これらの単語を多く使っているアカウントを見たが、まず「ま~ん(笑)」については、そのほとんど全てがbot(他人をネタにして晒し上げるbot含む)か、もしくはこのような概念の横行を批判するものであったため、「ま~ん(笑)」という言葉はそこまで多く広がっていないと見られる。他方で「まんさん」については多く見られており、この表現を性差別として使うユーザーの特徴を見ていくことが必要となる。
本章では引き続きtwitteRを用いて、「まんさん」という単語を使った上位21アカウント(表2.1)のツイートを検討し、そのユーザーの特徴について見ることとする。ツイートは、最新1000件、もしくは2018年6月20日以降のツイートで、かつ2018年7月11日以前のものを利用した。
2.2 「#まなざし村」
ここでもう一つ群を加えることとする。それは「#まなざし村」というハッシュタグを使っているグループ(タグ層とする)である。
「まなざし村」とは、元々は若者バッシング、オタク叩きを繰り返し行ってきた(筆者も何度も的外れな批判を浴びせられている)「社虫太郎」(旧「甲山太郎」「甲虫太郎」)が、ある美少女キャラクターを通じたオタク層の性的な「まなざし」を問題視する自分のような立場の自称として使われたものだが、いつの間にかこの自称社会学者に反発するものが、フェミニズムに親和的な発言をした人を「まなざし村認定」するときに使われるようになった(私も何度も受けてきたが、そのたびにブロックしている)。
このハッシュタグの特徴としては、リツイートによる拡散があまりにも多いことにある。例えば、「まんさん」については(「○○まん」といった人への挨拶を含むにしろ)リプライを除いた3,833ツイートのうちリツイートを除いたものが2,587個と約67%なのに対し、「#まなざし村」はリプライを除いたツイートは2,848だがリツイートを除いたものはわずか349、12%程度に過ぎない。
その証拠に、このタグの使用頻度が高かった(観測期間中に30以上)アカウント20の内、半数を超える12のアカウントは、当該タグを使って自らツイートを行って「いなかった」。30以上のツイートはすべてリツイートだったのだ。他のユーザーについても、2アカウントを除いてリツイートの割合が75%、すなわち4分の3を超えている。このハッシュタグについては、少数の論客がツイートし、それに賛同するアカウントがリツイートによって爆発的に広めるという構造を見て取ることができる――要するに「まなざし村村」とでもいうものができあがっている。
このハッシュタグを用いる層は、基本的に漫画やアニメ、ゲームなどの表現規制に反対しているものが多いが、その内容は、国家による検閲よりもむしろフェミニズムや性暴力被害者による懸念・批判に対して過剰にバッシングしているものが多い。ただこれらの層は、「性器呼び」については極めて消極的である。そのため「性器呼び層」と「まなざし村村層」の違いについても見ることは重要だと思われる。
この「#まなざし村」を使っているアカウントは全て反フェミニズム、反表現規制という同じような傾向を持っていたが、先の理由により、この期間中に同ハッシュタグを用いたツイートをしているか(もしくはリツイートだけか)によって、「タグ群」の「発言あり」と「発言なし」の2群に分けた。その他、「まんさん」「ま~ん(笑)」については、特に前者について挨拶として使われており、反フェミニズム、女性差別的発言が極めて少ないと思われるものを「対照A」、逆にこれらの概念を批判しており、女性差別反対の傾向が見られるアカウントを「対照B」、そしてまとめサイトやアンテナサイトのアカウントと見られるものを「対照C」とした。ここでは「単語A1群」「タグ群(発言あり/なし)」と「対照B群」の比較が課題になってくるだろう。
2.3 前回の分析との差異
今回の分析では、前回はKH Coderの強制抽出単語として登録していた「まんさん」「ま~ん(笑)」を単語(前者は固有名詞、後者は感動詞)として登録した。また、ノイズの排除のために名詞として検出されるいくつかの記号を記号として、また「(笑)」「()」をいずれも「(笑)」(感動詞)として、またツイートは前回と同様に、小文字・全角・スペース削除の処理を行っているため、リツイート(いわゆる非公式リツイートを含む)において現れる「rt@」を単語として登録した(感動詞)。
(ここから先は有料コンテンツとしますが……少しだけデータをチラ見させておきます)
ここから先は
¥ 200
この記事が気に入ったらチップで応援してみませんか?