ゾンビ論文の総括(2023年4月)
2023年4月にGoogleスカラーのアラートに次の3つの検索条件を設定して、ゾンビ論文の収集を行った。
「zombie -firm -company -philosophical」(経済学・哲学のゾンビ論文避け)
「zombie -firm -company」(経済学のゾンビ論文避け)
「zombie」(zombieの単語が入っていればなんでも)
「zombie -firm -company -philosophical」の検索条件に引っかかったゾンビ論文は35本だった。うち、私の目的に合致した論文は以下の一件のみであった。
また、4月は次の二点の検証を行っていた。
①医学のゾンビ論文を収集し、検索キーワードに使える共通単語を見つける
②検索キーワードを次のように変更し、哲学ジャンルのゾンビ論文を減らす:「zombie -firm -company」→「zombie -firm -company -philosophical」
①は見つけることができなかった。②は、ゾンビ論文のチェックがてら、新しい検索キーワードによって哲学ジャンルのゾンビ論文が減ったことを確認した。
また、5月の検索条件を次の3つに設定する。
「zombie -firm -philosophical -DDos」(経済・哲学・情報科学のゾンビ論文避け)
「zombie -firm -philosophical -DDos -company」(「-company」の効果検証)
「zombie」(取りこぼし確認)
以下、調査の詳細を記載する。
集計結果
まず、集計結果を示す。
最も多いのは感想文で7件だが、これはゾンビに関するとあるアンソロジー論文集から大量に引っかかった結果であるため、カウントから除外したい。よって、最も多いのは情報科学の5件、次は社会学、文学、医学、教育学の3件が続く。
情報科学のゾンビ論文ではzombieが「ゾンビPC」として扱われている。月に5件とほかに比べれば多めであるため、検索結果から除外できればチェックにかける時間を減らすことができる。一方、3件ずつである社会学、文学、医学、教育学はzombieの扱いが各論文によって異なっているため、共通の単語を検索キーワードに設定して、検索結果から除外することは難しい。
4月の検証結果
4月は次の二点の検証を行っていた。
①医学のゾンビ論文を収集し、検索キーワードに使える共通単語を見つける
②検索キーワードを次のように変更し、哲学ジャンルのゾンビ論文を減らす:「zombie -firm -company」→「zombie -firm -company -philosophical」
検証①は未達に終わった。複数の論文に共通する単語あるいは文字列を抽出する手法を調べていたら4月が終わったためだ。TFIDFとかいう手法が目的にあっていそうだが、実装と適用のやり方がまだわかっていない。したがって、検証①は5月も引きつづき検証をしたい。
検証②はねらい通りに機能したことを確認した。
②を検証するために、検索条件1と2を設定し、それぞれの結果を毎回確認していた。(検索条件3はねらいの論文まで排除していないか確認する目的。)条件1と2の差分は次のグラフの通りである。
「-philosophical」によって排除されたゾンビ論文は全部で6本。うち、5本が哲学ジャンルであり、1本は芸術学関連であった。(その芸術学のゾンビ論文がねらいの論文でないことは4/27の記事にまとめた通り)
以上の結果より、検証②は成功と言える。また、検索条件2に引っかかったゾンビ論文が非常に少ない上に、検索条件3「zombie」さえあれば誤って排除してしまったゾンビ論文も拾うことができる。したがって、検索条件2を存続させる意義がないため、検索条件2は5月以降は削除する。
5月の検証
5月は以下の検証を行う。
①医学のゾンビ論文を避けるキーワード調査
①検索条件1に「-DDoS」を追加し、情報科学のゾンビ論文が排除されるか確認する
②検索条件1から「-company」を削除し、どのジャンルのゾンビ論文が増えるか集計する
①は引き続き行うものである。
②は、情報科学のゾンビ論文が主に「ゾンビPC」について論じており、ゾンビPCは「DDoS」と呼ばれるサイバー攻撃に使われるため、効果があると考える。どの程度効果があるかを5月に検証する。
③は、3,4月の検証結果より「-company」が全くねらい通りの効果を発揮していないことに起因する。一方で、3月の総括では「チェックする数が増える一方でメリットがないのでは、変更しない方がよっぽどマシ」と宣言したのだが、それは効果を正確に検証したうえで行うべきだと考え直した。
したがって、5月の検索条件は次の3つに設定する。
「zombie -firm -philosophical -DDos」(経済・哲学・情報科学のゾンビ論文避け)
「zombie -firm -philosophical -DDos -company」(「-company」の効果検証)
「zombie」(取りこぼし確認)
変更は5/1(月)に行ったため、5/2(火)以降のゾンビ論文に適用される。
以上。