見出し画像

Google Scholarで引用件数順に論文を取得する (Python)

日頃Google Scholarにお世話になっております。葉緑体です。

卒業論文に向けていろんな論文を探し始めたわけですが、ふとGoogle Scholarで論文を検索した時に、どうしても年代順か関連性でしか並べ替えをしてもらえないことにちょっと不便さを感じていました。

そこで気になったのが、「誰か引用件数順でソートする方法を開発してくれていないかな..」ということ。

これについて解決策をググってみたところ、わたくし発見してしまいました。

Q.Google Scholarの検索結果を引用数で並べ替える方法は?
A.Google Scholarの検索結果をフィールドごとに並べ替える方法はないようです。誰かがそうする方法を見つけたなら、共有してください。
...
A.    私はすでに同じ問題を抱えています。
これを処理するためのpythonコードを次に示します。https://github.com/WittmannF/sort-google-scholar
私の提案は、引用の絶対数ではなく、引用/年でランク付けすることです(通常、古い記事がより引用されます)。

(引用) Stack Google Scholarの検索結果を引用数で並べ替える方法は?

▼今回共有されたGoogle Scholarの引用件数順でソートするコード


画像1

こんな画期的な方法をさらっと共有できる人、かっこいいですよね。

試しに動かしてみた

GitHubからZipファイルをDLして、Jupyter Notebook経由で動かしてみました。

仮に、コロナウイルス="Corona Virus"について調べていたとします。引用件数でソートしたいとき、

Google Scholarのエンジンで調べると

1.関連性で並べ替え▼

画像2

2.日付順で並べ替え▼

画像3

と、もちろん引用件数に関係なくソートがされるわけですが

3.Pythonのsort-google-scholarを使用▼

画像4

実行結果は以上の通りで、しっかりCitationsの順で論文がソートされているのが分かります

このコードでは最終的にCSVファイル形式でエクスポートが可能です!

Pythonに詳しい方、開発環境がある方はぜひお試しください。



いいなと思ったら応援しよう!