機関リポジトリに掲載がない論文のGoogle Scholarへの掲載を目指した過程の記録とGoogle Scholarでの検索からの考察
概要
このnoteは大学などの学術機関のリポジトリ(=データベース)に掲載がない論文(卒業論文/学士論文)をブログサービスでのHighwire Press Tagsの記述を用いてGoogle Scholarでの掲載を目指した過程と、研究室データベースに掲載された論文や機関リポジトリに掲載された卒業論文をGoogle Scholarで検索した事による考察を記している。
はてなブログでの論文公開
以下の通り、noteとはてなブログで卒業論文を公開している。
はてなブログの方はGoogle Scholarに載る事を目指してメタデータ(Highwire Press Tags)を設定しているが、そもそも卒業論文自体が大学などのリポジトリには載っていないので、なんとか載らないだろうかと思ってHighwire Press Tagsを設定した。
きっかけ
論文の公開手法を探す中で以下のツイートに気づく。
自分の卒業論文が母校のリポジトリに載る事はないと考えて、はてなブログならできそうだなと論文中に掲載されたHighwire Press Tagsの表を基にメタデータを自分のはてなブログの<head>内に入力した。
初期段階
はてなブログの「詳細設定」のメニューで<head>内に以下のメタデータを設定した。
<meta name="citation_title" content="<!--論文の題名-->"> /*英訳せず日本語で入力*/
<meta name="citation_author" content="<!--論文の著者名-->"> /*漢字で入力*/
<meta name="citation_publication_date" content="<!--論文の公開日付:YYYY-MM-DD-->">
<meta name="citation_abstract_html_url" content="<!--論文概要ページのURL(はてなブログの個別記事のURL)-->">
<meta name="citation_university_name" content="<!--大学名-->"> /*漢字で入力*/
<meta name="citation_faculty_name" content="<!--学部学科名-->"> /*漢字で入力*/
<meta name="citation_pdf_url" content="<!--初期段階ではGoogle DriveのURLを入力していた-->">
2018年10月2日:論文公開の翌日。ある程度サイト巡回(クロール)の必要性があるからだろうか、すぐにGoogle Scholarには出ていない。
メタデータの追加
Highwire Press Tags(メタデータ)に関する情報を集めて、言語やページ数などメタデータの内容を追加した。
<meta name="citation_title" content="<!--論文の題名-->"> /*英訳せず日本語で入力*/
<meta name="citation_author" content="<!--論文の著者名-->"> /*漢字で入力*/
<meta name="citation_publication_date" content="<!--論文の公開日付:YYYY-MM-DD-->">
<meta name="citation_abstract_html_url" content="<!--論文概要ページのURL(はてなブログの個別記事のURL)-->">
<meta name="citation_university_name" content="<!--大学名-->"> /*漢字で入力*/
<meta name="citation_faculty_name" content="<!--学部学科名-->"> /*漢字で入力*/
<meta name="citation_language" content="ja"> /*言語:日本語の言語コードはja*/
<meta name="citation_firstpage" content="<!--表紙と目次を含む上での最初のページ番号-->">
<meta name="citation_lastpage" content="<!--表紙と目次を含む上での最後のページ番号-->">
<meta name="citation_keywords" content="<!--複数のキーワードを;(セミコロン)区切りで入力:キーワードA; キーワードB;-->">
<meta name="citation_pdf_url" content="<!--初期段階ではGoogle DriveのURLを入力していた-->">
メタデータの内容を追加した後はしばらくGoogle Scholarを確認していなかったが、卒業論文のタイトルがGoogle Scholarに登場するのを確認した。しかし、論文の概要ページのURLは反映されず。
メタデータの最終形
Google Scholarのヘルプページを見直し、論文のPDFのURLを.pdfで終わるDropboxのURLに変えた。
<meta name="citation_title" content="<!--論文の題名-->"> /*英訳せず日本語で入力*/
<meta name="citation_author" content="<!--論文の著者名-->"> /*漢字で入力*/
<meta name="citation_publication_date" content="<!--論文の公開日付:YYYY/MM/DD-->">
<meta name="citation_abstract_html_url" content="<!--論文概要ページのURL(はてなブログの個別記事のURL)-->">
<meta name="citation_university_name" content="<!--大学名-->"> /*漢字で入力*/
<meta name="citation_faculty_name" content="<!--学部学科名-->"> /*漢字で入力*/
<meta name="citation_language" content="ja"> /*言語:日本語の言語コードはja*/
<meta name="citation_firstpage" content="<!--表紙と目次を含む上での最初のページ番号-->">
<meta name="citation_lastpage" content="<!--表紙と目次を含む上での最後のページ番号-->">
<meta name="citation_keywords" content="<!--複数のキーワードを;(セミコロン)区切りで入力:キーワードA; キーワードB;-->">
<meta name="citation_pdf_url" content="<!--末尾が.pdfで終わるDropboxのURL-->">
Google ScholarでURL別に検索するため「site:ruindig.hatenablog.jp」と検索したが、何も見つからなかった。
その一方で「ruindig.hatenablog.jp」と検索すると、論文のタイトルが見つかった。本来載せたいURL自体は見つからなかった。
前例はない
記:2020年7月9日
はてなブログで提供されている5つのドメイン(hatenablog.com hatenablog.jp hatenadiary.com hatenadiary.jp hateblo.jp)をGoogle Scholarで調べると、はてなブログを使った前例がない事を知った。
しかし、ライブドアブログで提供されているblog.jpのドメインで検索したところ、1件だけ見つかった。
注:検索結果には2件表示されているが、著者自身の論文を載せているものは1件だけだった。
調べてみると、リポジトリに掲載された論文をブログに載せている事からGoogle Scholarでの検索に現れたようだった。
http://araigoro.blog.jp/ronbun/201503fin.pdf
ライブドアブログでの作成
ページのドメインとPDFのドメインが一致するという点を見て、試しにライブドアブログにも概要ページを作った。
https://ruindig.blog.jp/Ingress-sightseeing_YukiUchida.pdf
PDFはライブドアブログに備わっているファイルアップロード機能を用いた。
メタデータ(Highwire Press Tags)の内容は以下の通り。
<meta name="citation_title" content="<!--論文の題名-->"> /*英訳せず日本語で入力*/
<meta name="citation_author" content="<!--論文の著者名-->"> /*漢字で入力*/
<meta name="citation_publication_date" content="<!--論文の公開日付:YYYY/MM/DD-->">
<meta name="citation_abstract_html_url" content="<!--論文概要ページのURL(ライブドアブログの個別記事のURL)-->">
<meta name="citation_university_name" content="<!--大学名-->"> /*漢字で入力*/
<meta name="citation_faculty_name" content="<!--学部学科名-->"> /*漢字で入力*/
<meta name="citation_language" content="ja"> /*言語:日本語の言語コードはja*/
<meta name="citation_firstpage" content="<!--表紙と目次を含む上での最初のページ番号-->">
<meta name="citation_lastpage" content="<!--表紙と目次を含む上での最後のページ番号-->">
<meta name="citation_keywords" content="<!--複数のキーワードを;(セミコロン)区切りで入力:キーワードA; キーワードB;-->">
<meta name="citation_pdf_url" content="<!--ライブドアブログにアップロードしたPDFのURL-->"> /*末尾が.pdfで終わるURL*/
しかし、掲載される様子はない(2020年7月21日時点)。
Google Scholarでの検索
記:2020年7月21日
Google ScholarでURL別に検索するため「site:research.miyashita.com」と検索し、いくつかの論文のGoogle Scholar上での掲載バージョンを見てみたが、全て機関リポジトリと思われるURLのものが含まれていた。また、それぞれに書誌情報があるという事も分かっている。
また、掲載バージョンの情報がないが引用元情報のある論文を見たところ、こちらにも書誌情報があるという事が分かっている。
また、東京大学学術機関リポジトリ「UTokyo Repository」に掲載された卒業論文(学士論文)をGoogle Scholarで検索すると、書誌情報はないが機関リポジトリへの登録がある事でGoogle Scholarに掲載されている事が分かる。
旅の「移動」によって発生する情感とその発生機構に関する研究 (要旨)
都市計画と河川管理の制度的乖離に関する実証的研究 : 「鶴見川水マスタープラン」における治水対策を中心として(要旨)
考察
書誌情報のない卒業論文(学士論文)が学術機関リポジトリに掲載されている点から、Google Scholarでの検索結果表示には少なくとも大学や各種学会などの機関リポジトリへの掲載が必要なのだろうと考えた。
参考資料
宮代理弘,宮下芳明.オープンアクセスを見据えた研究室論文データベースの構築,研究報告ヒューマンコンピュータインタラクション(HCI),Vol.2017-HCI-174,Issue.12,pp.1-7,2017.
https://research.miyashita.com/papers/D186, 2020年3月23日参照。
Researchgate: Highwire Press tags embedded in HTML headers: Download Scientific Diagram, https://www.researchgate.net/figure/Highwire-Press-tags-embedded-in-HTML-headers_fig5_220364275, 2020年3月23日参照。
CyberLibrarian「ISO 639言語コード」https://www.asahi-net.or.jp/~ax2s-kmtn/ref/iso639.html, 2020年3月23日参照。
Google Scholar Help: Inclusion Guidelines for Webmasters; Indexing, https://scholar.google.com/intl/en/scholar/inclusion.html#indexing, 2020年3月23日参照。
Google Scholar Help: Inclusion Guidelines for Webmasters, https://scholar.google.com/intl/en/scholar/inclusion.html, 2020年3月23日参照。
ささくれ(2014年7月25日)『citation_pdf_urlでMendeleyにPDFをインポート』
http://cheb.hatenablog.com/entry/2014/07/25/002548, 2020年6月25日参照。
-end-