Ovidの特性(近接演算子とキーワードフィールド)
購読している(学ばせていただくばかりのROM専門ですが)MLでovidについてやりとりがあり、大変勉強になったのでnoteにメモ
kwとkfフィールドの違いについては個別に(いつもとても親切に教えてくださる)@SRLibProblems さんと @melsydavies さんから教えていただいていました。またMLのやりとりの細かいところの理解が自力ではできなかったので、@SRLibProblems さんに教えていただきました(ぺこり)
(MLの内容そのままではアレなので、キーワードは変えています)
上の4つは同じ単語を使って論文タイトル(ti),抄録(ab),キーワード(kw)フィールドを対象に検索した結果です
Line1と2の検索からも分かること
Ovid MEDLINEでは(フレーズ指定なし("")でも)キーワードがフレーズで検索される
PubMedでは(フレーズ指定しない場合)下のようにPubMedの検索アルゴリズムで補足した検索を行います
ここからが本題
Line3と4ではOvidの近接演算機能 adjを使って 、論文タイトルまたは抄録またはキーワードフィールドを対象に、evidence とbased とmedicineが近接して1語または2語以内に含まれる文献を検索しています。
理論的にはL1(フレーズ検索した結果)より、近接演算指定して(それぞれの単語の間にN語を挟んでいるパターンも入ってくる)ので拾える文献が増えるハズと思ったのですが、ヒット数はL1の19884件よりむしろ減っています。
原因は以下2つでした
1.adjの挙動(仕様)
2.ovidのキーワードフィールドの持ち方
1.adjの挙動(仕様)と2.ovidのキーワードフィールドの持ち方
ovidのキーワードフィールドには、.kwと.kfの2つがあります。
(素直にキーワードだからkwでしょって思ってトラップにはまった私)
.kw検索をした場合、著者キーワードとして指定された単語と一致するもののみを検索し(フレーズとして一致するもののみを検索(Phrase Indexed))、著者キーワード内のフレーズ用語は拾ってくれない。→evidence.kw.として検索すると"evidence based・・・"みたいなのは検索で拾わず、"evidence"(のみ)がキーワードフィールドに索引されている文献のみを拾う
この場合、.kwでevidence based medicineのフレーズで指定した検索(evidence based medicine.kw. )をするか、.kfで指定しないとevidence、 based、 medicineを含む著者キーワードを持つ文献を拾ってくれない(.kfは単語単体で拾ってくれる=word indexed)。と言うことを知りました。
文字での説明に限界があると思いますので以下、検索の画面をお示しします
anj1とadj2の.kw検索には(Line11,12)違いがなく、Line5,6,7,8の検索からevidence(のみ)とbased(のみ)とmedicine(のみ)を検索した結果の掛け合わせ(evidenceのみをkwフィールドに含む文献とbasedのみをkwフィールドに含む文献とmedicineのみをkwフィールドに含む文献を検索している)
また、.kwフィールドでは語句はアルファベット順に並ぶそう。
そこで.kwを指定してadjを使った場合、evidence,based,medicineはb→e→mの順に並ぶので、この間に他のキーワードがn語いないに近接という指定は結果として意図しない挙動となる。ということを教えていただきました。
ovidとPubMedのデータがおかしい(索引ミス?)のでは?と思って本文を確認してみましたが、確かにこの記載ではevidenceとbasedとmedicineは別々の単語として索引されるだろうなと納得しました。
(文脈にもよりますが)ovidではキーワードフィールドは.kfを使う方がよいと知りました。
I appreciate your kindness to@SRLibProblems and @melsydavies and all medlibs!