Orbit FAMPATからファミリー特許情報を一気に取り込みたい
ふだん使いの検索システム(特許データベース)から出力した検索結果一覧を、あれこれと細かい文句を言われずに手軽にTHE調査力に取り込むために、こんな仕掛けをご紹介しました。
検索システムの中には、各国の知財庁から発行された公報単位でデータが構成されているものもありますが、同じ特許案件を親とする(業界用語では優先権主張と呼びます)家族(ファミリー)をデータの単位とするものもあります。有名どころのひとつに、Orbit IntelligenceのFAMPATデータベースがあります。FAMPATについては、次のページがわかりやすく説明しています。
このFAMPATで検索した結果をExcelファイルにダウンロードすると、それぞれの出願番号の案件の各国でのファミリーの情報を得ることができます。「Family publication details」という名前のフィールドで、各国で発行されたファミリー案件の公報番号がわかります。
これらの各国ファミリーの全てをTHE調査力にインポートして管理したいこともあるでしょう。しかしこのフィールドは図でわかるように公報番号だけでなく、発行日付も含まれており、さらに [ と ] で挟まれた部分にも、異なる形式の公報番号文字列が入っています。
以前「気軽に特許データを取り込みたい」でご紹介したツールでは、全部のファミリーを一気にGPG/FX形式の公報番号文字列に変換するなんて芸当はできず、別途ファミリー公報1件ずつにセル分割したうえで、全部のセルをまとめて取り込む方法しか手がありませんでした。
そこで以前のツールをバージョンアップして、Orbit FAMPATが出力した「Family publication details」形式の文字列をもとに、GPG/FXが認識できる形式の公報番号文字列に変換してくれるツールを作ってみました。
次の文書から「THE調査力GPG/FX公報番号取得ツール」をダウンロードして、Excelで開いてください。
続いてOrbitから出力した検索結果一覧ファイルのアイコンを、ツール画面上にドラッグ&ドロップして、同じExcelで検索結果一覧ファイルを開いてください。
検索結果一覧が開かれたら、THE調査力に取り込む案件の公報番号セルを図のように選択します。Orbitから出力されたリストの第2行から最終行までの「Family publication details」列のセルを一気に選んで大丈夫です。
公報番号変換対象のセルが選択されたらAlt+F8を入力し、表示されたマクロダイアログボックスから「THE調査力GPGFX公報番号取得ツール!GPGFX公報番号取得」を選択し「実行」ボタンをクリックします。
このマクロを実行すると、検索結果一覧表上で選択されたセルに入っていた公報番号の全てが、GPG/FXで認識可能な番号形式に変換され、クリップボードに保存されます。
続いてTHE調査力のタイトル一覧画面から、検索結果を取り込みタイトルのMENUボタンをクリックし、
開かれたサブメニューから「Japio-GPG/FX自動取得」をクリックし、
「番号で取得」タブを選択し、「公報番号」入力窓をクリックしてCtrl-Vを入力して、クリップボードに保存された公報番号リストをペーストしてください。
この状態で「処理実行」ボタンをクリックするとJapio-GPG/FXから特許情報を自動取得が開始されます。処理時間は件数に比例して変わります。この画面で表示される件数数字を眺めていても結構ですが、右上の「閉じる」ボタンをクリックして、別の作業をしていても自動取得は継続されます。THE調査力からログアウトしても構いません。
ただし少々Excuse(言い訳)をさせてください。そもそもOrbitのFAMPATは100か国を超える国の案件を、ひとつのデータベースの中に収録したデータベースです。必要な情報がOrbitの世界だけで揃い、他のデータベースから得た情報と組み合わせる必要がないことを目指している(と思われる)データベースです。このためOrbitデータベース上の公報番号は、Orbit独自の「方言」が幅を利かせています。彼らにとってはOrbitの世界の中だけで使える公報番号で必要十分であり、Orbit方言の公報番号を欧州特許庁のESPACENETで使われる公報番号と一致させる意味を感じていないと思われます。
たとえばJ-PlatPat上の「特開平10-228098」は、Orbitの中 では「JP10228098A」と表されています。同じ案件がESPACENETでは「JPH10228098A」で検索することができます。一方J-PlatPatで使用可能なDOCDB形式の文献番号は「JP.1998228098.A」です。グローバル化した世の中で、1999年までも元号数字を特許文献番号に使い続けていた日本国に責任があるのでしょうが、平成元年から11年までの案件の出願番号や公報番号の西暦変換が、間違っている例が各国特許庁文書でも散見されます。
ご紹介したのは単に一例ですが、全般的にOrbitの番号形式のクレンジングは、日本人の肌感覚からすると「かなり汚い」レベルと言えます。「THE調査力GPG/FX公報番号取得ツール」には、思いつく限りの例外処理を施しましたが、まだまだ筆者が認識できていないOrbit方言が残っていることと思います。THE調査力上にレコードが生成されない案件を見つけたら、ページ下部の「クリエータへのお問合せ」から連絡してください。
2024/06/11 作成