ノンプログラマーに贈るEPO-OPSから公報pdfをダウンロードする方法
主要知財庁のオープンデータを API で取得するシリーズ。今回は韓国のKipris-Plus を紹介する予定でしたが、前回紹介した EPO の OPS で python や VBA などのプログラム言語を使わずにアクセスする方法の情報が持ち込まれましましたので、これを紹介します。
ただ、なんとかならんもんかえ・・・と思うことが出てきます。
用意するもの
前回の記事を参考に、OPS に登録して、API キーを取得しておきます。
プログラムエディタの代わりに、コマンドラインツール(windows ならコマンドプロンプト、Mac ならターミナル)を準備します。
ファイルをダウンロードしたいフォルダに変更しておきます。
Published Images Inquiry Service にアクセス
OPS のページにログインしたら、Published Images Retrieval Service のページに行きます。
ここで、OAuth 2.0 のボタンの中にちらっと見える Set… を押して、トークンを生成します。
次に Send This Request のボタンを押します。
レスポンスは HTTP/1.1 404 Not Found となりますが、これで大丈夫です。
(欲しいのはアクセストークンを含むコマンド骨格なので)
コマンドの生成
次に、Response タブの右にある cURL タブをクリックします。
すると、curl コマンドが表示されます。
curl -X GET --header "Authorization: Bearer (アクセストークン)" "http://ops.epo.org/3.2/rest-services/published-data/images/image-country/image-number/image-kind/image-type?Range=1"
ここで、image-country を JP、image-number を 2013048981、image-kind を A、image-type を fullimage に変更します。
curl -X GET --header "Authorization: Bearer (アクセストークン)" "http://ops.epo.org/3.2/rest-services/published-data/images/JP/2013048981/A/fullimage?range=1"
末尾に "-o 出力したい名前.pdf" を付けます。これでコマンドが出来上がります。
curl -X GET --header "Authorization: Bearer (アクセストークン)" "http://ops.epo.org/3.2/rest-services/published-data/images/JP/2013048981/A/fullimage?range=1" -o 特開2013-048981.pdf
コマンドの実行
このコマンドをコマンドラインツールで実行しますと、次のような表示が現れて、
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 14858 100 14858 0 0 7327 0 0:00:02 0:00:02 --:--:-- 7333
指定先のフォルダに 特開2013-048981.pdf という名前の公報 pdf ができます。
pdf ファイルを開けてみるとフロントページがダウンロードされているのがわかります。
変形例
1)” -o ” を ">" (空白なし)に変えると、標準出力からのリダイレクト出力になります。(結果は同じ)
2)”range=1” の数字を変えるとそのページ番号の pdf がダウンロードされます。しかし、1ページ単位でしかダウンロードできません。
3)"fullimage" を "thumbnail" に変更すると、図表が掲載されている公報の1ページ分が取得できます。図ごとの取得ではありません。
最後に
OPS の API をコマンドラインで叩いて、公報 pdf をダウンロードする方法でした。
なお、公報 pdf と言いながら、明細書も画像です。また、上のように1ページ単位でしか取得できません。なんとかならんもんかえ・・・と思うところです。しかしまあ、無料で使っているので感謝して使いましょうか。
次回こそは Kipris-Plus を紹介します。
アジア特許情報研究会 西尾 潤