AI・機械学習を活用した特許分析について考えてみる【前編】
以前、「AI・人工知能を活用した特許調査ツールとの付き合い方について考えてみる」というタイトルの記事を書きました。
こちらの記事では、
- 先行技術調査(出願前調査、審査請求前調査)
- 無効資料調査・有効性調査
- 侵害防止調査・FTO
の3種類の特許調査について、AI特許調査ツールの活用について私見を述べました。
前回の記事では特許分析について触れていなかったので、今回はAI・機械学習を活用した特許分析についての考えをまとめておきたいと思います。
1.機械学習を用いた特許分析-特許庁の取り組み-
まずは人工知能を活用した特許分析の実例から紹介したいと思います。
まず注目したいのは日本特許庁の「機械学習を活用した特許動向分析の調査」です。
この案件は株式会社日立製作所が36,850,000円で落札しています(特許庁、競争入札「公共調達の適正化について」に基づく契約締結情報の公表(令和元年度))。また「令和2年度機械学習を活用した特許動向分析の調査」については2020年6月2日に公示されています。
この案件の趣旨は、
上記の特許出願技術動向調査は、人手による読み込みにより高精度な技術動向の分析を行っていますが、調査が終了した後に最新の技術動向を更新していくことが難しいです。そこで、過去の調査結果を教師データとして機械学習を行い、最新の技術動向を推定する調査を実施しました。調査結果の概要を掲載いたします。
とあり、過去実施した特許出願動向調査報告の結果をベースに、機械学習を活用して分析結果をアップデートしていこうというものです。
にあるように、従来は人間が1件1件読んでいた(しかも数万件!)のをAIで代替するというものです。具体的にどのような機械学習モデルを用いたかというと、
のようにサポートベクタ―マシン(SVM)とマルチヘッドニューラルアテンションモデルの2つで、対象とした技術テーマは
の4つでした。
気になる結果ですが、
のようになっており、再現率(=モレが多いか少ないかの指標、数値が大きければモレが少ない)、適合率(=ノイズが多いか少ないかの指標、数値が大きければノイズが少ない)は80~90%程度なので、動向分析としては良い結果だと思います。
特にLTEや有機ELは90%を超えていますので、人手の場合と比べても機械学習ベースで母集団を形成してもそん色ないレベルであると言えます。
これだけ見ると、機械学習すごい!となりそうですが、動向分析において母集団だけではなく、各課題や技術要素へ特許文献をどれだけ正確に分類展開できるかも重要なポイントです。
技術区分付与についての結果を見てみると、
のようになり、再現率・適合率・F値とも一気に低下します。
マイクロ平均F値は、すべての技術区分を一つの技術区分に統合した場合のF値。マクロ平均F値は、各技術区分に対して算出したF値の単純平均。
簡単に言ってしまうと、
・機械学習で特許分析用の母集団を形成することは出来る
・機械学習で課題・技術区分へ分類展開するのはまだ発展段階
となります。
ちなみに以下のテーマについては機械学習で推定した最新動向レポートが掲載されていますので参照してみてください。
自動走行システムの運転制御 機械学習で推定した最新動向
LTE-Advanced及び5Gに向けた移動体無線通信システム 機械学習で推定した最新動向
私もAIによる特許分析(母集団形成ではなく、課題・技術や用途など分類軸への分類展開)を何回かトライアルしたことがありますが、なかなか満足いく結果を得ることは難しく、現時点ではゼロベースで特許公報を読み込んでいく際の参考となる予備フラグを付与するという位置づけです。
2.特許調査と特許分析の違いを考慮する
ここで間違えて欲しくないのは、「やっぱAI使えないじゃん」と言いたいわけではないということです。
「AI・人工知能を活用した特許調査ツールとの付き合い方について考えてみる」でも述べたように、特定の教師データ(=特定の特許文献や入力テキスト)に類似した文献を抽出したいのであれば、AIはどんどん発展していますので、作業効率化および目視調査のモレ防止のために活用すべきであると考えます。
一方、特許分析においては、分析母集団の形成を行った後に、分析軸への分類展開という作業が必要になります。
ここで分析軸とはIPC・FI・FタームやCPCのような既存の特許分類ではなく、独自に策定した特許分類のことを指します。もちろん特許分類を活用した特許分析も有効かつ作業効率化につながりますが、必ずしも分析したいテーマに合致した特許分類があるとは限りませんし、特許分類の分解能もマッチしない場合があります。なんでもかんでも特許分類ベースで分析できるわけではありません。
現時点では、分析軸への分類展開についてはAIで満足いく結果を得るのは難しいのではないかというのが私の考えです。
とはいえ、特許情報業界だけを見ても直近5年間のAIツールの発展は目覚ましいものがありますので、今後の精度向上を期待しています(分類展開が省力化されれば、分析設計・デザインや分析結果の解釈からの提言導出など別の作業により時間を割くことができますので)。
3.前編のまとめ
長くなってきたので、いったんここまでを前編として、
・特許分析に活用できるAIツール
・特許分析にAIツールをどのように活用すれば良いのか?
・仮に母集団形成だけではなく、分類展開までAIでかなりできるようになったら人間はどうするか?
については、また改めて後編としてまとめたいと思います。
4.参考文献
AI×特許分析については「特許情報と人工知能(AI):総論」でも触れていますが、Japio YEAR BOOKの論考が参考になります。
Japio YEAR BOOK 2019 特集~特許情報分野におけるAI活用のススメ~
Japio YEAR BOOK 2018 ミニ特集 特許庁×AI
Japio YEAR BOOK 2017 特集 PI×AI (特許情報×人工知能)
Japio YEAR BOOK 2016 特許文献から技術動向を把握するためのマイニング手法
Japio YEAR BOOK 2016 自然言語処理技術を活用したパテントマップ自動生成システムの提案