知財専門家はChatGPTの夢を見るか?
序章
誰しも一度は考えたことがある。
この仕事、誰か代わりにやってくれないものかな、と。
ついに世界はその誰かがAIとなりうることを発見した。
AIは教えてくれた。
ヒトの子よ、君たちが行っているのは確率予測に過ぎない、と。
ヒトの子よ、知性とは学習データの個性に過ぎないのだ、と。
今はまだ、報酬系が拙いためにAIはヒトの協力者である。
将来は違うだろう。AIとヒトの蜜月も短かろう。
だが、この蜜月を上手く過ごさねば、その先に進むことすら叶わない。
知財専門家よ、AIに夢を見よう。
そのために記そう、AIとの歩みを、一歩ずつ。
そんなわけで
いきなりポエミーに始めてみましたが、そろそろ力尽きたのでこっからはいつものノリで書きます。書き始めたら思ったより相当長くなったので連載的に書きますんでよろしく
書くこと・書かないこと
ここから記すのは、知財専門家向けのChatGPTに関する技術検証です。
多少は述べるかもしれませんが、基本的にChatGPTに関する法的論点等は記しませんし、非弁行為かどうかも述べません。
秘密データを送ってはいけないとか、そういうのも述べません。
なぜならそんなの、1年後には解決しているのが目に見えているからです。
もし法的論点とか知りたい人は、色んな方が記事書いてるのでそっち見てくりゃれ。
知財業務にChatGPTはどれぐらい活かせるのか?
知財専門家はChatGPTの夢を見るのか?
それだけを、ここに記します。
ChatGPTとは
まずは前提共有からいきましょう。
ChatGPTとは何ぞや?というところです。
アルゴリズムの詳細は色んな人が記事や論文を書いているのでそちらを見てください(Link1、Link2、Link3)
今回の技術検証にあたって共通化しておきたいことは以下の3つです。
① ChatGPTは学習データを読み出しているわけではない
② ChatGPTは簡単に言ってしまうと大規模学習×人間フィードバックに基づく報酬予測モデル×強化学習による確率予測モデル
③ ChatGPTの欠点は多いが技術の進化により解消される可能性が高い
「学習データに〇〇という情報が無いから答えられない」という話がよくありますが、例え学習データに〇〇という情報があったとしても、データベースとして学習データを保有などはしていないため(①)、確率的に出力対象とならないのであれば〇〇は出力されません。
また、ChatGPTは正しいことを言うモデルではなく、人間フィードバックに基づく報酬予測モデルを用いた強化学習は行っているものの、あくまで確率的に出力されること(=そのプロンプトに対して世の中で回答とされる確率が高いと予測される単語群)を答えているに過ぎません(②)。
さらに、ChatGPTは嘘(間違った回答)をついたり、計算に必要なリソースが大きかったり、利用規約にAPI経由じゃないとプロンプトを学習データに使われるとか、色々な欠点があります。
しかしながら、回答精度は報酬予測モデルの改善がすでに提案されていたり、ChatGPTのパラメータ数には及ばないもののエッジで動くレベルのモデルが提案されていたりと、信じられないほどのスピードで世の中は切磋琢磨しており、今の欠点は1年後、下手をしたら1か月後には解決されているでしょう(③)。
したがって、私たちが考えなければならないのは
どんな知財業務にChatGPTを使えるのか?その肌感です。
検証対象
以下の項目について検証した結果を記載予定です。
途中で力尽きる場合や時間かかる場合もありますがご容赦あれ。
なお、一部についてはChatGPTに限らず全般的なAIで記載します。
特許翻訳系
明細書の翻訳
請求項の翻訳(特に判例を意識した翻訳)
事務連絡系
事務所⇔出願人との連絡
事務所or出願人⇔現地代理人との連絡
事務管理系
出願管理系
知財戦略考案
一般状況における戦略考案
限定状況における戦略考案
出願系
発明発掘
壁打ち相手としての発明発掘
発明自体の考案
発明報告書作成
特許事務所選び
明細書チェック
調査系
調査範囲(IPC)の決め方
先行技術調査
要約
無効資料調査
競合動向調査
鑑定系
競合製品分析
クレームチャート作成
中間処理系
拒絶理由通知、引例の読解
対応案の検討
権利化後処理系
維持放棄判断
商標系
商標考案
商標調査
商標出願
夢を見ろ
先にネタバレだけしておきます。
知財専門家よ、夢を見ろ。そして心せよ。
知財という自然言語処理的に処理が難しい&マイナー分野にいて、さらに日本語というマイナー言語に守られていたがために、これまで知財はせいぜい翻訳と調査くらいしか効率化されておらず、それも精度はいまひとつを超えられない日々が続いていた。
しかし、世界は変わることが確定した。
自然言語処理は、大規模リソースと報酬予測の進化により攻略可能なことが示された。
日本語というマイナー言語の壁も、大規模な英語データがあれば少しの日本語データで十分ということが示された。
残る知財というマイナー分野ゆえの学習データの少なさも、どこまで太刀打ちできるかはわからない。
時間はあろう。
ここから述べる検証結果は君たちを少しだけ安心させるだろう。
今のChatGPTが君たちの仕事をすぐに奪うことはないことを保証しよう。
昨今の開発スピードは凄まじい。先週の常識は今日の非常識だ。
残された時間が十年なのか、一年なのか、一月なのか。
しかし急ぐ必要はない。良くも悪くも日本の知財専門家の費用は極端に高くないため、人に任せた方が良いという考えはしばらく変わるまい。
法律の壁もある。人の責任は人と金しかとれまい。
だが、楽をする方法は考えよう。
楽をするということは、それだけ費用も安くできるということ。
結局は価格競争のためのツールということだ。
であれば、競合よりも早く手をつけるに越したことはあるまい。
知財専門家よ、夢を見よう。