"生成AIを活用した特許データの処理、視覚化、分析、及び、解釈"がパテント誌に掲載されました。
1.前置きと言い訳
今日事務所にパテント誌6月号が届きました。パテント誌は紙での発行は希望者のみとなりましたので、久しぶりに製本されたパテント誌を手に取りました。
なぜ、パテント誌が送られてきたかといえば、私の書いた論文が掲載されており、論文著者には紙のパテント誌が送られるようです。
本号の特集は「進歩性」ということで読みごたえがあり、そのような特集と重なってラッキーでした。
なお、パテント誌につきましては、発行から2か月で公開されます。おそらく8月初旬には、6月号は誰でも見られる状態となりますので、公開されましたら、またお知らせいたします。
それで肝心の内容ですが、ここで言い訳させていただきますが、本稿の投稿が2023年9月27日であり、論文のデータ作業をしたのが2023年8月となり1年近く経ちますので、今から見ますと、古い内容となっております・・・。
本当はもう少し早いとよかったのですが、最近のパテント誌は人気があるようで、投稿される論文の数が多く、どうしても掲載まで時間がかかるようです。
生成AIの世界は日進月歩で進化しておりますので、1年経つと古臭い内容となってしまうことはやむをえません。以上、内容に新鮮味のないことに対する言い訳でした。
ということで、私も久しぶりに自分の書いた論文を読みましたので、内容を思い出しながら、ここで内容を今一度、見直してみたいと思います。
2.特許データの処理について
・特許データ
特許情報といわず、特許データと呼んでいますが、これは、データサイエンス業界に倣った表現にしております。一応、データサイエンティストを目指しております・・・。
・分類方法
特許データの処理では、分類を作成して、データに付与してます。分類の作成には、いろいろやり方があると思うのですが、ここでは、ChatGPTに分類を提案させています。
分類については、特許データから生成する方法や、既存の分類(特許分類など)を使用する方法があるのですが、一番楽な方法ということで、ChatGPTに丸投げしております。
どの方法がよいかは、今だ試行錯誤中です。
・GPT for Sheets and Docs
400件の処理に、GPT for Sheets and Docsというアプリを使用しています。このアプリは2023年8月時点では無料アプリでしたので、誰でも使えることから論文で紹介したのですが、2023年12月に有料化されてしまいました。
ですので、今はもうこのアプリは使っておらず、GASスクリプトを自作したものを使用しています。
このようなことから、処理に使用するツールは基本的には自作するようにしています。自作プログラムはしょぼいですが、GPTの能力が圧倒的ですので、総合的には強力なツールを作ることができます。
3.特許データの視覚化について
・視覚化について
特許マップやパテントマップという言葉を使わず、視覚化と呼んでいますが、これも、データサイエンス業界に倣った表現にしております。
視覚化は "visualization"のことであり、可視化ともいいますが、どちらでもよいと思います。
・ネットワーク図について
個人的に書きたかったのが、ネットワーク図です。モデルを視覚化するのには、ネットワーク図がよいのですが、書く手段がなかったため、以前はパワポで手書きで書いていました。しかし、これは面倒です。
ChatGPTは、所望のコードを出力することができますので、ChatGPTにPythonプログラムを聞きながら完成しました。これはなかなかよかったです。
4.特許データの分析と解釈について
特許データの分析と処理に関しては、2023年7月に新たに機能追加された、code interpreterにより実行可能となりました。
この機能が登場した時には、かなり驚きました。要は、ChatGPTがデータを解釈してくれますので、今までのように、人間が特許マップとにらめっこする必要がなくなります。
これは革命的な出来事でした・・・(Pythonプログラムを書けるだけでも革命的ではありますが・・・)。
論文では、対応分析とネットワーク分析をさせていますが、とても私には(知識的に)できない分析ができております。
ただし、ChatGPTに上手くデータ分析をさせるには、コツがあるようで、これは今も試行錯誤中です。
5.おわりに
ということで、パテント誌に1年前の技術の論文が掲載されておりますが、今はどうなっているか興味がある方は、こちらを購入いただければ幸いです。