見出し画像

オープンソースAIが描く:ユーザー体験と知財戦略

先週から中国のAIスタートアップ「DeepSeek」が発表した「DeepSeek-R1」が話題になっています。

このモデルは、OpenAIのAIモデル「o1」とほぼ同等の性能を持ちながら、低価格、かつオープンソース化されている点が特徴です。

今回は、DeepSeek-R1がもたらした新たなAI環境、今後必要とされる生成AI×UIの拡張、その知的財産の保護について触れたいと思います。


今回のポイント

  • DeepSeek-R1の何が優れている?

  • AIモデルのコモディティ化とは?

  • コモディティ化における鍵となる要素とは?

  • 生成AIと魅力的なUIの融合とは?

  • 知的財産での保護方法とは?


低コストモデルのインパクト

ゆう:ねえ、りょう、中国のDeepSeekのAIがすごいらしいよ。

りょう:DeepSeek-R1のこと? 低コストで高性能だし、OpenAIのo1と遜色ないよ。ネット検索をしながら深く考える能力も持っていて、o1よりも優れている部分もあるんだ。
DeepSeek-R1はこちら

ゆう:どれくらい安いの?

りょう:プログラム利用の場合、DeepSeekの方がOpenAIよりも95〜97%も安いんだ。

<DeepSeek-R1のAPI料金体系>
・入力トークン
:100万トークンあたり0.55ドル
・出力トークン:100万トークンあたり2.19ドル
APIドキュメント

<OpenAIのo1モデルのAPI料金体系>
・入力トークン
:100万トークンあたり15ドル
・出力トークン:100万トークンあたり60ドル
OpenAI API料金

ゆう:えー、そんなに安いの?


o1モデル並みの実力

りょう:ただ安いだけじゃないんだ。性能面でもOpenAIのo1モデルに匹敵するんだよ。

「DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning」から引用

ゆう:どうしてそんなことができるの?

りょう:アメリカが中国への高性能半導体チップの輸出を制限している中、DeepSeekは旧型半導体チップを活用して高性能な生成AIを開発したんだ。強化学習の重視統計値に基づく報酬決定、そしてモデルの蒸留によるコンパクト化がポイントだよ。
DeepSeek-R1の論文はこちら

ゆう:工夫しているんだね。


オープンソースの強み

りょう:OpenAIの生成AIはモデルの内部が非公開利用制限がある。こういうのクローズドソースっていうんだ。

ゆう:秘密主義だね。

りょう:対照的に、DeepSeek-R1はモデル自体が公開されていて、誰でも使用、複製、改変が可能なんだ。
DeepSeek-R1のGitHubはこちら

ゆう:こちらはオープンなんだね。

りょう:そう、オープンソースっていうね。

ゆう:なんでDeepSeekはそんなことをするの?

りょう:誰でもモデルを検証・改変できるから、問題の修正や改善が進みやすくなるんだ。多くの人に使われればブランド力も向上し、業界標準となれば市場での支配力も強まるよ。

ゆう:世界に広めたいってことだね。


AIモデルのコモディティ化

りょう:DeepSeek-R1のようなオープンソースのAIモデルが出ると、誰でも自由に利用・改変できるから、今後、似たり寄ったりの生成AIが市場に溢れることになる。

ゆう:そうなるとどうなるの?

りょう:モデルの性能そのものよりも、「使いやすさ」や「魅力的な体験」が競争の鍵となるよ。

ゆう:たしかに文字入れたり、結構だるい。


生成AIとUIの融合

りょう:低コストで生成AIが利用できるようになると、それを組み込んでサービスを提供する企業が増えるだろうね。

ゆう:安いもんね。

りょう:その際に重要なのは、いかに魅力的なサービスを提供できるか。特にUIの魅力が差別化のポイントになるよ。

ゆう:正直、今の生成AIはあんまり使わないんだよね。ところで、UIって何?

りょう生成AIとユーザーをつなぐ窓口のことだよ。スマホの画面やマイク、スピーカーなどがそれに当たるね。

ゆう:なるほど、分かりやすい。


生成AIにおけるUIの拡張

りょう:今後は生成AIとUIを組み合わせて、魅力的な体験を提供することが重要になる。

ゆう:体験?どんな発想が必要だろ。

りょう:例えば、現在の生成AIは文字入力(プロンプト)が主流だけど、これを拡張する方向も考えられる。入力チャネルの拡張だね。

<入力チャネルの拡張>
スマートグラスで見た周囲の映像を入力
動作・心拍数・血圧から推定した感情を入力
睡眠中の脳波から夢を入力
超音波・放射能など五感を超えた情報を入力

ゆう:確かに面白そうだね。

りょう:同様に、生成AIの出力も文字だけでなく、さまざまな形に拡張できる。出力チャネルの拡張と呼ぼうか。

<出力チャネルの拡張>
バーチャル空間を出力
動画配信映像を出力
触覚、臭覚、味覚など視覚以外の感覚を出力
状況に応じた表情や声の抑揚を豊かにして出力

ゆう:たくさんアイデアがあるね。

りょう:さらに、生成AIへの入力を「現時点」のみならず、時間軸を拡張することも考えられる。つまり、時間の拡張

<時間の拡張>
過去の会話履歴や行動履歴を入力
日々測定する膨大なライフログ(映像、音声、血圧など)を入力
スケジュールと連携した未来の内容を入力
ライフログから推定した未来の出来事を入力

ゆう:時間も旅するような感じだね。

りょう:他にも、生成AIへの入力に他の人も関与させる方向性もある。これは、関係の拡張

<関係の拡張>
友達同士の生成AIが自動的に会話し、その内容を入力
生成AI同士が交流するSNSに生成AIを介して参加

ゆう:可能性は無限だね。


UIの知財を守る

りょう:せっかく魅力的なUIを実現しても、そのままだとすぐに真似されてしまう。だから、UIをどのように守るかが重要

ゆう:特許を取るとかの話?

りょう:その通り。技術的なアイデアについては特許を取得できるし、UIの特許は特に強力だよ。

ゆう:強力ってどういうこと?

りょうUIは「見た目」で判断しやすいため、模倣された場合に特許を利用しやすいんだ。一方、モデル自体の特許だと「真似されているかどうか」が分かりにくい。生成AIの内部動作は見えないからね。

ゆう:見た目なら分かるもんね。

りょう:また、画面のデザインについては意匠権で保護することもできるよ。

ゆう:特許とは違うの?

りょう:うん。特許は技術的なアイデアを守るもの意匠権はデザインを守るもの

ゆう:AIで作った動画とか?

りょう:いや、動画とかのコンテンツは特許や意匠権では保護されないんだ。特許や意匠権で保護できるのは、UIの操作用画面とか表示画面とかだね。

ゆう:UIのアイデアは特許で、UIのデザインは意匠権ってことね。


今回のまとめ

  • DeepSeek-R1の優れた性能と低コスト:OpenAIのo1に匹敵する性能を持ちながら、API料金が95〜97%低価格。

  • DeepSeek-R1はオープンソース:モデルが公開され、誰でも使用、複製、改変が可能。

  • AIモデルのコモディティ化:生成AIの性能の均一化が進み、「使いやすさ」や「魅力的な体験」が競争の鍵に。

  • 生成AIとUI/UXの融合:魅力的なUIがサービスの差別化に重要な役割。

  • 生成AIのUIの拡張:入力チャネル、出力チャネル、時間、関係の拡張のアイデアが考えられる。

  • 知的財産の保護戦略:特許や意匠権を活用し、UIの保護が必須。UIの特許は強力。コンテンツは特許や意匠権では保護されない。

今回も最後までお読みいただき、ありがとうございました。

弁理士 中村幸雄https://docs.google.com/forms/d/1oLtmon268KUTsEiMQF8Qoq6g877G9bjpxdCc5zWYZLc/edit

いいなと思ったら応援しよう!