オープンソースAIが描く:ユーザー体験と知財戦略
先週から中国のAIスタートアップ「DeepSeek」が発表した「DeepSeek-R1」が話題になっています。
このモデルは、OpenAIのAIモデル「o1」とほぼ同等の性能を持ちながら、低価格、かつオープンソース化されている点が特徴です。
今回は、DeepSeek-R1がもたらした新たなAI環境、今後必要とされる生成AI×UIの拡張、その知的財産の保護について触れたいと思います。
今回のポイント
DeepSeek-R1の何が優れている?
AIモデルのコモディティ化とは?
コモディティ化における鍵となる要素とは?
生成AIと魅力的なUIの融合とは?
知的財産での保護方法とは?
低コストモデルのインパクト
ゆう:ねえ、りょう、中国のDeepSeekのAIがすごいらしいよ。
りょう:DeepSeek-R1のこと? 低コストで高性能だし、OpenAIのo1と遜色ないよ。ネット検索をしながら深く考える能力も持っていて、o1よりも優れている部分もあるんだ。
DeepSeek-R1はこちら
ゆう:どれくらい安いの?
りょう:プログラム利用の場合、DeepSeekの方がOpenAIよりも95〜97%も安いんだ。
<DeepSeek-R1のAPI料金体系>
・入力トークン:100万トークンあたり0.55ドル
・出力トークン:100万トークンあたり2.19ドル
APIドキュメント
<OpenAIのo1モデルのAPI料金体系>
・入力トークン:100万トークンあたり15ドル
・出力トークン:100万トークンあたり60ドル
OpenAI API料金
ゆう:えー、そんなに安いの?
o1モデル並みの実力
りょう:ただ安いだけじゃないんだ。性能面でもOpenAIのo1モデルに匹敵するんだよ。
ゆう:どうしてそんなことができるの?
りょう:アメリカが中国への高性能半導体チップの輸出を制限している中、DeepSeekは旧型半導体チップを活用して高性能な生成AIを開発したんだ。強化学習の重視、統計値に基づく報酬決定、そしてモデルの蒸留によるコンパクト化がポイントだよ。
DeepSeek-R1の論文はこちら
ゆう:工夫しているんだね。
オープンソースの強み
りょう:OpenAIの生成AIはモデルの内部が非公開で利用制限がある。こういうのクローズドソースっていうんだ。
ゆう:秘密主義だね。
りょう:対照的に、DeepSeek-R1はモデル自体が公開されていて、誰でも使用、複製、改変が可能なんだ。
DeepSeek-R1のGitHubはこちら
ゆう:こちらはオープンなんだね。
りょう:そう、オープンソースっていうね。
ゆう:なんでDeepSeekはそんなことをするの?
りょう:誰でもモデルを検証・改変できるから、問題の修正や改善が進みやすくなるんだ。多くの人に使われればブランド力も向上し、業界標準となれば市場での支配力も強まるよ。
ゆう:世界に広めたいってことだね。
AIモデルのコモディティ化
りょう:DeepSeek-R1のようなオープンソースのAIモデルが出ると、誰でも自由に利用・改変できるから、今後、似たり寄ったりの生成AIが市場に溢れることになる。
ゆう:そうなるとどうなるの?
りょう:モデルの性能そのものよりも、「使いやすさ」や「魅力的な体験」が競争の鍵となるよ。
ゆう:たしかに文字入れたり、結構だるい。
生成AIとUIの融合
りょう:低コストで生成AIが利用できるようになると、それを組み込んでサービスを提供する企業が増えるだろうね。
ゆう:安いもんね。
りょう:その際に重要なのは、いかに魅力的なサービスを提供できるか。特にUIの魅力が差別化のポイントになるよ。
ゆう:正直、今の生成AIはあんまり使わないんだよね。ところで、UIって何?
りょう:生成AIとユーザーをつなぐ窓口のことだよ。スマホの画面やマイク、スピーカーなどがそれに当たるね。
ゆう:なるほど、分かりやすい。
生成AIにおけるUIの拡張
りょう:今後は生成AIとUIを組み合わせて、魅力的な体験を提供することが重要になる。
ゆう:体験?どんな発想が必要だろ。
りょう:例えば、現在の生成AIは文字入力(プロンプト)が主流だけど、これを拡張する方向も考えられる。入力チャネルの拡張だね。
<入力チャネルの拡張>
・スマートグラスで見た周囲の映像を入力
・動作・心拍数・血圧から推定した感情を入力
・睡眠中の脳波から夢を入力
・超音波・放射能など五感を超えた情報を入力
ゆう:確かに面白そうだね。
りょう:同様に、生成AIの出力も文字だけでなく、さまざまな形に拡張できる。出力チャネルの拡張と呼ぼうか。
<出力チャネルの拡張>
・バーチャル空間を出力
・動画配信映像を出力
・触覚、臭覚、味覚など視覚以外の感覚を出力
・状況に応じた表情や声の抑揚を豊かにして出力
ゆう:たくさんアイデアがあるね。
りょう:さらに、生成AIへの入力を「現時点」のみならず、時間軸を拡張することも考えられる。つまり、時間の拡張。
<時間の拡張>
・過去の会話履歴や行動履歴を入力
・日々測定する膨大なライフログ(映像、音声、血圧など)を入力
・スケジュールと連携した未来の内容を入力
・ライフログから推定した未来の出来事を入力
ゆう:時間も旅するような感じだね。
りょう:他にも、生成AIへの入力に他の人も関与させる方向性もある。これは、関係の拡張。
<関係の拡張>
・友達同士の生成AIが自動的に会話し、その内容を入力
・生成AI同士が交流するSNSに生成AIを介して参加
ゆう:可能性は無限だね。
UIの知財を守る
りょう:せっかく魅力的なUIを実現しても、そのままだとすぐに真似されてしまう。だから、UIをどのように守るかが重要。
ゆう:特許を取るとかの話?
りょう:その通り。技術的なアイデアについては特許を取得できるし、UIの特許は特に強力だよ。
ゆう:強力ってどういうこと?
りょう:UIは「見た目」で判断しやすいため、模倣された場合に特許を利用しやすいんだ。一方、モデル自体の特許だと「真似されているかどうか」が分かりにくい。生成AIの内部動作は見えないからね。
ゆう:見た目なら分かるもんね。
りょう:また、画面のデザインについては意匠権で保護することもできるよ。
ゆう:特許とは違うの?
りょう:うん。特許は技術的なアイデアを守るもの。意匠権はデザインを守るもの。
ゆう:AIで作った動画とか?
りょう:いや、動画とかのコンテンツは特許や意匠権では保護されないんだ。特許や意匠権で保護できるのは、UIの操作用画面とか表示画面とかだね。
ゆう:UIのアイデアは特許で、UIのデザインは意匠権ってことね。
今回のまとめ
DeepSeek-R1の優れた性能と低コスト:OpenAIのo1に匹敵する性能を持ちながら、API料金が95〜97%低価格。
DeepSeek-R1はオープンソース:モデルが公開され、誰でも使用、複製、改変が可能。
AIモデルのコモディティ化:生成AIの性能の均一化が進み、「使いやすさ」や「魅力的な体験」が競争の鍵に。
生成AIとUI/UXの融合:魅力的なUIがサービスの差別化に重要な役割。
生成AIのUIの拡張:入力チャネル、出力チャネル、時間、関係の拡張のアイデアが考えられる。
知的財産の保護戦略:特許や意匠権を活用し、UIの保護が必須。UIの特許は強力。コンテンツは特許や意匠権では保護されない。
今回も最後までお読みいただき、ありがとうございました。
弁理士 中村幸雄https://docs.google.com/forms/d/1oLtmon268KUTsEiMQF8Qoq6g877G9bjpxdCc5zWYZLc/edit