話題のClaude「Artifacts」は対話型AIにおける「UX革命」である
ChatGPTのライバルサービスの一つである「Claude」が、彼らのサーバーが一時パンクするくらい話題になっている。
その理由は、運営元のAnthropicが発表した2つのリリースだ。
リリースの1つ目は新しい大規模言語モデル「Claude 3.5 Sonnet」のリリース。そしてもう一つが、今回の話題の中心である「Artifacts」機能のリリースだ。
「Claude 3.5 Sonnet」は、ほぼ全てのベンチマークでOpenAIの最新モデル「GPT-4o」を打ち負かしており、処理スピードは前モデルの「Claude 3 Opus」の2倍で、API費用は1/5程度に下がっている。
シンプルに性能、速度、費用面などの面でトップクラスの大規模言語モデルが登場したのだ。
しかし、今回Claudeが話題になっている理由は「Claude 3.5 Sonnet」というよりも、もうひとつのリリースである「Artifacts」機能の方にある。
「Artifacts」 機能とは
「Artifacts」機能とは、一言でいうと、「コードを生成するだけでなく、その実行結果として生まれるゲームやグラフなどをプレビュー表示してくれる機能」のことだ。
いままでのClaudeでは何かやりたいことを伝えて、それを実現するためのコードを生成してもらうところまではできたが、そのコードをClaude自体に実行して結果を返してもらうことはできなかった。
しかし、「Artifacts」ではその「コードを実行」した上で、「実行結果をページ上で表示、操作可能にする」ところまで担ってくれる機能というわけだ。
イメージしやすいように、いくつか具体例を紹介しよう。
遊べるゲームの生成
インタラクティブなUXボードの作成
フローチャートの作成
編集可能なエディターと原稿のセットの作成
「Artifacts」 は何がすごいのか?
Artifactsが「コードを生成するだけでなく、その実行結果をプレビュー表示してくれる機能」と聞いて、「ChatGPTのCode Interpreterと何が違うのか?」と疑問を持った人も多いのではないだろうか?
「Code Interpreter」も以下noteで解説した通り、「ChatGPT上で"コードの実行結果を提供できる"機能」という点で「Artifacts」と似ている。
「コードを生成するだけでなく実行まで行う」という点では両者は同じだ。
しかし、「Aritifacts」の方が圧倒的に、「実行結果が見やすく」「インタラクティブ」だ。
「Code Interpreter」が単純に「実行結果だけを返す」のに対して、「Aritfacts」の方は「実行結果をウィンドウ上に表示して、必要に応じて操作可能」な状態を作ってくれる。
つまり、「Artifacts」はUX面で「Code Interpreter」を圧倒的に上回っていると言うことができる。
今までOpenAIがUX面では頭一つ飛び抜けていたが、大規模言語モデルの性能だけでなく、UX面でも逆転現象が起き始めてる。
「Artifacts」が今後の対話型AIサービスのUXに与える影響
また、今回の「Artifacts」 は、今後の対話型AIサービスのUXの進化の方向性を規定するものとしても注目すべきだ。
ChatGPTなどの対話型AIサービスの弱点は「対話型」というUXに縛られてしまう点だ。
タスクによってはユーザーが求めるUX+UIは対話形式ではなく、個々の目的に合わせた最適なインターフェイスが存在するはずだ。
そのため、ユーザーの目的に合わせて即座に最適なUIを生成して提供する「Instant Interface」的な発展が当面の対話型AIサービスのUX面での進化の路線だった。
実際に、Googleが対話型AIの中で都度最適なインターフェイスを提供する発表をしているのが好例だ。
しかし、Anthropicは、それを更に発展させて、「Instant Application」、つまりユーザーの目的に合わせて最適なアプリケーションをその場で提供する、というユーザー体験を実現させた。
これは今後の対話型AIサービスが目指す方向性になると思う。
▼ Claudeが即座にタスク管理 "アプリケーション" を生成した動画
What's Next?
「Aritifacts」は現状でも十分すごいが、性能面や利用ハードルの高さなどの面で改善の余地がある。
性能面でいえば、万能ツールではなくエラーを吐き続けてしまうタスクも存在する。
しかし、冒頭の話に戻るが、今回新しくリリースされた「Claude 3.5 Sonnet」はClaudeの中で「中位モデル」だ。
最大モデルサイズのラインであるOpusの3.5世代のものが出たら当然だが、もっと性能は高くなる。
利用ハードルの面では、やはり「一般の人が気軽にClaudeに聞いて、その都度最適なUIが提供される」という状態にはまだ至っておらず、「組み合わせると便利な開発言語を知っている玄人が特殊な指示をすると色々と面白いことができる」という状況だ。
しかし、この2つは比較的改善の道筋がハッキリしている部類の課題だ。
今後、Claudeがどのような進化をしていくか今から楽しみだ。