【CUI>GUI>AUI?】生成AIのUIはどこに向かうのか ーGoogleサイトで作るグループウェア(144)ー
🙇🏻いつも、Googleサイトで作るグループウェアを見ていただき、ありがとうございます!
この記事を読んで欲しい方
企業DXや校務DXの進め方に悩んでいる方
クラウドアプリの導入に悩んでいる方
自分だけのGoogleサイトを作ってみたい方
①CUIとはなにか
みなさん、CUIってご存知ですか?
Perplexityによると、CUI(Character User Interface)とは、コンピューターとユーザーのやり取りを文字ベースで行うインターフェースのことです。以下にCUIの主な特徴を説明します:
テキストベースの操作: CUIでは、キーボードからコマンドを入力して操作を行います。
コマンドライン: 文字列を入力し、その結果が文字列として表示されるウィンドウやターミナルを使用します。
効率性: 繰り返し作業や大量のデータ処理において、CUIは高い効率性を発揮します。
自由度: 複雑な操作も簡単に実行でき、自動化も可能です。
学習コスト: GUIと比較して直感的ではなく、習得に時間がかかる場合があります。
用途: プログラミングや高度なコンピューティング、システム管理などで広く使用されています。
履歴管理: 作業履歴を残しやすく、ミスの原因特定が容易です[2]。
環境適応性: 基本的にどのような環境でも動作し、リソースの少ない環境でも使用可能です。
CUIは、特にエンジニアや開発者にとって重要なツールであり、コマンドを習得することで作業効率を大幅に向上させることができます。
何かに似てますよね?
そうです、いまのAIが採用しているプロンプトを入力するインターフェースはCUIそのものなのです。
②CUIからGUIへ
多くのパソコン用OSは、歴史的にCUIからGUIへ移行してきました。
GUIとは、Graphical User Interface(グラフィカルユーザーインターフェース)の略称で、コンピューターとユーザーのやり取りを視覚的に行うインターフェースのことです。以下にGUIの主な特徴を説明します:
視覚的な操作: アイコン、ボタン、ウィンドウなどのグラフィック要素を使用して操作を行います。
直感的な操作: マウスやタッチパネルを使用して、クリック、ドラッグ、スワイプなどの動作で直感的に操作できます。
初心者向け: 文字やコマンドを入力する必要がないため、初心者でも簡単に操作できます。
普及率: 現在では広くGUIが採用されており、WindowsやMacなどの主要なOSで実装されています。
視覚的フィードバック: 操作の結果がすぐに画面上で確認できるため、ユーザーにとってわかりやすいです。
リソース要求: CUIに比べて、快適なGUIを提供するにはコンピューターに高い性能が要求されます。
用途: 日常的な操作や一般的なアプリケーションの使用に適しています。
GUIは、その直感的な操作性により、コンピューターの操作を大幅に簡略化し、一般ユーザーにとって使いやすい環境を提供しています。
ただし、専門的な作業や効率を重視する場面では、CUIと併用することで最適な操作環境を構築できます。
さて、生成AIのUI(ユーザーインターフェース)は何が最適になるのでしょうか?
③AIの2つの方向性
以前、AIはソフトウェアでできたCPUという記事を書きましたが、いわゆるAI自体を作っている企業はCPUを作っているのと同じです。
そして、既存の生成AIを使って、グラウンディング、ファインチューニング、プロンプトエンジニアリングなどを行って、アプリをつくっている企業は、ソフトウェア・アプリケーションを作っているわけです。
これらの企業は、ドメイン特化(業界特化)したAIアプリを作る傾向が顕著です。
つまり、彼らはユースケースへの適合を目的としているわけです。
さて、多くの場合、後者は参入障壁は低いのですが、NotebookMLのように、CPUを作っている会社がいきなりアプリケーションを作ってしまう危険性も多々あります。
CPUを作っているIntelが、Wordソフトを作ったようなものです。
実際、NotebookMLが出て暗雲立ち込めてしまったスタートアップ企業も多いのではないでしょうか?
④つぎのUIはAUI(アバター・ユーザーインターフェース)なのか?
今後、AIはAGI(Artificial General Intelligence;人工汎用知能)に進化すると言われていますが、そのときUIはどうなっているのでしょうか?
汎用的な人工知能ができた場合には、アバターのような顔を持った対話型のUIが出てくる可能性があります。
ここでは、それをAUI(Avatar User Interface)と呼ぶことにします。
しかし、AGIとくらべて、ドメイン特化したAIアプリにはAUIは必要ないかもしれません。画面の裏で気の利いた自動化をやってくれていれば良いわけです。
以下は1988年にAppleのジョン・スカリーが作ったアバターを使ったAIのコンセプトビジョン動画(ナレッジ・ナビゲーター)です。
これを見る限り、いくつかのAIが連携して動いていることがわかります。
アバタータイプ、声だけのもの、分析に特化したもの、電話で呼び出す、電話で応対する、スケジュール管理など、画面の後ろでAIが忙しく働いていることが見て取れます。
これは、AppleVisionProのコンセプト動画ですが、自分の顔をスキャンして生成されたアバター(ペルソナ)が登場しています。
AI自体が専用のアバターを持っているAUIではありませんが、それも時間の問題だと思わせる動画です。
(個人的にAppleの空間コンピューティング環境自体は素晴らしいと思いますが、このデバイスが普及するとは到底思えません。まだナレッジ・ナビゲーターの方が現実的です)
⑤おわりに
いかがでしたでしょうか?
UIからみたAIは、いまだに初期レベルのままなのです。
Perplexityによると、CUIからGUIまで約15〜20年かかったと言われていますが、今後のデバイスはあと何年でAUIを持つことになるのでしょうか?