見出し画像

徒然日記 | 生成AIと踊った1年を振り返る

どうも、Experience Designerのしょーてぃーです。

ChatGPTがリリースされてから怒涛の1年間がたった。
最近の考察や自分が考えていることを、断片を徒然なるままに書きたくる。
8,000字程度ですが、身構えなくて大丈夫です。

今年の前半に書いた「AI時代の向き合い方」も合わせて読むのがオススメです。






(残念ながら)「生成AI」という言葉が流行語大賞に

今年の「新語・流行語大賞」のTOP10に「生成AI」が入り、メディアアーティストの落合陽一さんが受賞した。

落合さんが受賞の打診を受けた際の最初のリアクションは、「受賞対象者はOpenAI CEO サム・アルトマンじゃないのか?」だったという。きっと彼がふさわしいと思ったんだろう。

アルトマンは受賞するの嫌だろうなとも思った。
これは2月の彼のツイートだ。

「ジェネレーティブ AI」は馬鹿げた言葉であり、定着しないことを願っている。

過去何度か登壇や記事で話をしたが、AIの本質は「生成」ではなく「推論」なのではないか。

私が思うに…よく見かける”Generative AI”という言葉は、一見クリエイティブを模倣また生成するだけのように思われがちだ。そして目に見える生成物の良し悪しに人々の関心や思考が偏ってしまう。


ただ、実際のところ今起きているこの革命の重要な点は、我々が既知の事柄を元にして未知の事柄について予想し論じる=「推論」 をAIが行い、そして生成・実行してしまうことだ。


「推論」とは、既知の事柄から未知の事柄を予想し論じることを指します。この推論能力はクリエイティブ業界だけでなく、人類全員に関わる革命的な話であると当時から理解している。

思い浮かべてみよう…生活のなかでちょっとしたことを決めるときから、企業で意思決定をするとき…多くのシーンで私たちは連鎖的に推論をつかっているのだ。

AIといっても色々種類もあるし、「生成AI」という言葉を否定しているのではなく、それ自体はみんなと同じコンテクストを共有できるから便利だ。一方で、意識としては「推論」に焦点を当ておいたほうが、AIの可能性を引き出しやすいだろう。


AIと社会変革の実感

ChatGPTなどのインターフェースによりAIの力が多くの人々の手に渡り、仕事や個人生活において大きな変化が起こっている。日常の様々な場面でインターフェースのもたらす影響力を肌で感じ、その重要性を認識した1年だっただろう。

ただ実は、ChatGPTはもともと製品版として作られたわけではなかった。

ChatGPTは元々製品として作られたわけではありません。これは「控えめな研究プレビュー」として構築され、適切に調整された言語モデルの向上する能力を示すためのものでした。

そのChatGPTが幸か不幸かすごい勢いで流行した。
リリースから1週間で100万ユーザーだったのだ。

ただ、「控えめなプレビュー版」にもかかわらずそのインターフェースが一般化し、模倣されるようになったことは事実である


AIサービスへの慣れと受け入れの遅れ

生成AIはその便利さにも関わらず、とくに日本国民の利用は一時的なものに留まりがちだ。「こんなもんか」と一度の使用で判断し、生活に組み込まない人も多いメンタルモデルを的確に捉え、ユーザーにとって意味のあるAIサービスの設計が進んでいないこと、さらには生成AI技術の更新スピードの速さが、利用に対する不確実性やリスクを感じさせる原因かもしれない。

ここは一つに我々デザインの領域の人間の反省点でもある。

「チャットUIがいいのか問題」はよく議論されている。先程のメンタルモデルの話にあるように、自由度が高いので何をすればいいのかわからない、何ができるのか分からないという状態からまずは脱却が急がれる。

CLI(Command Line Interface)の時代にインターフェースは一気に戻ってしまったのだ。

難易度が高まる期待値のデザイン

期待値のデザインは、プロダクトやサービスの初めての使用から継続的な使用に至るまでの、ユーザーの期待と実際の体験の間に生じるギャップを埋めるプロセスだ。

この期待値のデザインが適切にされていないプロダクトやサービスが多かったと感じる。

期待値のデザインを実現するためには、プロダクトやサービスの「価値」を明確に伝え、ユーザーがプロダクトやサービスを理解しやすい「メンタルモデル」を考慮し、そのプロダクトが搭載しているAIの「能力の限界」をはっきりさせることが重要である。

画像:PM DAOにて私が執筆した記事より

生成AIのようなテクノロジーは、ユーザーのインタラクションに応じてその結果が次々と変化し、その結果を反映したUXを提供することが求められる。つまり、 長期的な利用を通じて形成される総合的な体験設計の難易度が、従来のプロダクト設計に比べると難しいのではないかと感じる。

詳しく知りたい人は、翔泳社さんのメディアに寄稿しているのでどぞ

また、これをテーマに登壇もしているので資料をどぞ


プロダクトアウト型傾向の鎮静化

かつてはGPTのAPIを駆使した類似サービスが日々乱立し、市場への急ぎ足のリリースが目立っていた。しっかりとしたユーザー仮説を持たずにピボットする軸足を見失い、消えていくサービスも少なくなかった。しかし、今年の2月から5月にかけての動向が顕著だった後、市場は徐々に落ち着きを見せ始めている。この変化は、企業バリデーションを高めるために、とりあえずAIを導入することが一定の効果をもたらしたことが背景にあるのではないかとの推測もある。

生成AIの模倣に関する誤解の解消

生成AIがあらゆる創作物を生み出す能力を持つようになりつつあるが、それらが単なる模倣であり価値がないという誤解が広まっている。創作活動は常に先人の経験や知見から影響を受けるものであり、生成AIもこの点において異なるわけではない。既存の要素を組み合わせたり、新しい重み付けを行うことによって、まだ世界に存在しない独自の成果物を生み出す可能性に焦点を当てるべきだ。生成AIは、未知の潜在空間を探索し、発見されていない価値を創出する役割も担う。


AIの「推論」能力はまだ生み出されていないこと発見することもある。


もちろん著作権などの権利は無碍にしちゃいけない。

生成AIにおける平均点の誤解

生成AIが単に平均的な結果しか出さないという批評には飽き飽きしている。確かに、何の工夫もなく指示を出すだけでは、AIは平均的なアウトプットを提供するかもしれない。

しかし、すでに一部の分野では人間の能力を超えるAIモデルが使用されており、適切な指示や組み合わせによっては、AIに平均を超えた思考や結果を出させることは十分に実現可能である。潜在空間を狭め、より特定の結果へと導くことで、平均的ではないアウトプットを導くことができる。


ただ、いわゆる超プロフェッショナルの流儀やスキルに到達するには、もう少し時間がかかりそうだ。というのも言語化されていない、そのデータと取得できても評価できないからだ。


あーこれはAIの力を借りてもここまではいけないな…というアウトプットは世の中にまだまだある。


プロンプト云々

残念なことに、プロンプトを学んでも”AIを使いこなせる人材”には恐らくならない。(仮説的な意見なので、異論はあるだろう。

自頭力がないと伸び幅に限界があるように見える。

私はプロンプトの勉強をもっとしたほうがいいですか?と(時間がある時に)聞かれると、

「自頭力か英語を勉強するほうがレバレッジきくよー」と返すことにしている。

自頭力とは一般的には、「抽象化能力、フレームワーク思考力、仮説や問いを立てる能力」に分解されるという。

プロンプトを学ぶと初期的には能力は上がり、プロンプトのテンプレも利用でき、ある程度のことはできるようになる。


ただ、その後にもっと難しいプロンプトをやっても恐らく能力は上がらないし使いこなせないし、新しいものも生み出せない。

プロフェッショナルな人は、更にぐっとAIのちからをレバレッジしもっと突き抜けている。

つまり中間層ないしは中間層よりちょっと下の層が恩恵を受けにくい状態だ。

プロンプト自体はそこそこ大切なのだが、基礎学習が終わったらどのように先程の地頭力を鍛えることができるのかにフォーカスしたほうが、結果的に”AI人材”につながると考えている。

プロンプトは結局、「世界の捉え方」だからだ。

(私は後天的にもある程度、思考力を伸ばすことができると勝手に信じているタイプ)

プロンプトを練って考える未来も近いとおもいつつも、まだもうしばらく必要になるだろう。

あとは、英語(笑)。私も今絶賛英語を学んでいる。

「え?だってAIでリアルタイムで翻訳できるようになるじゃん!いらないでしょ!」という意見もあると思うが、その話はまたいつの日にか。

備忘録:プロンプティング、プロンプト・エンジニアリング、プロンプト・デザイン色々言葉があって大変よね。こんなすごいプロンプトできましたは、個人的にプロンプティングでいいと思っている笑


デザイナーの心理・行動変容へのフォーカス

生成AIがクリエイティブワークにおいて、強化や代替、リプレイスを可能にする現実が近い(広範囲で限定的)。商業デザイナーは、美しく洗練されたアウトプットを生み出す能力は当然としつつ、その作品が人々の体験や社会に与える影響という視点を重視するべきだ。形だけではなく、心理的・行動的な変容を促すデザインの重要性が一層高まっている。

コンセプトの言語化とデザイナーの役割

「ロゴ制作は今や一瞬で完了。デザイナーの時代は終わった」という声は、ソーシャルメディアで頻繁に目にする。

デザインのオペレーショナルな仕事はたしかにAIの影響で厳しくなっていると海外のニュースではみる。安定した雇用環境を有する日本では、あまり危機感はないのかもしれない。

ただデザイナーとしてこだわりをもつべきは、なぜその表現を選んだのか、その背後にあるコンセプトやストーリーの言語化であり、それが欠けている作品は、無機質なAIの生成物と何ら変わるところがない


思索と意図を込めたデザインこそが、プロンプトによる瞬間的な産物との決定的な差異を生むのだ(表面的にはわからなくても)。

ただ、コンセプトとアウトプットの双方を同時に扱えるAIツール設計はまだみない。(ChatGPTだとできるが、多くの人はやらない)

私は講義で呼ばれると企画書の書き方のようなプロンプトはやらずに、この双方をどう接続したAIツールの使い方をするかなどをレクチャーをしてしまう。


話は少しそれてしまうが、UXデザイナーについては欧米の流れを組むとデザイナーはより戦略貢献、数値・パフォーマンス貢献、技術理解と適応が求められるというハードモード。


再帰の呪い、モデルの崩壊

毎日毎日、多くの生成AIコンテンツがインターネットに流れ出している。

AIが自身で作ったコンテンツを学習する「自己参照型ループ」が原因で、AIの「モデル崩壊」が起きている(近いうちに顕著になる)のではないかという研究がある。

もう少しかんたんに説明してみよう。

AIが新しいデータを作る時、いくら条件を整えても、時折間違いが混じることは避けられない。この間違いは、AIが学習を続けるうちにどんどん積み重なり、AIはその積み重ねた間違いを「正しい」と覚えてしまう。

つまり、AIは間違った情報をもとにさらなる間違ったデータを作り出し、その結果、現実の世界とは違った「間違った現実」を理解するようになる。これが長期にわたって続くと、AIの知識は現実から大きく離れてしまうというわけだ。

Model Collapse


ここからは私の心づもりに過ぎないが…

加えて、画像・動画生成AIにおいても、それらの作品の多くの画像や動画は「AI work」とだけつけられた説明も多いだろう。多くの美術品は、研究内容、歴史的背景、考察などの説明とセットで学習されているという。

では、生成AIが生み出した学習サンプル果たしてどうなのか…? 

我々がコンセプトの言語化を放棄したつけが更に回ってくるのか?


私には分からない。

参考:
The AI feedback loop: Researchers warn of 'model collapse' as AI trains on AI-generated content | VentureBeat

https://venturebeat.com/ai/the-ai-feedback-loop-researchers-warn-of-model-collapse-as-ai-trains-on-ai-generated-content/

The Curse of Recursion: Training on Generated Data Makes Models Forget

https://arxiv.org/abs/2305.17493


デザインの脱植民地化とのバランス

「デザインの植民地化(Decolonizing Design)」とは、デザイン業界における多様性と包摂性を高めるための概念で、西洋中心の視点や手法から離れ、異なる文化や背景を持つ人々の視点を取り入れることを指すものだ。

デザイン史における重要な議論の一つであるバウハウス運動。この運動は機能性を重視し、芸術と工芸を統合するに大きく貢献した。

これによって一部の地域的、文化的特性や手工芸が抑圧や一部生産レイヤーの構造固定化(多くの場合貧困から抜け出せない)にも繋がったのではないのかという指摘がある。


日本もこの文脈で「デザイン植民地化」した存在でる。
多くの学習データセットが海外のものである以上、実は我々はそれらの視点や手法をより無意識に取り入れる可能性がある

それらの視点や手法が直接取り入れるわけではなくある種ベクトル的再構築として表現されるわけだが、胸にとめておくべく内容であろう。

デザインの植民地化については、まゆさんのプレゼンが参考になるのでチェケラ↓

Mayuさん/Principal Designer @ ustwo Tokyo


AIアダプティブな動力学モデル

この図は何を示しているのだろう。縦軸はある回数だ。

自分のTwitterの投稿回数である。

実は私はSNS無精で、ほぼROM。
頭では色々考え事をしていたが、それをちゃんと言葉にして伝わる文字として発信するのは極めて苦手だ。

ただ、発信はしてみたいという漠然とした想いもあった。
発信するところにきっと情報も集まってくるのだろうと。

昨年、11月30日にChatGPTがリリースして以来、2-3ヶ月間のTwitterの投稿の一部〜全部をChatGPTに肩代わりしてもらった。

自分の頭の言葉をただインプットするだけだ。
すぐに自分で書くコツが分かってくるし、何より心理的な抵抗がなくなってきた。

次は、どんなことを発信しようかと気づいたらモチベーションが湧き上がっていた。

ここから、コンセプチュアルにはAIアダプティブな動力学モデルが見えてくる。


心理的障壁:↓
意志力やモチベーション:↑
スキルと実行力:↑
進捗速度:↑↑↑


だから、生成AIって個人に与える影響もすごいよねというお話。

自己否定と自己実現のプロセス

長年の経験や培ったスキルが生成AIによって瞬時に代替されうる現実は、私にとっても痛感するものだった

そんな中での自己否定、つまり自分のスキルやUXデザインの手法がAIに取って代わられることを認めるのは、そんな簡単なことではなかった。しかし、この自己否定こそが新しい価値を創造するための大きな一歩となった。

私を代替する。

それが自分ができることだとおもった。


すると吹っ切れて色々発想が浮かんでくるのだ。
精神的には辛い過程だが、壊す勇気が新しい可能性を開いた。

今年2〜3月に友人のインディーズバンドのミュージックビデオで使うイラストの依頼を受た。そもそも私はグラフィックデザインは出来ない。

歌詞、彼らの想い、そして読み解けないギターコードに向き合いながら、ChatGPTを使ってキャラクターコンセプトを描き出し、それを画像生成プロンプトに昇華していった。

ちょうどControl-Netも出て画像生成から足を洗うときだった。なので、ChatGPTとMidjourneyだけでどこまでいけるのか自分の中では究極のチャレンジであった。

コンセプトのもとで、ストーリーボードに合わせた心理や状況の描写をおこなっていった。

youtubeで多く再生してもらえて嬉しい。


生成AIは、新しい領域に挑戦する背中を押す存在だろう。自分の作品が評価され、見る人に見られる喜び、そして生成AIの共創の可能性を実感する出来事であった。


AIエージェントによる体験変化

AIエージェントとはなにか聞いたことはあるだろうか?サムアルトマンがDevDayで何度も口走っていた言葉であり、これからはAIエージェントが主役となっていく。

AIエージェント(AI agent)とは、人間の介入なしに自律的に動作し、環境を認識して目標を達成するために行動を選択する人工知能システムを指します。

AIエージェントが自律的にあらゆるタスクを分解して、こなしてくれる、つまり対話型インターフェースが一挙に窓口として引受けるようなものだ。


これによって、新しいAIデバイスも現実になってきた。


これまでの体験設計の考え方は大きな変革を迎えつつある。


Pre-emptive AIが生活に溶け込んでいく

Pre-emptiveとは、ある問題やニーズが発生する前にそれを防ぐための
行動をすることを指す。

例えば、「喉が乾いた」と思う前には飲み物が与えられれているといった感じだろう。

少し未来の話にはなるが

ユーザーの要望だけではなく外部環境やユーザーの状況から察知することで、本来そこに発生していたはずの体験はなくなる可能性が高い。


ザラつきや意思決定のデザイン

体験がなくなっていく時に何がおこるのだろうか?

人間からサービス体験時の摩擦や意思決定を奪いすぎると
人生の幸福度はきっと下がるので、あえてザラつきを残す設計が
求められると思っている。

これは、ゲーミフィケーションの分野やSDT(Self-Determination theory/自己決定理論)を理論などから、私が感じることにすぎない。

車が自動運転になったとき車内体験がエンタメ化すると言われているように、他にアテンション(注意)を向け意思決定をし、楽しむものが代替していくのかもしれない。


バイアスと向き合う

昨年から一つの問いを持っている。


「人間はどうすればLLMを活用して、バイアスとうまく使っていくことができるだろうか」

多くの言動や意思決定をする際にバイアス(とりわけ認知バイアス)が関わるからだ。つまり、良い意味で可視化・制御できれば我々の人生はより豊かになる可能性も秘めている。

バイアスとは?
物事を判断するときに、自分の経験や固定観念、感情などによって、事実とは異なる認識や思考をしてしまう傾向のこと

(※ここでのバイアスは、学習アセットによるモデルの出力結果の偏りの話とはまた異なる)


そして、大抵のことはトレードオフの構造の中にいる。つまり、AをとったらBをとれない状態である。

ただ、それを破壊することができる可能性はいくらでもあるし、そういうことをしたい。それが、Experience Designerとして私が戦略や企画の上流工程に参画する1つの理由でもある。

だから、それができるサービスを作っている。

サムアルトマンが来日して慶應義塾大学で対談したときに、バイアスと向き合うことに有用であるとさらっと言っていたので、着眼点は間違っていなかったんだなとホッとしたことも覚えている。

人間の認知の限界を補完するためにAIを使うことができれば、私たちはより良い意思決定をすることができます

私たちは感情的になりがちですし、情報の制約や認知バイアスもあります。しかし、AIは感情を持たず、情報にアクセスできるだけでなく、それを理解することもできます。

したがって、AIは私たちが自身のバイアスや制約に気づかない場合でも、より客観的な意見を提供することができます。

サム・アルトマン

先日、聖地巡礼してきた。



そういえば、認知行動療法の領域である認知スキーマを診断し、気づかせるフレームワークもここ最近研究されているようだ。


意識は自動化・効率化の先へ

あらゆる企画・デザインプロセスの自動化を行ってきた1年であった。

リサーチ設計/インタビュー分析/インサイト抽出/デザイン・コンセプト作成/マーケティング・コンセプト設計/OOUIモデリング/ストーリーボード作成…..

しかし、これはできて当たり前であることは去年末くらいには想像が易い状態だった。

もちろん、コンテクストウィンドウの拡大、推論精度向上、マルチモーダル化が起因して実現できたものも少なくないことは確かだ。

ただ、これまでのプロセスやソリューションは人間のスキルや生成AIブーム前にあるツールやリソースの中でのベストエフォート(Best Effort)である。

このリソースや能力というパラメーターが大きく変化している今。
あらゆる前提を振り返り、破壊・再構築する創造的な破壊が必要であると感じている。

先程の、バイアスと向き合う話も密に関係している。


さて、まだまだ振り返りは半分以上あるのだが
読むのに疲れてきた頃だろう。

私は上手に生成AIと踊れただのだろうか。
我々は人間は生成AIの手の中で踊らされているのか、それとも演出家として振る舞えてるのか。ふと、そんなことを考える。



みなさまにとって
良い年になりますように。


この記事が参加している募集

いただいたサポートは、記事を書くモチベーションをあげるためのグミの購入に使わせていただきます!