まちづくりのための生成AIワークショップを開催しました (6/25)
6月末に開催した画像生成AIワークショップのレポートです!
1. 民意の反映のためのAIワークショップ
1-1. コンヴィヴィアルなAIを目指して
画像生成AIは誰でも簡単に絵を描くことができるツールです。しかし、その生成でベースとなっている無数の画像は、普遍的なようでどこか偏りのある不透明なデータセットです。同時に、AIは一部の企業や開発者たちによる寡占状態に陥りやすくもあります。
私たちは、この強力すぎるゲームチェンジャーを市民に開き、ボトムアップな使い方を探索するためにこのプロジェクトを始動しました。比較的クリーンで透明な画像生成AI "stable diffusion" の "LoRA" という機能に着目します。追加学習と呼ばれるこの手法は、生成のためのデータセットを自分たちで新たに構築するものです。自分たちで撮った街の写真は、自分たち独自のAIとなり、自分たちが望むまちづくりのための画像生成ツールとして機能します。
民主的なまちづくりにおいて、この技術の自治は大きな意義を持つと考えます。イリイチが提唱したコンヴィヴィアリティとは、いかに公平で制御可能で持続可能な技術を目指すかというものです。自分たちの手で作られたAIは、誰でもアクセス可能な集合的記憶として共有されます。まちづくりにおけるコモンズとしてのAIの可能性を探っています。
1-2. イベント概要
生成AIに触ったことない方にもたくさん来ていただけました。ありがとうございました!
今後は、より実践に近づけるため、一般の市民の方々にも参加していただきたいと考えています。まちづくりに多様な視点を取り込んでいきたいです。
1-3. ワークショップフロー
今回のワークショップの目標は3つあります。生成AIとの対話と創造を楽しむこと、都市開発の未来に思考を巡らすこと、そして、渋谷らしさを見つめ未来の渋谷を想像することです。
これがただの stable diffusion 講習会になっては面白くありません。生成AIはあくまでツールで、それを用いてどのように都市を新たな視点で考え直すかが今回の狙いです。
街を観察し「LIKE・NESS」を発見するFIELDWORK、発見した地域性をもとに都市の物語を生成していく(non)CODING、物語を共有して都市と合意形成の未来を考えていくTHINKING の三部構成で行います。
2. 街を歩き渋谷の物語を生成する
2-1. 街を歩く
渋谷のらしさを観察するにあたって、性格の異なる3つのエリアを選びました。煩雑でストリートにぎわうセンター街、商業的に洗練された宮下パークやPARCO周辺、都市の裏の顔としてナイトカルチャー溢れる道玄坂。各チームごとに担当エリアの写真を撮り、「NESS・LIKE」を再確認していきます。
ここで撮った写真は、各チーム独自のLoRAの学習画像として使用されます。ストリートのような街並みスケールから、放置傘のようなモノスケールまで、彼ら独自の視点による渋谷らしさや好みが反映されることになるでしょう。
またLoRAの構築過程では、AIの画像認識を用いて画像に含まれる単語を列挙していきます。以下のように、画像に登場する単語の頻出順で並べ替えてみました。
しかし、これだけでは渋谷の特徴がほとんど見えてきません。AIによる言語化とは別に、人間による言語化を行っていきます。Miro上でそれぞれが感じた渋谷の「NESS・LIKE」を洗い出してもらいました。言語化することで渋谷という都市を見つめ直します。挙げられた単語は、画像生成でのプロンプトの参考になります。
2-2. 渋谷らしさを構築する
集めた写真からそれぞれのチームのLoRAを作ります。今回は合計で400枚ほどあったため作成には2時間ほどかかりました。ワークショップの途中から使ってもらいました。
LoRAはプロンプト内で呼び出します。下のようにトリガーワードを設定したので、それがプロンプトに入った状態で生成すると、それに対応した雰囲気を再現してくれます。
どのくらいLoRAが渋谷らしさを再現しているかを確認してみます。以下にそれぞれのチームのLoRAの比較を載せました。現実の景観に異質な物体を溶け込ませることで、どのくらい機能しているかを見てみます。プロンプトは全てのエリアで統一し、トリガーワード(エリア名)のみを変更しています。
<lora:shibuya-workshop> strange monster in dogenzaka
それぞれのエリアが上手く再現できているのが分かります。異質な怪物が上手くその街に溶け込めていることを見ても、AIの凄さが分かります。
このように、LoRAを用いてワークショップを行うことで、その地域らしさを再現しつつ撮影者の視点も反映された画像をもとに議論を進めることが出来ます。しかし壁もいろいろあり、作成時間や再現クオリティ、生成クオリティなどがまだネックとなりそうです。今回は、LoRAよりも扱いやすい、一枚の画像から雰囲気をくみ取る controlnet reference-only という機能を使っていたチームも多かったです。
2-3. 渋谷の街に都市農場を埋め込んでみる
フィールドワークと言語化作業が終わったら、いよいよ画像生成に入っていきます。stable diffusion に触ったことのない方もたくさんいたので、まずは慣れて楽しんでもらうための課題を出しました。
生成AIのレクチャーに加え、以下のような機能カードを作り、それを参考にしながら色々試していくという形になっています。カードゲームの手札のように、自分たちの使える機能を状況に応じて出していくイメージです。
第一課題のタイトルは「渋谷の街に都市農場を埋め込んでみる」です。各エリアに緑を追加してリジェネラティブな未来を描画してもらいました。このように画像として提示してもらうことで、ただの想像ではない具体的な未来像が思い描けるのはとても楽しく有意義だと感じました。
この画像を生成するのにも、実際に触ってみなければ分からない大変さが色々あります。あまり緑が多くない渋谷のLoRAをベースに緑を出すには、プロンプトや数値のさまざまな調整が必要です。(farm:1.5) のようにプロンプトの重み(影響度)を上げてみたり、<lora:0.6> のようにLoRAの重みを下げてみたり。そのような調整と反復を通して、最終成果物として提示されたクオリティの高い絵が出来上がります。
2-4. ありうる渋谷の変容をストーリーテリングしてみる
第二課題は「ありうる渋谷の変容をストーリーテリングしてみる」です。フィールドワークで集めてきた写真から構築したLoRAをもとに、渋谷の未来を物語として提示してもらいます。現実的な未来とぶっ飛んだ未来の二つを描くことで、生成AIの能力を最大限味わいながら、都市の大規模開発への介入について考えてみます。
第一課題に比べて難易度はかなり上がっています。物語として成立させるために、ある程度自分たちが狙った画像を生成する必要が出てきます。また、渋谷らしさを維持しながらぶっ飛んだ絵を生成するのもなかなか大変です。
これまでの素材をフル活用していきます。フィールドワーク後に整理した言語化素材、stable diffusion の機能をカード化した手札、第一課題で鍛えた画像生成力、そして建築・都市の分野で培ってきたストーリーテリング能力。生成AIを物語生成のツールとして用いる方法を味わってもらいました。
各チーム素晴らしいストーリーが出来上がりました。ここでは再開発チームBの作品を見てみます。他の作品は3章に掲載しています。
3. 複数の物語、未来
各チームの最終成果物を掲載していきます
(再開発Bチームは2章に掲載してあります)
3-1. 渋谷の都市農場
第一課題「渋谷の街に都市農場を埋め込んでみる」になります。
自分で撮ってきた写真やLoRAを下敷きに、渋谷に現実的な農場を挿入してもらいました。都市に緑を埋め込むというのはよくある話題だとは思うのですが、このように具体的に画像として描写することで一気に現実味を帯びてきます。ありえる渋谷と都市農場の未来像を提示してもらいました。
3-2. 渋谷の未来の物語
第二課題「ありうる渋谷の変容をストーリーテリングしてみる」です。
短い時間でSF的にストーリーテリングを完成させるのは難しかったと思うのですが、上手くまとめられていて見応えがあります。各チームによってさまざまなアプローチがあったのが面白かったです。
放置傘という小さな渋谷のオブジェクトから未来都市を考えた道玄坂チーム、ハチ公とロボットと発電所という異質の存在を結びつけつつ同じ敷地での景観を描画したセンター街Aチーム、プロンプトのマトリクスや数値比較を通して渋谷らしい緑とは何かという問いに向き合ったセンター街Bチーム、むき出しのダクトに着目し緑と都市インフラがともに成長する未来を物語った再開発Aチーム、栽培やアートの観点から宮下パークにおける植物と人間の関係を時系列で示した再開発Bチーム。
どれも楽しくも示唆的な物語でした。
3-3. 物語の共有
物語を大きなスクリーンで共有してもらいました。
A1サイズで印刷もし、フィジカルに生成物と向き合えるようにしました。好きな画像やストーリーにシールを貼りお互いの講評をして、このワークショップは締めくくられました。ありがとうございました!
4. THINKING
4-1. 交流
17:00以降はTHINKING の時間でした。立食パーティ形式で、各々の感想や意見を交換しました。設計事務所の方も交えたワークショップの振り返りや、生成AIを本格的に使っている人たちの情報交換、AIと都市を見据えた建築都市論についてなど、さまざまな話が盛り上がっていました。
4-2. 振り返り
今回のワークショップを通じて、生成AIの良い側面から乗り越えなければならないハードルまで色々知ることが出来ました。その中からいくつか共有させていただきます。
まず、stable diffusion の難しさがハードルとなります。midjourney に比べて自由度や拡張性が高く踏み込んだ使い方が出来る反面、感覚的に使いこなすまでにはそれなりの時間がかかります。今回はファシリテータ側にstable diffusion を熟知した者が一人しかいなかったため、なかなかサポートしてあげることができませんでした。実際に一般の方々向けにワークショップをしようとなると、さらにそのデジタルディヴァイドが大きな壁になってくると思われます。
また、LoRAの技術的難しさもありました。LoRAの構築に関しては私が担当したので(時間的問題を抜きにすれば)滞りなく進んだのですが、LoRA自体がまだクオリティの低いところが問題です。学習画像を上手く吸収できていなかったり(構築時の各パラメータ設定の甘さかもしれませんが)、LoRAをベースにした状態では画像の単純なクオリティは下がってしまったりと。画像一枚から雰囲気を得る controlnet reference-only という機能のほうがクオリティは高いため、今回はむしろこの機能を使っているチームが多かった印象があります。
一方で、画像生成AIとの対話・創造のプロセスはとても楽しんでもらったように思います。簡単に高品質の画像を生成してくれるという点はやはり魅力的で、良い画像を出すためにプロンプトやパラメータの調整といった機械との対話作業を体験してもらえました。ワークショップにおいて、この楽しさというのは重要な要素だと考えます。市民が主体的に参加するには、議論のつまらなさや自分との乖離という壁を取り払う必要があります。
また、コンピュータの中で仮想の画像を生成することで、むしろ現実の街をより深く知ることが出来ました。どのチームも渋谷らしい画像を心がけるなかで、どうすれば渋谷を描写できるのかを議論していました。特にセンター街Bチームは、渋谷らしい緑とは何かという問いに対して分析的にAIを用いていました。このワークショップがフィールドワークから始まったということも含め、楽しみながら都市を再考するきっかけとしての画像生成AIの強みを感じました。
4-3. さいごに
ここまで読んでいただきありがとうございました!
今後も、生成AIの民主的活用について考えていきます。ワークショップもまた開催する予定なので、stable diffusion を触ってみたいという方も含め、ぜひご参加お待ちしております!
コーヒーいただけたらとても嬉しいです!
この記事が気に入ったらサポートをしてみませんか?