お絵かきAIが切り開くオープンエンド研究の新たな可能性
みなさん、こんにちは。ALIFE研究者の岡瑞起です。
このnoteでは何回も取り上げているALIFEの研究において重要な「オープンエンド」というコンセプト。終わりなき進化を作るというALIFE研究分野のグランドチャレンジです。実際、多くのALIFE研究者がオープンエンド性(open-endedness)が重要な未解決問題(open problem)として捉え、研究に取り組んでいます。
具体的にどんな研究が行われているのか興味がある人は、ぜひ2020年に行われたTOKYO ALIFE 2020という会議の様子を録画した次の動画をチェックしてみてください。仮想世界でのシミュレーションから試験管の中でRNAを複製する実験を通した研究まで、さまざまな角度から行われている研究が分かりやすく紹介されています。
オープンエンドに関する研究の中で私が特に注目しているのが、ケン・スタンリー(Ken Stanley)らの研究グループが開発している一連の探索的な進化アルゴリズム(新規性探索、品質多様性、MCC、POET、ELMなど)です。
ケン・スタンリー氏の著書『Why Greatness Cannot Be Planned: The Myth of the Objective』の中で、一連のアルゴリズム開発のきっかけとなったのが2006年に開発したPicbreederというシステムだと述べています。
Picbreederとは、『利己的な遺伝子』の著者として有名な進化生物学者のリチャード・ドーキンズ(Richard Dawkins)が提案した、アーティストでなくても面白い絵を作り出す方法をコンピュータで実現したシステムです。
コンピュータが自動生成する画像から、好きな画像をユーザが選びながら、画像を「繁殖」させていくことを続けていくと、どんどんと新しい画像が生まれていくという仕組みになっています。同じ仕組みを使って、コンピュータ科学者のデイビット・ハー氏(David Ha)が作成したサイトで実際に試してみることができます。
スタートとすると左上の図のような抽象度の高い画像が表示されます。この中からひとつの画像を選びます。上の例では、真ん中の「白黒」の絵を選び「mutate(変異)」ボタンを押すことで、選んだ画像を繁殖します。この作業を繰り返して画像を作っていきます。このように生物の繁殖と同じような仕組みがアルゴリズムによって実装されています。
ひとりでこの操作を繰り返しているとせいぜい数十回ぐらいで飽きてしまいます。それに、あまり面白い画像は正直なところなかなか出てきません。
ところが、集団でこの操作を繰り返していると、次のような面白い画像が出てくるということがPicbreederのシステムで示されています。
Picbreederでは、自由なタイミングで画像をサイトに投稿することができます。同時に他のユーザが育てた絵を選択して継続して育てることもできます。人によってどのように絵を育てていくかは違うため、それぞれの好みに応じてひとつの絵がさまざまに分岐し、系統が広がっていくのです。
さて、最近話題のお絵かきAIを使うことで現代版のPicbreederとも言える実験を行うことができます。次のYouTube動画ではコミュニケーションアプリDiscord上で、お絵かきAI(Midjourney)が作るバリエーションの絵を選んでいくとどのような絵が作られているかを実験しています。
たとえば、次の図は「an organism(生命体)」というプロンプトから作成される絵のバリエーションを集団で次々と選ばれた絵を系統樹として表したものです。
最終的には次のような「生命体」が作られました。「an organism」という最初のプロンプトからは想像できない非常に複雑な形まで発展しています。
YouTube動画の中でも説明されているように、画像の持つ探索空間はとてつもなく広大です。この広い探索空間の中でも人間が介在することで創造的で面白い絵を探索することができているのです。
広大な探索空間から面白い絵の発見を可能にしている要因は2つだと考えています。ひとつ目は、言語(プロンプト)というインターフェースを通じていること。ふたつ目は、各々が自分が面白いと思った基準に従って絵を選択していることです。
言語というインターフェースを介することで、広大な探索空間から鉱脈を掘り当てやすくなっているのです。Picbreederでは、抽象的な画像からその探索がスタートします。そしてプログラムがランダムに親の絵を突然変異させて子の絵を作っています。そのため上図に示したような絵が発見されることは、実は非常に稀です。ランダムな方向に突然変異をしているとせっかく何か良さそうなものに近づいても、それに気づくことなく通り過ぎてしまうことが多いのです。すれ違い、切なくもどかしいラブストーリーのようなものです。
一方、お絵かきAIでのバリエーションはランダムに作られているわけではありません。言語(プロンプト)と画像のマッピングを学習する過程で生成される潜在空間(Latent Space)を通して作られます。つまりより賢い突然変異によってバリエーションの絵が生成されているのです。賢く突然変異させられることはオープンエンドなアルゴリズムを実現させるためにも非常に大切です。賢い突然変異を使うことで、見過ごしてしまうことが多かったものをより高確率で見つけることができるようになることが期待されます。
賢い突然変異を使った進化アルゴリズムの研究はこちらのnoteでも紹介していますので、興味のある方はぜひ。
さて、ふたつ目の多様な観点の面白さについてはどうでしょうか。どのようにしたら人間の集団が持つ多様な視点をアルゴリズムで作り出すことができるでしょうか。多様な視点を持つことができているのは、絵を選ぶ際に目的が設定されていないからです。目的が設定されず、自分の赴くままに好き勝手に選べることが発散的な探索を可能にし、それが多様性を作り出し、結果的に面白い創造的な絵の発見につながっているのです。決して収束することのない発散的な探索をどのように作り出せるのか。そのために提案されてきたのが、新規性探索アルゴリズムや品質多様性アルゴリズムです。
ですが、まだこれらのアルゴリズムも十分ではありません。人間の持つ多様な評価の視点をアルゴリズム自身が作り出すことができるようになれば、それはオープンエンドなアルゴリズムの実現にかなり近づくはずです。
お絵かきAIプラットフォームは、オープンエンド性を実現するための未解決の課題を探求するため重要なツールとなっていくのではないかと感じています。
最後まで読んでいただきありがとうございました。
それではまた次回! ci vediamo alla prossima.
(表紙画像:images taken from neurogram at https://otoro.net/neurogram/)