
『無題(5)』によるマルチメディア表現(に向けて)(32)
(ほぼ)共通の序
流動小説シリーズ『無題』に基づいて、生成AIを利用し、音楽生成と画像生成を行い、そのパイロット版を投稿して来た。
ここではこの試みを少し進め、文章・画像・音楽をミックスした表現の雛形を作成する。と言ってもまだ完成版ではなく、最も原始的なプロトタイプ版である。
質の向上には、プロンプトの技法(「プロンプト・エンジニアリング」)が関わっていることは明らかなので、この試行錯誤を通じて、プロンプト・エンジニアリングに関する知見も獲得・蓄積して行くことが出来ると思われる。
文章400字ぴったり(文章の途中でも機械的に強制終了する)を一単位として、それに基づく音楽(基本二曲)と画像(基本四枚)を生成する。まずこれら―文章の朗読・音楽・画像―を並べて示す。
文章の朗読には、テキスト読み上げソフト『VOICEVOX』(https://voicevox.hiroshiba.jp/)を使用した。使用した合成音声は以下の通りである。
文章125:「VOICEVOX: 波音リツ」
文章126:「VOICEVOX: 玄野武宏」
文章127:「VOICEVOX: 白上虎太郎」
文章128:「VOICEVOX: 青山龍星」
次に、これらを合成して、一個の動画にしたものを示す。
なお、使用した画像生成AIは、これまでと同様、Microsoft Bingが提供するImage Creatorである。
なお、コンテンツポリシーとの競合の故か、文章全体から画像が生成されない場合も多かった。その場合は、その旨を注記した上で、400字の文章の中から当たり障りのない単語を幾つか選んで、画像化した。
使用した画各文章において、画像生成に使うプロンプトをChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から画像生成AIで用いるプロンプトを日本語で作成したいです。」に、各文章を加えて作成した。その後、生成された文章の頭に「水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。」を加えたものを、画像生成用のプロンプトとした。
使用した音楽生成AIは、これまでと同様、webサービス『Suno』(https://www.suno.ai/)である。
画像生成と同様に、各文章において、音楽生成に使うプロンプトもChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から音楽生成AIで用いるプロンプトを、英語で作成したいです。20単語程度に収めてください。」に、各文章を加え、ChatGPTに指示した。その後、出力された文字列を音楽生成用のプロンプトとした。
Noteの一記事には、4つの単位を入れることにする。すなわち、400字の文章×4で1600字分である。
『無題(5)』の場合、145単位あり、従ってファイルは36+1程度となる勘定である。
今回は、125の単位(49601文字目)から128の単位(51200文字目)までを収める。
文章125(400字;50000字)
【1.文章(第五場 49601-50000文字目)】
だか物だか、鯨めいた物、花崗岩抜きた物、シルバーフォックス封入した物、人間増配した物、訳の分からぬ物達が、してめぼしいロビー、そこから吹かすは視線あるか、視線が辞職するはあそこ立つか、その単独は、ロビーなる物達に、悟りられ、確立し揉み消して、可哀そう、あどけない、その心根もあり出す、こんなに上げられて継が荒廃しば、観察しある、晴眼は広間を俯瞰する、おらとその単独だけの手焙り、その単独とおら、それ以外、どっちも存せぬそんな人世が、実はこの中このロビーに、退化して腐るそのことを、誰も御存知成立しやせぬ、何を見見込みかおめえらは、何を話して敵対するのか、貴公ら一寸悪い加減に、しないとおらの怒りにも、弓張り提燈が強まり何が掛けるかは、おら身にも分からぬぞよ、その単独あんな姿に手助けしり、哀れと失恋する単独やなし、その単独あんなばたばたと、清算して言うのは悪い也、おかしくても哀れでも、面白ければそれ
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Create a dramatic, evolving atmosphere with chaotic tension, deep sorrow, and an eerie sense of isolation and introspection.
第五場(49601~50000文字目)-1曲目(0:00~)及び2曲目(2:00~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「広いロビーに集まる不思議な存在たち。鯨のような形をした物、花崗岩を抜けた物、シルバーフォックスが封入された物、そして不明な人間の姿が並び、周囲には視線が集まる。視線が交差する場所で、単独の存在が悟りを得たような表情で立っている。その姿は他の物たちから浮き上がり、孤立している。ロビー内は静寂とともに荒廃し、観察者は広間を俯瞰しながら、その中で自分だけが確立した立場に立つ。視覚的には混沌とした空間の中に異質な存在が交錯し、観察者がその中で静かに対峙している様子が描かれる。全体的に不安定で幻想的な雰囲気の中で、観察と対立のテーマが強調される。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 波音リツ」
文章126(400字;50400字)
【1.文章(第五場 50001-50400文字目)】
で痛いのか、おめえたち、それ貴公らの根性か、ぞっとする程醜悪也、それ故おらのこの姿、う止めの心の下水を、値下がりしてこんなに鍛練したのだ、真っ黒けっけのおらの自分自身が、うぬらにあらぬ訳なりけり。周壁曲がり、周壁を極左に曲がってどんどん、勢い落ちずその儘に、列は掛かりておら言い、また逆転しでの増強し、順調にこそ立つ也。順調だああ順調だ順調だ。どうあるかには興味なく、お先のことは真っ黒け、それでも今が重々しい、今することだけを今にする、この床しさの根性を、診断してかれこれ幾歳月、先のことには四つ目を追い、叩き大工な空想険悪だに似たり、妄想見る暇壊しば、付け張ら明き放ち上げられて、宙を閉ざす、この快楽に憎みて潰れるたい、あなたの姿を扱いて見直すたい、ただじっと、凝然と、あなたの姿を登壇して支配するたいので御座りやす、そんな言葉を引っ張りたいです、言って秘めたいと守る手焙りです。線路は同様よ何処
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Create a dark, intense atmosphere with a sense of inner conflict, anger, and determination, evolving towards a powerful climax.
第五場(50001~50400文字目)-1曲目(0:00~)及び2曲目(1:50~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「曲がりくねった壁を背に、重々しい雰囲気の中で孤独な存在が進む。背景には真っ黒な空間が広がり、存在感が強調されている。周囲には強い勢いで進むものがあり、時折、逆転の動きが見られ、空間が次第に変化していく。視覚的には、無機質な壁や床、そして進行する影のような存在が描かれ、その中に不安と決意が混じり合っている。独特の緊張感が漂い、目の前の空間に向かって一歩一歩進む存在が、その重さを感じながら、変化していく様子が表現される。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 玄野武宏」
文章127(400字;50800字)
【1.文章(第五場 50401-50800文字目)】
までも、真っ直ぐに、一直線に、続きます、永遠に、何時までも、何処までも、遥かな彼方、地の果てまで、ずっとあるよ果てしなく、線路は煩わしいよ何処までも。そんな訳、そんな訳美しいと分かっても、昔渋谷は東横線の、行き止まりの果ての民衆駅、今も連合国稚内根室、線路はするよ此処までで、ガス居室民衆駅の行き先表示、ところが線路は何処でしょう、何処に線路は固めんですか、次の民衆駅までどうすれば、寝台特急で峻烈だと競争するのでしょう、諌めて予知し最後なので、ガスを施す前工作したいな、愚僧もあたしもメトロファン、あちきもおらも小職課し伸びも、わいも吾輩あたいもね、メトロ数寄者です根っからの、折角楽しき競り合いたのに、此処で付くは残念です、も少し成りて預金しませんか、そしたらガスも省きましょう、たっぷり壊れせてありましょう。不吉な気持ちがぞわぞわぞわ、もぞもぞもぞと乱して漏らす、そんな予感が判読したのかそれと
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Create a journey through an endless, winding railway, blending nostalgia and unease, with subtle tension and anticipation building.
第五場(50401~50800文字目)-1曲目(0:00~)及び2曲目(2:05~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「無限に続く線路が広がる風景。遠くの果てまで延びる鉄道の線路が視界を横切り、途切れのない道が続いている。線路の先には霧がかかり、謎めいた駅がひっそりと存在し、遠くに見える人々がその先を目指して歩んでいる。背景には古びた駅舎があり、煙を上げる機関車が遅く進む。雰囲気は少し不安を感じさせるような、未来に向けて進み続ける視覚的な静けさが漂っている。鉄道の無限の延長が、先の見えない未来を象徴しているように描かれる。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 白上虎太郎」
文章128(400字;51200字)
【1.文章(第五場 50801-51200文字目)】
も、何にも選出しぬ忍者の如くに同嬢はわんわんわん、楽しく運びて宙をとんでもない、だけの人生満喫の、ピンポンと引き球と興奮し、積算し造船しられて被りたのでしょうか。紛らし成りられ突き上げられ宙を舞って掛けた時に、下界に再読したのは幾つもの、ココ椰子掛かりた宗旨のマルティフラッシュであった。一つ二つ三つ四つ五つ六つ七つ八つ九つ十、したのはここまでで、もっとしのか固いのかは、もう外れない見え良いので、それで付けた事柄は、一番先様のマルティフラッシュの、先には道はもうなくて、何かポトンと打診し電化するよう、また断崖の絶壁か、あちらから、真っ黒だ訳行かず、我から必死で特選する、舞姿の、変貌振りも予感して、あれこれそれこれ幼い、忙しくて大変也、それでも一行目移りしたり、する訳の手焙りじゃなし、どんどんどんどん告発し、どうすんの、責任滑りて重ねるのか、不審の思いも予期する中、艶やかなりしその単独の、恋の
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Create a lively, chaotic melody symbolizing excitement, transformation, and unpredictable shifts, blending anticipation and youthful energy.
第五場(50801~51200文字目)-1曲目(0:00~)及び2曲目(2:05~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「宙を舞う忍者のような人物が、興奮した表情で空を飛んでいるシーン。周囲には光り輝く球体が浮かび、ピンポンのように跳ねながら進んでいく。背景には大きな断崖の絶壁が広がり、下界は見えないほど遠く、遠くから不明な光が差し込んでいる。人物は躍動的に動きながら、突然の変化を感じ取っている様子で、力強く空中を舞う。その動きには勢いがあり、活気に満ちた空間が描かれる。光と影のコントラストが強調され、全体的に幻想的で躍動感のある雰囲気を持つ。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 青山龍星」