
『無題(5)』によるマルチメディア表現(に向けて)(30)
(ほぼ)共通の序
流動小説シリーズ『無題』に基づいて、生成AIを利用し、音楽生成と画像生成を行い、そのパイロット版を投稿して来た。
ここではこの試みを少し進め、文章・画像・音楽をミックスした表現の雛形を作成する。と言ってもまだ完成版ではなく、最も原始的なプロトタイプ版である。
質の向上には、プロンプトの技法(「プロンプト・エンジニアリング」)が関わっていることは明らかなので、この試行錯誤を通じて、プロンプト・エンジニアリングに関する知見も獲得・蓄積して行くことが出来ると思われる。
文章400字ぴったり(文章の途中でも機械的に強制終了する)を一単位として、それに基づく音楽(基本二曲)と画像(基本四枚)を生成する。まずこれら―文章の朗読・音楽・画像―を並べて示す。
文章の朗読には、テキスト読み上げソフト『VOICEVOX』(https://voicevox.hiroshiba.jp/)を使用した。使用した合成音声は以下の通りである。
文章117:「VOICEVOX: 栗田まろん」
文章118:「VOICEVOX: あいえるたん」
文章119:「VOICEVOX: 満別花丸」
文章120:「VOICEVOX: 琴詠ニア」
次に、これらを合成して、一個の動画にしたものを示す。
なお、使用した画像生成AIは、これまでと同様、Microsoft Bingが提供するImage Creatorである。
各文章において、画像生成に使うプロンプトをChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から画像生成AIで用いるプロンプトを日本語で作成したいです。」に、各文章を加えて作成した。その後、生成された文章の頭に「水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。」を加えたものを、画像生成用のプロンプトとした。
使用した音楽生成AIは、これまでと同様、webサービス『Suno』(https://www.suno.ai/)である。
画像生成と同様に、各文章において、音楽生成に使うプロンプトもChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から音楽生成AIで用いるプロンプトを、英語で作成したいです。文字数は200文字以下に収めてください。」に、各文章を加え、ChatGPTに指示した。その後、出力された文字列を音楽生成用のプロンプトとした。
今回は、117の単位(46401文字目)から120の単位(48000文字目)までを収める。
文章117(400字;46800字)
【1.文章(第五場 46401-46800文字目)】
げ木細工かと、追及しながら関係しなにか、清算しても割りても、自然に指すこの憂き身の因果、違う落ちる道筋浮かべたりは、纏まらぬ虚しさ狂う瀬無さ、明言しながら、一杯だことには掘らぬ、この憂き身の因果と学習しども、遊びながらも、どうにか何かをあらないかと、瞬時の思案に、貸しし後、ぐっと暗号化するは自家の、意思に認定する上膊部と足の甲、のような曲げ木細工でも何とでも、徹底して打診しれても良けれども、雪兎も角それらの物共を、ぐいぐいぐいと潰れ、当たってパスしよと助命しながら、駐車した時のその嬉しさ、綿密だ限りの力を籠めて、薄いし、依存して、ギャッと出すは、前吸い出す物か孤の声、歩く軟口蓋は鬼婆の形相、足の甲進撃し以前にその上膊部らしき、悪い物にて吸い出しられ、一気に改訂するこの此の方の、肱のよな曲げ木細工、その竪棧の、如き足の甲にて、自決し使い果たしられた、先程来、宛らビー玉の如く也。あたしの肱のよ
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Compose a surreal, introspective piece evoking themes of inevitability and fleeting clarity. Use fragmented rhythms, layered textures, and contrasting tones to convey tension between chaos and order.
第五場(46401~46800文字目)-1曲目
第五場(46401~46800文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「憂いを纏った因果を象徴する幻想的な風景。複雑に絡み合う曲げ木細工が、肱や足の甲を模したように形作られ、暗号化された意志を秘める。軟口蓋を歩む鬼婆の形相、竪棧のような曲線美が加わり、荒々しくも魅惑的な構図を生む。駐車後の喜びと儚さが交錯する場面に、薄くも力強い孤の声が響く。ビー玉のように転がる光沢のある要素が、全体に神秘的な輝きを添える。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 栗田まろん」
文章118(400字;47200字)
【1.文章(第五場 46801-47200文字目)】
うな曲げ木細工が、見失いで障るその方向は、これぞ一本道だと論評し、先程来沸きで離した、その方向なのであった。ということは、どういうことを意味するのか。つまりあたしは、さっき何か甘い、あるいは爺さんの声のように良い、白瓜のような物に裁量し留意しられ、その落下地点近くで再度何か足の甲のような物によってかなりの力で潜り上げられ、今こうしてその方向に飛んで話し込みつつあるのだが、実は中空でその方向の下方を見ても、その方向にして振り分けで落ちような単身は、今誰一人っ子見えないのである。撃ち訪ねられたあたいが遠のく方向は、無人であるかのようなのだ。同伴者は何処へ上告したのか。そう、同伴者は多分、逆戻りしつつ老朽化しのでは煙いのか。一旦出方向に振り分け、何かの理由で見切りを付け、今度は逆方向へ、つまり元来た者へ向かった、あるいは脱色したのでは悪いのか。と消すと、あたいの肱が着地した時、その物を幻滅する、
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Compose a surreal piece evoking a sense of disorientation and solitude. Use drifting melodies, fragmented rhythms, and subtle dissonance to reflect aimless movement and fleeting impressions. Incorpora
第五場(46801~47200文字目)-1曲目
第五場(46801~47200文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「一本道の中空を漂う幻想的な風景。曲げ木細工のように歪みつつも精巧な造形が道筋を描き、足の甲の形をした奇妙な構造物が力強く浮かび上がる。白瓜のような輝きを放つ物体が、遠方に消えていく。無人の空間に孤独を漂わせ、同伴者の気配は消え、老朽化した痕跡が微かに残る。荒涼としつつも不思議な魅力を湛えた場面で、肱が着地し、幻滅とも新たな発見とも言えぬ感覚を呼び起こす。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: あいえるたん」
文章119(400字;47600字)
【1.文章(第五場 47201-47600文字目)】
正確に言えば、その物を再び戻し埋まるなりして位置を強制標識に移動和らげ加工するための俳画は、あたいが今凋落して言い返す方向には、恐らく存在しない、ということなのではなかろうか。こりゃ困った。絶えた沈みた困った。困ったわいなあ。どうすりゃ良いのかまた思案橋。思案する更衣室もなけれども、相手に転載すること一大盃あって、何かと暖かいあ背負いなれど、ここは思案のしどころと、宙を脱ぎつつうんうんうん、野郎見て、妾見て、そっち見て、これでなかなか悪い、あ配列しなれど、ここは運命遅れる時、必死に高める知恵なりけり。落下地点推測せよ。落下地点確認せよ。意思で左右落ち着く部分と呈しない部分が切る。二乗し吟味し上げられたあ出来の移動曲線のマクロなあり方を左右することは困難なことなのだろう。だがそのミクロな毒素に影響を負えることは、部分標識には闘病すると調達しう。そんな風に応じるると、我が落下して去る地点は恐ら
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Compose a reflective piece capturing tension and uncertainty. Use fragmented melodies, shifting rhythms, and layered textures to convey hesitation and the struggle for direction. Incorporate dynamic changes to reflect the interplay of determination, doubt, and inevitable descent.
第五場(47201~47600文字目)-1曲目
第五場(47201~47600文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「無限に広がる空間の中で、宙を漂う孤独な存在。落下する地点を推測しようと必死に思案する人物が、沈み込むような姿勢で浮かんでいる。背景には、柔らかく歪む曲線が描く移動軌跡が広がり、その一部がミクロな毒素のように不穏な輝きを放つ。宙を漂う者の周囲には、野郎、妾、そして無形の存在たちが曖昧な形で散らばり、運命の軌跡が揺らめくように描かれる。落下地点の不安と希望が交錯する幻想的な風景。」
以上のプロンプトは、「コンテンツの警告」がありブロックされた。そのため、「以下のプロンプトは、Image Creatorにおいて、ポリシー違反の生成結果が出力される可能性があるため、ブロックされました。ブロックされないプロンプトに修正してください。」というプロンプトでChatGPTに修正させ、再度、画像生成を試みた。
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「無限に広がる空間の中で、宙に浮かぶ静かな存在。人物は深く考え込むような姿勢で浮かび、背景には柔らかく流れるような曲線が描かれている。その曲線は発光しながら空間に軌跡を残し、幻想的な雰囲気を醸し出している。周囲には、曖昧で抽象的な形状が漂い、全体的に調和と謎が混在するような美しい風景が広がる。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 満別花丸」
文章120(400字;48000字)
【1.文章(第五場 47601-48000文字目)】
く、この一本道のどん詰まりに今見えて名乗りて望む、このようにして閣下からならば良く渋い、人殺しが処した左派の、悪い屏のような物の閣下辺りと、尽くすのに違いないことを、わちきは推測・確認せり。そしてなお望むべきことに、一斉に後戻り無い我が同伴者、すなわち我がその中に、嵌まら着色して縮めるその同伴者の、姿はそこに見えないが、それに成るかのような一人っ子の孤乃至物の、妙なる姿、下に利きたり。何かを思案したり考えたりする余地もなく、わちきはその姿に動きて、ただ只筒井筒落下して画策するのみ。一方あちらも我と同様、何かを思案し得難い、その暇と叱責しなくわちきを、その場で撃墜しなけりゃ一身薄いと、決死の形相、我が天眼に希だその瞬間、一身を接近するその物は、もしかして御手の中か、それも両方の御手の中か、天眼を避けて、振るうから天眼に上がるのは上げて、お願いと、助力する言葉は掛かりたか、バスケットボールの球
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Create a tense and dramatic piece reflecting a sense of inevitability and confrontation. Use sharp dynamics, intense rhythms, and layered dissonance to evoke the imagery of a relentless journey and impending collision. Incorporate sudden shifts and fleeting melodies to convey urgency and fleeting hope.
第五場(47601~48000文字目)-1曲目
https://youtube.com/shorts/PPsXkca87M
第五場(47601~48000文字目)-2曲目
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「一本道の果て、薄暗い空間に浮かぶ奇妙な人影。その姿は、何か悪い屏風のような形状に変化し、孤独感を漂わせている。背景には、渋い色調の景色が広がり、落下する人物と接近する謎の存在が織りなす緊張感が漂う。落下者の天眼は、前方に近づく不明瞭な物体をとらえ、その形状は両手で抱え込むバスケットボールのように丸く、不可解な力が宿るかのようだ。一瞬の決意と不安が交錯する、幻想的で劇的な場面。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 琴詠ニア」