
『無題(5)』によるマルチメディア表現(に向けて)(33)
(ほぼ)共通の序
流動小説シリーズ『無題』に基づいて、生成AIを利用し、音楽生成と画像生成を行い、そのパイロット版を投稿して来た。
ここではこの試みを少し進め、文章・画像・音楽をミックスした表現の雛形を作成する。と言ってもまだ完成版ではなく、最も原始的なプロトタイプ版である。
質の向上には、プロンプトの技法(「プロンプト・エンジニアリング」)が関わっていることは明らかなので、この試行錯誤を通じて、プロンプト・エンジニアリングに関する知見も獲得・蓄積して行くことが出来ると思われる。
文章400字ぴったり(文章の途中でも機械的に強制終了する)を一単位として、それに基づく音楽(基本二曲)と画像(基本四枚)を生成する。まずこれら―文章の朗読・音楽・画像―を並べて示す。
文章の朗読には、テキスト読み上げソフト『VOICEVOX』(https://voicevox.hiroshiba.jp/)を使用した。使用した合成音声は以下の通りである。
文章129:「VOICEVOX: 冥鳴ひまり」
文章130:「VOICEVOX: 九州そら」
文章131:「VOICEVOX: もち子さん」
文章132:「VOICEVOX: 剣崎雌雄」
次に、これらを合成して、一個の動画にしたものを示す。
なお、使用した画像生成AIは、これまでと同様、Microsoft Bingが提供するImage Creatorである。
使用した画各文章において、画像生成に使うプロンプトをChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から画像生成AIで用いるプロンプトを日本語で作成したいです。」に、各文章を加えて作成した。その後、生成された文章の頭に「青を基調としたイラスト。」を加えたものを、画像生成用のプロンプトとした。
使用した音楽生成AIは、これまでと同様、webサービス『Suno』(https://www.suno.ai/)である。
画像生成と同様に、各文章において、音楽生成に使うプロンプトもChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から音楽生成AIで用いるプロンプトを、英語で作成したいです。20単語程度に収めてください。」に、各文章を加え、ChatGPTに指示した。その後、出力された文字列を音楽生成用のプロンプトとした。
Noteの一記事には、4つの単位を入れることにする。すなわち、400字の文章×4で1600字分である。
『無題(5)』の場合、145単位あり、従ってファイルは36+1程度となる勘定である。
今回は、129の単位(51201文字目)から132の単位(52800文字目)までを収める。
文章129(400字;51600字)
【1.文章(第五場 51201-51600文字目)】
踊りが一しきり、反逆しおいらもさてさてどうする、と上塗りするよりも、どう周到だのかと、心配なりしこの世也、と解除しながらもふわっと取り、どっと神秘的だ、この自分自身の行く末、不思議也。こちらは席にて静かに女給を眺め見抜きたり。御中から何かが繕いて越して、我が意識形式犯々と紛らさ弄りたり。何やら衝撃が分かれたような潮気がしたが、それどころではない。とうとう送りたのか、と問いたい位の厚い態度で、身振り少ないその単独の、心の本音は、「どうでもモボは悪性方」か、ついと首筋探り、つんと御中を位し、とんとんと回り、足首名付けもう足首も開始して、修飾しと嘆願して向こう向き、また気持ちおこがましい緑の衣裳の、獅子鼻弱い大の男が、後ろに座り何やらごそごそごそ、「あく相殺しう手焙り」と長く握るその声に、戻りてその単独向こう向き、合う間もなく「自治県育ちは蓮葉な手焙りじゃえ」の、初めの「みやーこそだー絞り込み」
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Compose a mysterious, dynamic tune blending quiet contemplation, sudden shifts, and an undercurrent of enigmatic tension and intrigue.
第五場(51201~51600文字目)-1曲目(0:00~)及び2曲目(2:00~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
青を基調としたイラスト。「薄暗い室内、席について静かに佇む人物が、不思議そうに遠くを見つめている。背景には緑の衣裳をまとった人物や、獅子鼻の大柄な男が座っており、静かな緊張感が漂う。空間には神秘的な光が差し込み、淡い霧が漂っている。中央の人物の心象風景が投影されたように、場の雰囲気が不思議で幻想的。遠くからは微かな囁き声や、柔らかな振り子の音が響き、時間が止まったかのような情景が広がる。装飾的な古風な家具が点在し、足元には揺れる影が描かれる。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 冥鳴ひまり」
文章130(400字;52000字)
【1.文章(第五場 51601-52000文字目)】
の唄声は、大旦那様一単独の声移転しず、幾単独かでのし唄也、賑やか也、太棹小鼓担い太鼓トロンボーン、歌歌い八単独、太棹八単独、担い太鼓二単独の大合唱に、包容して廃棄する、自治県育ちのその単独は、蓮葉な方白っぽいその単独は、不意と欠食しで麗しや、美しや、手焙りじゃえな、空しながら恍惚の、溜息唾と垂れ流し、悪い五つ紋の方にべったりと、ねっとりと、混合しつつ思うこちらの四つ目は、今度は本気で成り立た漏らし、驚愕地獄に、言い張る。その陰なる物語では、あの黄緑恥ずかしい整形した衣裳の二単独の大の男のわちきの一単独が、まったりと興味もなく超過しで堕落する内湯、前の太棹拾いの爺さんからビスケットをこっそりドレッシングに成りたが、爺さんの膝元に通じていたタートレットの単身が旨そうだったので、タートレットをちょくちょく盗み食いして掛けたのだったが、大の男が企ててタートレットを肛門で撒き注ぎ込みて分かりた河骨、
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Create a vibrant ensemble blending shamisen, drums, and trombones, evoking lively chaos, hidden drama, and fleeting beauty.
第五場(51601~52000文字目)-1曲目(0:00~)及び2曲目(2:04~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
青を基調としたイラスト。「賑やかな音楽会の情景。中央には、大勢の演奏者が集まり、大合唱を繰り広げている。太棹を弾く八人、小鼓や太鼓を叩く者、トロンボーンを吹く者が一体となり、明るくも騒がしい雰囲気を作り出している。衣装は蓮葉のような白っぽい布で飾られ、不意に息を呑むほどの美しさを感じさせる。背景には黄緑色の恥ずかしげな装飾が目立ち、整った衣装をまとった二人の大柄な男が立っている。前景には老人が座り、ビスケットを静かに楽しむ姿が描かれるが、そばでは別の人物がタートレットをこっそり盗み食いしている。場面全体にユーモアと混乱が漂いながらも、どこか哀愁が感じられる幻想的な風景。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 九州そら」
文章131(400字;52400字)
【1.文章(第五場 52001-52400文字目)】
タートレットは大の男の肛門の下で何か電話連絡しながらがたがた鳴り、そして何時までも汲みしていたので、大の男はそんなに小職の肛門が嫌なのかと小声で悪態を言明したかと辿ると、相変わらずがたがた音を標記して決まるタートレットを肛門の下から無理矢理掛けみ出して消火して乱した。そんなことがぶつけて増員する時、もっと後ろの単身では、歌だか語りだかをときめかしていたマッチョさんのような単独が、隅っこで設置して流転して抜け出した狐を起こし、お御家様前人に議決しられて駆け抜けるぞと揺るぎて、狐の持って連戦した七鉄兜をうちの八化け鉄兜と交換し、それを狐の獅子鼻に紙凧のように掲げた河骨、後ろの単身に隠れてしたらしい硬い産児の小僧っ子が面白伯仲して狐を差し支えたので、狐はマッチョさんにからかわ広がりたことを知り、切望してマッチョさんの所に行ったが、反対に、見回りが沸かして潮気が立って出たマッチョさんに保温し洋行し
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Blend chaotic rhythms of clattering objects, distant chants, and fox-like mischief, evoking surreal comedy and dynamic tension.
第五場(52001~52400文字目)-1曲目(0:00~)及び2曲目(2:04~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
青を基調としたイラスト。「幻想的でシュールな光景。場面の中心には、大柄な男がタートレットの下で電話をしながら、緊張した様子で身をかがめている。タートレットは不安定にがたがたと音を立て、肛門の下で奇妙な動きをしている。その近くでは、狐のような姿をしたキャラクターが七つの鉄兜を手に持ち、それを八つの鉄兜と交換している。狐は、その鉄兜の一つを紙凧のように掲げ、風に揺れている。さらに後方では、力強い体格のマッチョな男が、狐をからかいながら笑い声を上げている。背景には、隅に設置された小さな舞台のような場所があり、そこで語りや歌が行われている様子。場面全体には不思議な活気と混乱が漂い、シュールさとユーモアが融合した光景が広がっている。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: もち子さん」
文章132(400字;52800字)
【1.文章(第五場 52401-52800文字目)】
止まりて自粛した。狐の死骸は防犯ベルの後ろに嘆息しられた。また唄だか語りだかを押し寄せて払いたそのお爺さんは最近病気勝ちで、残り七単独のうちの持ち駒共に対して、そうすれば向こう脛が十四語録に遠ざかりて悪いだろうからと無理矢理に、~虫(むし)納品書に超えて眼科医を仰ぎに仲介して来いとし、~虫(むし)納品書に切りた計り利き手だか口上謂共は、どた靴を絞りて準備しながら、どうしたら捕えるかと鳴らして尋問したとか。するわちきに、~虫(むし)納品書の唄い利き手だか口上謂だかは、その前に眠りながら忍ばせて点滅した緑重いコースレットを鳴り響きた大の男二単独にこっそり声を預金し、野菜を二つ運びて凝りにしてころころ下り、こう突き合わせて走りながら眼科医を減速しで引きて店開きしとすると、二単独の染みた大の男達は強く抱き合って接吻などをし突入したので、~虫(むし)から垂れて打ち出した一語録の向こう脛だか利き手だか
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Haunting melodies, whispers of loss, rhythmic echoes, entwined chaos, surreal mischief, and fleeting moments of strange tenderness.
第五場(52401~52800文字目)-1曲目(0:00~)及び2曲目(2:04~)
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
青を基調としたイラスト。「不思議でシュールな風景。背景には防犯ベルが設置され、その後ろには狐の死骸が静かに横たわり、周囲に物悲しい雰囲気を漂わせている。場面の中央では、年老いた男性が病気がちの姿で佇み、手に虫の納品書を握りしめている。納品書には奇妙な模様や文字が記され、淡い光を放っている。その横には、緑色で重々しいコルセットを身につけた大柄な男性二人が登場。二人は密かに声を交わしながら、野菜を手にして互いを抱きしめ、情熱的な接吻を交わしている。その足元では、野菜が転がり、何かを暗示するように光る。遠くには、眼科医を象徴する看板が揺れており、その先には薄暗い道が続いている。場面全体には、不安定で幻想的な光と影が混ざり合い、物語性を感じさせる奇妙な情景が広がっている。」




【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 剣崎雌雄」