見出し画像

『無題(5)』によるマルチメディア表現(に向けて)(29)


(ほぼ)共通の序

 
流動小説シリーズ『無題』に基づいて、生成AIを利用し、音楽生成と画像生成を行い、そのパイロット版を投稿して来た。
 
ここではこの試みを少し進め、文章・画像・音楽をミックスした表現の雛形を作成する。と言ってもまだ完成版ではなく、最も原始的なプロトタイプ版である。
 
質の向上には、プロンプトの技法(「プロンプト・エンジニアリング」)が関わっていることは明らかなので、この試行錯誤を通じて、プロンプト・エンジニアリングに関する知見も獲得・蓄積して行くことが出来ると思われる。
 
文章400字ぴったり(文章の途中でも機械的に強制終了する)を一単位として、それに基づく音楽(基本二曲)と画像(基本四枚)を生成する。まずこれら―文章の朗読・音楽・画像―を並べて示す。
 
文章の朗読には、テキスト読み上げソフト『VOICEVOX』(https://voicevox.hiroshiba.jp/)を使用した。使用した合成音声は以下の通りである。
 
文章113:「VOICEVOX: 春歌ナナ」
文章114:「VOICEVOX: 猫使アル」
文章115:「VOICEVOX: 猫使ビィ」
文章116:「VOICEVOX: 中国うさぎ」
 
次に、これらを合成して、一個の動画にしたものを示す。
なお、使用した画像生成AIは、これまでと同様、Microsoft Bingが提供するImage Creatorである。
 
各文章において、画像生成に使うプロンプトをChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から画像生成AIで用いるプロンプトを日本語で作成したいです。」に、各文章を加えて作成した。その後、生成された文章の頭に「水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。」を加えたものを、画像生成用のプロンプトとした。
 
使用した音楽生成AIは、これまでと同様、webサービス『Suno』(https://www.suno.ai/)である。
 
画像生成と同様に、各文章において、音楽生成に使うプロンプトもChatGPTで生成した。ChatGPTへのプロンプトは、「次の文章から音楽生成AIで用いるプロンプトを、英語で作成したいです。」に、各文章を加えて作成した。その後、生成されたプロンプトに続けて、「文字数を200文字以下に縮めてください。」とChatGPTに指示し、出力された文字列を音楽生成用のプロンプトとした。
 
Noteの一記事には、4つの単位を入れることにする。すなわち、400字の文章×4で1600字分である。
『無題(5)』の場合、145単位あり、従ってファイルは36+1程度となる勘定である。
 
 
今回は、113の単位(44801文字目)から116の単位(46400文字目)までを収める。

 

文章113(400字;45200字)

 
【1.文章(第五場 44801-45200文字目)】
けたり、軟口蓋の下に拇指が荒らして軟口蓋が菊人形のようにぎくしゃく動いたり、それからさらに拇指が閣下の者に荷担し軟口蓋を拡大し覆って剥ぎたり、せわしさは正しい身振りとこなれるか、踊りと告知するか、舞と示すか、何か分からぬ、撮影しぬ様である。とは伝わりわちきは、その訳を、置きたい曲げ木細工で、ある訳でもなし。なぜそんな、かっこと身振りし反映するのかと、遣りても詮なきこと位、入れて離すのだこのワシは、しかし吾輩幾らかは、心配にするその姿、何か足疾鬼に居残り憑かれ、出ぬ訳にあらなくて、そんな少ない動作身振りを、さっきから、離れと続ける訳なのか、そんなこと、心配してもその故に、その人っ子ボイコットする訳もなく、一方通行送り届けるものの、やはり何とはなし帯びるが、話の流れも分からねど、一寸不安で心配な、その艶人っ子の舞姿。吾輩は実は、盗み上がりげられたり待避し勧誘しられたりしながらも、スイスイ観光す
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Create a surreal, avant-garde musical piece inspired by fragmented movements and mysterious dance. Blend traditional Japanese instruments with modern electronic sounds to evoke tension between elegance and unease. Capture a dreamlike, unsettling atmosphere with fluid rhythms, abrupt pauses, and delicate moments of beauty amidst chaos.
 
第五場(44801~45200文字目)-1曲目

 
第五場(44801~45200文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「舞台上で繰り広げられる、ぎくしゃくとした動きの舞踏シーン。菊人形のように硬直しながらも滑らかさを求めている軟口蓋を模した彫刻的な人物が、複雑な手の動きで踊る。暗い背景には、不安と心配が漂う薄明かりが広がり、舞台全体を静かな緊張感が包む。人物の衣装は古風で艶やか、しかしどこか影のあるデザインが特徴的。足元には霧が漂い、幻想的な雰囲気が強調されている。」
 

 【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 春歌ナナ」

 

文章114(400字;45600字)


 

【1.文章(第五場 45201-45600文字目)】
るで進撃するように締め出しで頼みた心地だったのだが、ある時ドカンという、憂き身に少々の衝撃を頼みたのだ。それは、地に落ちた時の衝撃とは退治し、後ろから衝突延期し狙いたのではないかと凌が密封するような、そんな衝撃であった。そして多分、僕が衝撃を与えられただけでなく、恐らく僕ユアセルフもまた、僕の前に急だらしい誰がしさんに対して、衝撃を付与して上げたのだろう。その誰がしさんの後ろ姿らしい曲げ木細工はこのところずっと黒っぽかったのだが、ばたばたと音がして、不意に女子大生訴訟手続きし多い色合いの何かの物が少しだけ、調べたり免税したりするのが天眼の前に見えたかと画策すると、いきなりその白瓜めいた物が天眼の前にぐんぐん拡大して打ちて、忘却した時わちきは、さっきよりも遥かにつまらない空中を重なることに着て葬りたらしい。それは恰も虚空をマンネリだかのような感覚であったが、その感覚の大きな部分は、紛れもなく
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Compose a dynamic piece evoking sudden shocks, tension, and fleeting chaos. Use unpredictable rhythms, abrupt shifts, and contrasting tones to convey collisions and uncertainty. Blend ethereal melodies with dissonance for a surreal, intense atmosphere.
 
第五場(45201~45600文字目)-1曲目

 
第五場(45201~45600文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「暗く不安定な空間の中、衝撃の瞬間を描いた場面。前景には黒っぽい曲げ木細工のような後ろ姿が配置され、不意に現れる白瓜のような物体が、空間を切り裂くように拡大している。背景は虚無感を表すぼんやりとした霧や暗い空が広がり、静けさと緊張感が漂う。動きのあるばたばたとした音の余韻が感じられ、全体的にシュルレアリスティックで不可解な雰囲気を演出。衝撃と虚空の感覚が視覚的に具現化されたシーン。」


【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 猫使アル」


文章115(400字;46000字)

 
【1.文章(第五場 45601-46000文字目)】
視覚によって動きられて掲げたのに違いない。しかもそれは、移動するフォースによる視覚であった。ある時視覚は、撃退しだ拇指を頭上に合致し、何かを憶測し回して信じかのようにその付きだ拇指を左右に満喫してはたく、その人っ子のような物の動きを把握し、その一体何を出たのか真っ白く放免しられた軟口蓋のような物を真上から見た。しかもその視覚の鋭敏性とも下す曲げ木細工は、聴覚によって補強さ見直してあり、聴覚の者は、相変わらずクネクネとした嫌らしい声でありて実証する十両様風の、唄と下すか語りと反復するか、そんな風な物を同時に捉えて編みた。視覚で把握夥しい物の存在する範囲は一見して小さく、聴覚で把握殺菌する物と擦りたいその物の存在する範囲はより多いようにもある。その二つの物の関係は一体何、と中空を合い時間と共に位置と状態を変化食らいせて上等だわちきは覚悟して柔和だような裁量して改まらないような、そんなことを休業
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Compose a surreal piece blending sharp visuals with wavering sounds. Use dynamic shifts, layered textures, and contrasting rhythms to evoke shifting perspectives. Add subtle dissonance and fluid transitions for a mysterious, dreamlike mood.
 
第五場(45601~46000文字目)-1曲目

 
第五場(45601~46000文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「暗闇の中で、視覚と聴覚が複雑に交錯するシーン。視覚的には、上に掲げた拇指とともに動きが捉えられ、白く放免された軟口蓋のような物体が真上から見える。曲げ木細工のような鋭い形状が、聴覚で補強され、嫌らしい声が響き渡る。クネクネとした動きと、反復的な唄や語りが交じり合い、空間に広がる。視覚的には範囲が狭く、聴覚的にはより広がりを持つこの二つの感覚の関係が交錯し、時間と共に変化し続ける緊張感を表現。」

 【4.音楽+画像+文章朗読(朗読ソフト)】クレジット表記:「VOICEVOX: 猫使ビィ」

 
 

文章116(400字;46400字)

 
【1.文章(第五場 46001-46400文字目)】
するような時間が制圧しのかあるのか、何も分からぬながらも、秘めに入りで存立しつつあるわちきは、「遅れしつむじの乱るるも」という、唄なのか語りなのか分からぬながらも、さっきよりも多少合わせ持たばクネクネ度は大きいように呼ぶその言葉を眺め、一方その聴覚標識な物の把握のさ中には、その物との多分密接なのだろう関係を記述するに違いないもう一つの物、つまり視覚標識な物の者を、拇指を密着は奮起しせないながらもあどけない横っ面の辺りに撤退しながら右派回りに一周ありた後、何やら妙につむじをミクスチャーにしいミクスチャーにカットし、頭を下向きに弱腰をやや屈め、片腕をつむじに当てつむじを明るいかの仕種を一度二度と答え、つむじを何やら突き止めるミクスチャーな様子の後、またすっくと憂き身を成る、という風に把握しつつ、我が間に合う飛行曲線は、徐々に下降へありつつ入るが、しかしながら、このまま見下ろし終わりて片付ける曲
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Compose a surreal piece blending uncertainty and fleeting clarity. Use shifting rhythms, mysterious melodies, and layered textures to reflect intertwining senses. Add dynamic shifts and subtle dissonance to evoke exploration and gradual descent.
 
 
第五場(46001~46400文字目)-1曲目

 
第五場(46001~46400文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
画像生成プロンプト:
水彩画風のイラスト。桜の木を背景にした東京の歌舞伎座の舞台。「時間の制圧感の中、混乱するつむじを巡るシーン。拇指が密接に触れ合う中、右回りに一周し、つむじに片腕を当て、頭を下げて弱腰を屈める人物が登場。視覚と聴覚の交錯により、唄と語りが曖昧に響き、混乱した動きと、時折明るい仕草を繰り返しつつ、つむじを探りながら徐々に下降する飛行曲線が描かれる。細かな視覚的な動きとミクスチャーの様子が表現され、静かな緊張感が漂う。」

 【4.音楽+画像+文章朗読(朗読ソフト)】クレジット表記:「VOICEVOX: 中国うさぎ」

 

いいなと思ったら応援しよう!