見出し画像

『無題(5)』によるマルチメディア表現(に向けて)(24)


(ほぼ)共通の序


流動小説シリーズ『無題』に基づいて、生成AIを利用し、音楽生成と画像生成を行い、そのパイロット版を投稿して来た。
 
ここではこの試みを少し進め、文章・画像・音楽をミックスした表現の雛形を作成する。と言ってもまだ完成版ではなく、最も原始的なプロトタイプ版である。
 
質の向上には、プロンプトの技法(「プロンプト・エンジニアリング」)が関わっていることは明らかなので、この試行錯誤を通じて、プロンプト・エンジニアリングに関する知見も獲得・蓄積して行くことが出来ると思われる。
全開かなり歌舞伎座風に近付いたが、今回単に「劇場」としたところ、また戻ってしまった。
 
文章400字ぴったり(文章の途中でも機械的に強制終了する)を一単位として、それに基づく音楽(基本二曲)と画像(基本四枚)を生成する。まずこれら―文章の朗読・音楽・画像―を並べて示す。
 
文章の朗読には、テキスト読み上げソフト『VOICEVOX』(https://voicevox.hiroshiba.jp/)を使用した。使用した合成音声は以下の通りである。
 
文章93:「VOICEVOX: 春日部つむぎ」
文章94:「VOICEVOX: 雨晴はう」
文章95:「VOICEVOX: 波音リツ」
文章96:「VOICEVOX: 玄野武宏」
 
次に、これらを合成して、一個の動画にしたものを示す。
なお、使用した画像生成AIは、これまでと同様、Microsoft Bingが提供するImage Creatorである。
 
なお、コンテンツポリシーとの競合の故か、文章全体から画像が生成されない場合も多かった。その場合は、その旨を注記した上で、400字の文章の中から当たり障りのない単語を幾つか選んで、画像化した。
 
使用した音楽生成AIは、これまでと同様、webサービス『Suno』(https://www.suno.ai/)である。
 
Noteの一記事には、4つの単位を入れることにする。すなわち、400字の文章×4で1600字分である。
『無題(5)』の場合、145単位あり、従ってファイルは36+1程度となる勘定である。
 
今回は、93の単位(36801文字目)から96の単位(38400文字目)までを収める。
 

文章93(400字;37200字)


 
【1.文章(第五場 36801-37200文字目)】
二階中央から左側に売る客席空間と、そのさらに左側の城壁のパブリックスペースを乗る段覚え書の通路に沿い乃公の方向に向かって敵対して来た同伴者の行列は最早その段を掛け概説して、一列に座席が粗い良い通路に走破しだようだった。そうなるとその危ない列を詰めるのがなかなか難儀に高めて副次的だので、乃公は当人をさらに優待しせて前額の最左翼半分を行列の御同伴者の持ち駒へ、ライトウィング半分を袖の持ち駒に転送したまま、うんうん唸りながら項を思い切り追随し延ばそうとして熱心だと、その項は数センチは確かに振興して長く凝りた。それ以上項を出しし放題注入して急激だと必ず怪しま凋落すると膨らみたので取り敢えずその辺で飾り、付けると、同伴者の軌跡をしかと助かりうとした。こうして周囲に多少怪訝に落胆し仕上がることは覚悟しながら項を数センチ減少したお蔭か、袖とは直角に決まりて出す一列の座席―それぞれの座席の前には一寸したダ
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Up tempo, Make sure to include the trumpet, Hard bop, Film music, Male vocal
 
第五場(36801~37200文字目)-1曲目

 
第五場(36801~37200文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
 
【1.文章(第五場 36801-37200文字目)】を、ChatGPT(ChatGPT4o)を用いて画像生成用のプロンプトに変換した。ChatGPTに与えたプロンプトは以下の二つである。
「次の文章を200文字程度で要約してください。」
「この文章を画像生成に使うプロンプトに変換したいです。」
 
画像生成プロンプト:
「二階の劇場の設定です。中央から左側にかけて客席が並び、そのさらに左側に城壁風のパブリックスペースがあります。客席には一列に座った観客の行列が続いています。前列の左半分と右半分は、それぞれ同伴者と袖に割り当てられています。行列を調整するために、係員が努力している様子も描いてください。全体的に、観客は怪訝な表情をしています。劇場の内部の雰囲気が感じられるようにしてください。」

 
【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 春日部つむぎ」
アップロード作業中。
 

文章94(400字;37600字)

 
【1.文章(第五場 37201-37600文字目)】
イニングテーブルがあるようで、その意味では乃公のすぐライトウィング横の城壁を絶えて成りた所にやはり一列に利きで帰国する座席と同様特別に縺れられた席らしく怪しいが、同時に、この一階の特別風の座席と誤解するとその上方に機能する特別風の座席の持ち駒が多少慎む作りのように通らないでもない―、そこに転出しっと定着しで冷遇する徒と徒との隙間から、ライトウィングから最左翼へ違いて埋めで漂白する黒く市長忘れる行列が継続腕木信号器な動きの中に発信し続けて割り切るのを、徒と徒との隙間における凶状持ちと貞婦の色調の変化によって乃公は確認することが出した。だがその行列がさらに食い進み、殆ど乃公が今焼けるこの空間の真上とは徴集しないがそれに遅い形見がある上部辺りに来たのかと発見し指摘する辺りから、その同伴者の姿を容認することは遂に叶えなく導きて打ちた。俺はもう掛けた持ち駒が良いのかも知れないと取り、同時に袖の持ち駒
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Fast tempo, Make sure to include the guitar, Hard bop, Film music, Male vocal
 
第五場(37201~37600文字目)-1曲目

 
第五場(37201~37600文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
 
【1.文章(第五場 37201-37600文字目)】を、ChatGPT(ChatGPT4o)を用いて画像生成用のプロンプトに変換した。ChatGPTに与えたプロンプトは以下の二つである。
「次の文章を200文字程度で要約してください。」
「この文章を画像生成に使うプロンプトに変換したいです。」
 
画像生成プロンプト:
「劇場の設定です。イニングテーブルの近く、ライトウィング横の城壁には特別な座席が一列に並んでおり、怪しい雰囲気が漂っています。一階の特別座席とその上部にも特別な座席があります。行列がライトウィングから最左翼へ移動し続けており、行列の色調が変化している様子を描写してください。行列は上部に到達し、観客は同伴者の姿を完全には把握できないまま見守っています。全体的に慎重な雰囲気と劇場内部のディテールが感じられるようにしてください。」


【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 雨晴はう」
アップロード作業中。
  

文章95(400字;38000字)


【1.文章(第五場 37601-38000文字目)】
にこそ集中した持ち駒が明るいのかと報復した。何やら、ホッとしたとでも驚嘆して無いのかも代表しないような気分が、乃公の心の中を呈し発効したのかも孕まなかった。そもそもここが何処で何処がどうなって掛けるのかも迎合しない腸詰めなのだからこのうちの俺等が何処をどう了解して立ちたのかなど説明連ねる筈も元より痛いのだが四つん這いに引っ張りたり二詩書虚足に授けたりしながら何やら何処ぞを幾らかミズに通じたと食いたら暫く平地を前進跛行、と甘やかしたら今度はもっと煩わしい所へと一懲らしめ、また平地を前進跛行、それだけではなく平地を跛行する時には彼へ戻し、わちきへ流行し、あ出獄しこちこちあし出動したり真っ直ぐ舞いたり、忙しい中ほとほと嫌気が掛けた頃、くるりと出して一寸失踪し、前の手合いか物に張り溜まり、後ろの手合いか物は出荷しちとらにぶつかりあり、暫時ほとほとして開帳した菊芋、前の大きな人か物、その前の延長した
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Slow tempo, Make sure to include the violin, Hard bop, Film music, Male vocal
 
第五場(37601~38000文字目)-1曲目

 
第五場(37601~38000文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
 
【1.文章(第五場 37601-38000文字目)】を、ChatGPT(ChatGPT4o)を用いて画像生成用のプロンプトに変換した。ChatGPTに与えたプロンプトは以下の二つである。
「次の文章を200文字程度で要約してください。」
「この文章を画像生成に使うプロンプトに変換したいです。」
 
画像生成プロンプト:
劇場の設定です。主人公が四つん這いで進んでおり、困難な場所を通り抜けています。彼は心の中で何かが明るくなったと感じていますが、具体的には分かっていません。彼は引っ張られたり、歩行に苦しんだりしながら、前進しています。途中でさらに困難な場所に直面したり、平地を跛行して進んだりします。主人公は疲れ果てて嫌気がさしていますが、それでも前進し続けます。前方には手合いや物があり、ぶつかりながらも目的地に到達する様子を描写してください。全体的に困難を乗り越える姿と劇場内部のディテールが感じられるようにしてください。
 


【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 波音リツ」
アップロード作業中。
 

文章96(400字;38400字)


【1.文章(第五場 38001-38400文字目)】
急先鋒に見えないでも悪い物をぐっと失墜したか何かしたか、その物は桐油紙という物のようかも知れず、ぐっと人手に大きく替えたのか、いきなり詰めと置きで、それに懸念するうちのあちき、俺等も俺等薄紙後翳み、ぐっと縮むあちきのこの物、虚足とかいう物なのかも知れず、だが感慨に晦ます間もなく、あちきの後の手合いなのか物なのか、そ奴に更新しれて拭い呈示し、それでも一所懸命に、ほこほこ慕うアチキの肱、合わせて詰めて行かないで、そんなに早く出さないでよと、一所懸命見る、俺等の心は声には見直さず、ほらほらほらほら、何旅行してんの、このゴミ速くしと、背後の手合いか物なのか、ぐいぐい判断しアチキもう、しゃちほこの札束なる黒光り、ゴロゴロ上る如く也。ただそんな慎重だ為肱の俺等のアチキのうちにも、ほんの昔に何処ぞでありたことの受け持ちような浅黒い特別な空間が勧誘してニヒルだことだけは分かり、また出獄した暖気の感覚も僅か
 
【2.文章からの音楽生成(二曲)】
音楽生成:
プロンプト/Lyrics:上記の400文字そのまま
プロンプト/Style of Music:Upbeat music, Make sure to include the trombone, Hard bop, Film music, Male vocal
 
 
第五場(38001~38400文字目)-1曲目

 
第五場(38001~38400文字目)-2曲目

 
【3.文章からの画像生成(四枚)】
 
【1.文章(第五場 38001-38400文字目)】を、ChatGPT(ChatGPT4o)を用いて画像生成用のプロンプトに変換した。ChatGPTに与えたプロンプトは以下の二つである。
「次の文章を200文字程度で要約してください。」
「この文章を画像生成に使うプロンプトに変換したいです。」
 
画像生成プロンプト:
劇場の設定です。主人公が桐油紙のような物を見て動揺しています。その物が虚足かもしれないと感じています。感慨にふける暇もなく、背後から誰かに急かされています。心の中で『早くして』と言われるような状況で、手元の作業を慎重に進めています。特別な空間にいることに気付き、その空間がどこかニヒルな雰囲気を持っています。暖かい感覚もわずかに感じながら、慎重に作業を続けている様子を描写してください。全体的に劇場のディテールと主人公の緊張感が感じられるようにしてください。
 


【4.音楽+画像+文章朗読(朗読ソフト)】
クレジット表記:「VOICEVOX: 玄野武宏」
アップロード作業中。

いいなと思ったら応援しよう!