![見出し画像](https://assets.st-note.com/production/uploads/images/173532802/rectangle_large_type_2_7519bf167daac7a7039f6d771ba0af7b.png?width=1200)
今の私の生成AI周りの心境はこんなもの
本文
実は、2月になってからここ1週間、音楽生成AIであるsunoでは、新規に楽曲を生成していなかった。昨年12月に年間サブスクライブ契約をしていながらである。
なんでsunoに入り浸っていなかったの?という気持ちをひさしぶりにsunoで楽曲生成したのがこの曲。(以下のsunoへのリンクの曲)
https://suno.com/song/0d0e1e1b-62e1-44a6-9894-66f6424efb47
まあ、「ここをわすれないで」とsunoさんの運営側の立場に立って作曲してみたわけですが、決して完全に忘れてしまっていたわけではなく、楽曲の歌詞にも書いてあるように、他のことに夢中になってしまっていたからというのが正直な理由なのである。
その理由
じゃあ、何に夢中になっていたのと問われると、ローカルPCにてオープンソースで画像や映像をAIで生成するpythonベースの構築ツールであるComfyUI、およびそのツール上で動く動画生成AIであるLTX Videoで、いかに理想の動画を生成できるかを悪戦苦闘していたのである。
それを無茶なことにGPUがNVIDIA GPU RTX2060環境下で必死になって動かそうとしているのだから、年寄りの無茶と言われても返す言葉がたぶんない。
いくらRTX2060が一応はNVIDIAのGPUとはいえ、ComfyUIはなんとか環境構築できて動く(付属でついているデフォルトのStable Diffusion 1.5のワークフローはモデルをダウンロードしてなんとか動く)のが精いっぱいで、LTX Videoまではなんとか8FPS1秒間の動画が作れるかなぁと言った程度の悪戦苦闘ぶりで、この環境下ではまずGRAM(6GB)をはじめとしてメモリが足りなくて、他のメモリに頼ってもOOM(Out of Memory)を初めとしたエラーが頻出するか、生成できたとしても、あまりにも時間がかかりすぎる状況から脱却できない。
しかも、ようやくにして生成できた映像も、ポジティブプロンプトにちゃんとした説明を詳しく書いていないと、見るに堪えないまともじゃない映像しか生成してくれない。
それでもなんとか見られる映像生成に夢をたくしてなんとかするがあまり、sunoのことは忘れかけてしまっているし、それ以上にちゃんと職場で作業をしない日々が続いたりと依存が激しすぎる傾向にある。
いや、本当に54歳の無職に近いオヤジがやることではないのかもしれないが、それでも悪戦苦闘は続く。