Syun Nakano
最近の記事
マガジン
記事
- 再生
Control Netっていうやたら強制力の強いやつを使ってみたら、考えざるを得なくなった事についての件
Claude 3 Opusが賢いっていうので、とりあえず課金してみました!(無料期間中のGeminiは今のうちにソッコー解約しちゃった・・・) ところが! 賢いけどバカで、歌心ぜんぜんわかってくれない!やたらとリア充っぽい歌に変換させるし。んだよもおおおお!とりあえず様子を見てみましょう。 LCMがソコソコいい感じなので、身近にMacBookがあるとフワッとプロンプトを入れて様子を見るみたいなことをやれるようになり「これって盆栽みたいじゃね?」なんて思いながらチラチラとstable diffusionに画像を出力させています。アニメーションはまだ、なんかキツい。放っておいたら止まってる。Windows来てもやれるかどうか・・?って感じですが。 で。そういうことしてるとフワッと良さげな画像が出てくる事があるじゃないすか?そんなんControl Netの強制力を持ってして、連続出力させたくなるわけです。放っておくだけだったりしますけど。いっぺんに何枚も出すとか。 で、出力したのを見てみると・・・ なんかもう色々考え込んじゃうわけです。 いまAIが楽しいなと思ってる理由は「オレが楽できそうだ、オレが楽できるかもしれない、もしかしたら人間ってもんがなんなのか?自ずと浮かび上がってくるから」っていうことなんですけど、そのことについて考えざるを得ない感じでしたよね。 で、思ったことをいつもの通り韻文的にサラサラかいてGPTくんに英訳させるという。これ、アレンジを加えたり編集しない場合オレが作ってんのか?っていうと極めて怪しい感じがしますが、ゼロイチの部分はおれがやってるから、これはこれで形にしてみたいな、と思った次第。動画編集ツールが優秀なのでソッコーで出来てしまうんですけど。 ちなみに歌詞は日本語だとこんな感じ↓ タイトル:Same? 個性について知りたい、 個性と呼ばれるものについて教えてあげる、 この個性というものを学びたい、 個性について知っていることを共有しよう。 わかるかな、不思議に思うかな? 考えてみるかな、気づき始めたかもしれない、 私たちは個性を理解しているし、それを排除しているのかもしれない 個性は誤差に過ぎないのか?という主語クソデカ問題についても考えなくてはならないし、オリジナリティというのはなんなのか?過去の連続性の中からようやく生まれてくるものなのか。っていうか主語クソデカは簡単な話なのか難しい話なのかマジでわかんなくなってきた。 ともかく。 これは、ちゃんとアレンジして完成させます。いまは「ネイキッド」っていうことにしておきます。
- 再生
Go viral?
忙しさにかまけて、せっかく曲を作ったのにここになんも書かないで2日くらい過ぎました。この曲結構好きなのに。本当はブリアルのアルバムに入ってたやつくらいの感じにしたかったんですが、なんか無理でした。試行錯誤の跡だけでも見えたらいいと思うんですが、成果物は結果がすべて。 とは言ってもなんかいい曲だと思います。OTTっていう音をギュウギュウに積み込めるマルチコンプがあるんすけど、それをマスターにぶっ込んだ挙げ句、OZONEでサチュレーションも強めにかけたりして。 「バズりたい」とか言ってるだけの身も蓋もない曲で、おまけに絵面がこういう感じなので政治的にまったく正しくないと思うんですけど、どうなんだろうかね?という。性的メタファーもいつものようにぶっ込んであるんですが、無線の常時接続が当たり前になって「WEB3…いやWEB4なのか?」とかなんとか言ってる時代に若い人に伝わるのかどうかさっぱりわかんないです。意外と自分のチャンネル、若い人も見ているようです。 Stable Diffusionはスゲー好きです。なんか盆栽みたい。「おっ?そうきたのか。そんならこうやって…」とかやっていく感じ。フロイトの無意識とか夢とか色んなことが言えるんですけど、これって盆栽なんじゃないか?という気持ちが高まってるので盆栽やりたいです。早くコブラ会見たいです。 あ。 もうMacBookオンリーでは無理なので、値下がりしつつあるGPU搭載のPC導入することにしました。ランニングコストでクラウドサーバー使うより断然イイんじゃないか?とか思っちゃったんだな。今後GPUをバリバリに使った生成モデル出てくんのか?という気もするんですが。よくわかんないけど。 それにしてもMacBookAirなんかより断然安い。MacBookは細かいとこがマジで良く出来てるのであんな値段になるのはわかるんですが、もうmacOSだけじゃ無理っす、という感じですなあ。あと1台だけでも無理。 なにしろ。 せめてWWDCで大胆な発表をしたり、プログラマーがやる気出すような感じの雰囲気になってほしいのですが。知らんけども。だってネンイチだもん。
- 再生
ああ、ようやくコントロールネットのインスコが終わろうとしている・・
「Suno.AIやばいなこれ!うかうかしてられない!!!」と思ってからというもの、歌詞を書いてはせっせとアカペラを生成してもらおうと思っているわけですが、なんせ、なかなか歌ってくれない。こんなんでは伴奏をつけられない。リミックス?というか、なんかもう、とにかくアレンジまでなかなか進まない。 AIが、なんでそんな伴奏をつけたくなるのか、さっぱりわかんないけど、おれもつけたくなるからしょうがないのか。人間が考えそうなことはやっちまうなこいつら・・・こっちが拡張するいい機会。 ということで、今年は多少なりともヘンテコなポップを作ろうと思っているのですが、最後の方は結局Synthesizer Vを使いました。じゃないと音楽が進まないから。メロディーがあるものを作るのはなんか照れくさいですな。歌詞はアルファベット3文字だけど。 それでも歌物はやりたいので、Synthesizer Vをもうちょっと使いこなせるようになりたい。つい最近「+とー」の使い方がわかるようになった僕です。なぜなら、歌物を作ってる余裕がなかったから。 今度はSunoにインスト作らせて、歌メロを書いてみようかな。新しいエンジンがなかなかすごいぞ!っていう。AIVAはなんかつまんない感じがする。 画像はstable diffusion forgeです。GPU SOROBANにインスコするのすげえ時間かかった。なんか、設定の方が大変でござる。なんかよくわかんない感じのGUIのないOSいじってPythonを動かしてるわけだし。なんかだんだんコマンドラインとか、ほんのちょっと理解してきたような気がしないでもない今日この頃。あとサーバー接続の鬼になってきたような気もするけど、そうでもなかった。
- 再生
今回の曲はちょっと難儀なやつになっちまったぜ!の巻
歌詞を日本語で考えてGPT4に渡し、そこから色々とやりとりしつつ英語の歌詞を作り、それを使ってSuno.AIに渡す。そして伴奏をつける。 そんなことばっかり延々とやってたんですが「流石にそれはどうなんだ?」という事で今回からはシンセサイザーVを使ってみることにしました。あの初音ミクの上位版みたいなすごいヤツ、アレです。 ところが現在ベータ版で運用しているからなのかなんなのか、動作がめちゃくちゃ重い!なんか重いんですけど!ってなったので、今回もSuno使ってみることにしました。 いくつか生成して好きな感じのものをピックアップ。 Sunoが出してくる僕が好きな感じのやつってだいたい「あっ、なんだかDTMでやりづらそう」みたいなもんになっちゃいがちなんですが、なんかこう案の定やりづらい。やりづらいんだけども面白い気がするので、かわいい短いボーンスリッピーにしちゃおう!と思ったらこんなんなりました。どうなんでしょうね。なんか変だ。 「なんか変じゃないやつ」ってAIVAとかがガンガン生成してきちゃうようになっちゃってるので、このヘンテコさはこのまま残しておこうという判断でこんな風にしておきました。なんかすごいよなもう。AIVAのビートってひとつも面白くはないけれど。 とはいえ、こういうやり方で「歌声の生成」やってるだけでもあんまり面白くないんで、早くも面白く無くなってきたので、そろそろ本気でシンセサイザーVを使って歌声を生成しよっかな、と思っている次第です。しばらく歌声というやつを扱ってなかったんで試行錯誤でしたが、肩があったまってきた。 まずメロディというものを書いてみようか。そう思っております。
- 再生
Echoes of the Ancients: A Soundscape Journey Through Time
記号論の話を軽く聞きながら帰ってきていたのですけれど「そっかー」と思うことがありましたので、こういうサウンドスケープを編纂してみました。多分こういう場所は古代人のディスコみたいなもんだったんじゃないか?っていう話がすげー良くて。 そこでSunoに読ませてみたんですけど、最後まで読んでくれませんでしたが「それもよかんべ」という具合で一回だけポエトリーリーディングが入ってきます。 あと、何か色々とイイということなので、縦型の動画にしてあります。 編纂しているうちに気がついたんですけど、何かのコンテストに出してボツ曲になったやつが本動画に使われているんですが(笑)そりゃそうだ、と思ったりします。 鍾乳洞とかに遊びにいってみたいっすねえ。
- 再生
Machine Piano Dream
今回も画像はAI出力でオナシャス!しました。 マシーンピアノとか言ってますけど・・・・ 今回集めてきた過去曲全てがタイトルに反して結構人力で、自動生成はしてない感じです。けど、それでも、めっちゃ機械的に作っていると思います。なんかもう、タイミングとかベロシティとかペダルとかどうかしてますよね。 ひとまずは集めてて「懐かしいな」と思いました。そして無理も背伸びも何にも一切合切してない感じがしてて、いいと思います。こういうことを伸ばしていけばいいんだと思ったりします。すまん、ちょっと無理してた。数年。 で、集めて編纂するだけでもつまらないので、こういう動画の常套手段みたいな感じのものとして(笑)ノイズを乗せてあります。森の中って感じですね。あとドローンも少々。なんかもう、案外人力です。もっともっと作曲にAIを取り込んで「自分という非対称」を炙り出していきたいと思っているのですが。 僕が一番やりたかったことは、どうやら結局「歌」なのですが、シンセサイザーVも使いやすくなってきているし、Suno.AIで歌詞を書くのも楽しい。日本語の歌詞に改めて挑戦してみたいと思います。 歌はやっぱり・・・音楽の主体そのものになりがちだと思います。どう考えても、やっぱそうなのです。あまりにもかけがえがない。なので、いくら出力していい歌を作れたとしても「いい歌だねー」がいいとこ、って感じはしてます。楽譜見てシンガーを好きになることないと思うんで(今のところ)。 映画カストラートのメイキングなんて、懐かしいものです。当時においては大変な合成技術が使われている。本物のカストラートの録音が出てきた時はびっくりしたもんですが、資料価値以上のものは感じられなかったというのに。 カストラート文化、彼らのために書かれた歌について許せるかどうか?っていうのは、生成AIよりもはるかに過酷なテーマでありますが、人類は一度映画のためにそれを人工的に「生成した過去」があるのです。 何を意味するか?ってところではあるのですが。果たして計算速度の問題だけで片付けられるでしょうか?僕は片付けられると思っています。 あ、そうだ。 確か一番最後の曲は「Spring of dream」っていうタイトルがついてて「どこらへんがGTOなんじゃ」って感じなんですが、こうあって欲しい感じもします。なんだか。
- 再生
超ハイファイなLo-Fi
睡眠、入眠、集中力系を集めた動画を作ってみました。作ってる間はそんなことなんも考えてないんですけどね。考えてることは「とりあえずアンビエントとか実験的な作りたい」みたいな。でもワンチャン眠れるんじゃないかな?って。(自分で聞いてて眠れるし) あと、これを描いてる現在では解像度荒いですが、そのうち4Kになります。 今回の動画を作るにあたって改めて検索してみると、やたらシンセウェーブとかチルウェイブとか、そういうキーワードがいっぱい出てくるので、つまり、タイトルをそういうものにしました。そして、無くてもいいノイズとかも加えておきました。元々はハイファイな方の音楽だと思うんですけども、多分、我ながら。 今更感バリバリですが、ともかく普通に「そういうのに乗っかっていっていいじゃん?」というくらいには僕も成熟したものです。 ジャンル名ができた途端に音楽は死ぬという話はあるんですが、死者のことばっかり考えるのが音楽家の使命みたいなとこあるから(ありませんか?学問に近いと思います)。いいんじゃないっすかね。 その上でスポーツ的な要素は今後の制作でもっともっと取り入れたい、そんな感じもします。 というか、スポーツって神々の前で行う遊びらしいですよ。生きても死んでもいない。定義としては時間の超越性を感じちゃうんですが・・・ 実際に試合とか見てみると、たとえ画面越しの放送見ててもイマココ感が凄まじいですよね。 そう考えると、そのときに起こっていることをやはり考える必要があるのだと思うわけです。 音楽は全て人力ですが、画像はAIのチカラを借りました。AIについては今年のうちにしっかりやっておいて、人間のまま使えるようになっておきたいっすねえ。
- 再生
Vision
Apple Vision Proがやってきた!!!(買った人のところに。もちろん僕のところにはやってこないのでした)。クエスト2は買いました。そして、しばらく使い、いまでもたまに使い。やおらこの分野にも火がつき始めるのか?って感じが出てきました。 最近LLMを使って何か出力させるのが楽しくなってきちゃって、生成されたものに筋肉をつけていくと、その途端に「自分」という人間が対照的に出現することにビビり、ひたすらビビっているので、とにかく楽しんでおります。音楽制作にマンネリ化を感じていたんですが、自分を見つめ直すとってもいい機会。 そういうAI技術っていうのが出てくると、どうしても不安になるのが人情ってもんですが、VRゴーグルめいたやつも若干不安になっちゃう。 看板が立ってたり、彫像が立っているっていうのは本当にすごいこと。なんですごいか?っていうと「見た人それぞれがどう感じるか?」とかはあるけれど、難しいこと考えなければ「やっぱりそれは、どうやったってそれ」だからなんだと思うんです。 VRゴーグルつけたら色んな付加情報が(MR)出てくるんだろうし、便利そうだと思うし、なんなら末期治療に最適だ!なんて思ったりします(いやまあ、人を孤独にして画面を見つめ続けさせるやつって色んなことに悪用されてはいますけど)。 付加情報が付いてくるっていうことは、人が卵を見つめたときに「卵はうまいもんです」って出てくる人と「これは食べたらアレルギーで倒れる」と出てくる人も出てくんだろうと思うわけです。 便利だけど、これは大変なことすぎる!と思ったりもするわけです。好悪を超えた個人の妥当性ですげー分断がががが。 この分野が今後どのようになっていくのか?とっても興味あります。ちなみにVtuberとか僕結構好きですけど、プロジェクションマッピングを応用したホログラム的なやつだったら現場で見てみたいです。 スポーツだったらちょっとわかんないですけど。スポーツのイマココ感は本当にすごいですね。なんか、他の分野と比べてもだいぶすごいと思います。 あと、誰かVision Proください。欲しいです。 ちなみにこのSEめいた曲の歌詞は以下。 The man with large glasses said, "In two hours, you'll be tied to a chair."I wanted to wear those glasses, truly did. Maybe YouTube won't be an option.Perhaps, foods with allergies will start to show warnings. I thought it handy, though she said, "It's my favorite."No one's beside me. Preferences exist, yet.No one's beside me. Is correctness a question?No one's beside me. Perhaps I am, though.