5000字で振り返るサルドラの2024年上半期総括
はじめに
2024年も7月に入り、一年の半分が過ぎた。
2024年の大目標は「創る人を創る」、中目標は「技術の一般化を進める」と「アプリケーションレイヤーでの実装をもっときちんと深ぼって考える」だった。今回の記事はやったことを月ごとに振り返って、最後にこの大目標に沿ってたかを確認する。
月毎の振り返り
1月
「アプリケーションの実装」と「コミュニティ運営」と「AIキャラクター」の三要素を主軸に考え始めた一ヶ月だった。これは現時点でも主軸の三要素になっていて、まだまだ荒削りだけど自分なりに色々考えていたのがログからわかる。
例えば正月三が日は実家に帰るイベントが発生していたので、Twitterをあまり見ずに、AIキャラクターについて一人で深夜に考えたりしていた。
本当に正月の深夜で誰も見てない前提だから話すけど、オタクの理想をグロテスクなまでにつめこんでも大丈夫な「キャラクター」が光り輝き始めるの、多分今年からでは?…
— saldra(サルドラ) (@sald_ra) January 1, 2024
「AIキャラクターは原罪を背負いうるのか?」とか「二次元の存在にはどうしても三次元的な要素が入ってしまうけど、今の技術を使えばかなり純度を高めることができるぞ」とか、そんなことを考えていた。LLMを使った上でのというか、現時点で使える技術を広範に見た際に、何が達成できるんだろうかについてをひたすら考えていた。最近やってないから、またやろうかな。
正月休みで暇だったから「日本語特化シンプルAIメモ帳(仮)」を作ったよ~
— saldra(サルドラ) (@sald_ra) January 5, 2024
AIが入力補完してくれるよ。CPUで動くのでGPUない人もOK!exe形式なので環境構築不要。まだオモチャですが、ウケが良かったらきちんと出します。
ダウンロード➡https://t.co/im8NMguC8U pic.twitter.com/N3CT4WaBcN
これは三が日何も動けなくて悔しかったので、正月休みに一気に作り上げたLLMプロダクト。「CPUで動く」「環境構築がいらない」「API使わない」の三要件を満たしたツールを作ってみたかった。せっかくローカルLLMで遊んでいるなら、遊ぶだけじゃなくてオモチャでも良いなら実装しないと〜と思って作ったのを覚えている。ウケがそこそこだったのと、「これCursorとかGithubCopilotでよくね?」っていうのに勝てなかったのと、単に飽きてやめた。
「ローカルLLMに向き合う会」の会話及び質問内容があまりにも高度になりすぎている現状を鑑み、「超入門者用の質問部屋」を建てました。
— saldra(サルドラ) (@sald_ra) January 14, 2024
ここで環境構築の悩みとか、そもそもファインチューニングって何とか、そういうのいくらでも話して良いぞ! pic.twitter.com/IbCCZE2rSE
ローカルLLMに向き合う会というコミュニティを運営していたのだが、どんどん話が高度になってしまっていて、それはそれで嬉しいのだけれど新しい人が入った時に途方に暮れてしまうと思って質問部屋を分けた。これは正解だった気がするので実績としてここに書く。「いかにコミュニティが熟成され過ぎないか」はずっと考える必要があって、なんというか新しい人は一定入り続けないと死にコミュニティになってしまうという危機感は常に持っておくと良い、と思う。
明日の19時に開催する「学生GPU争奪LT大会」でぶん投げるGPUが確定したのでお知らせします🎉
— saldra(サルドラ) (@sald_ra) January 16, 2024
・2070(VRAM8GB)
・3080(VRAM8GB) laptop
・2060super (VRAM12GB)
・3060ti(VRAM12GB)
・P40(VRAM24GB)
有志の皆さん本当にありがとうございます🙏 pic.twitter.com/t5EVAJFDM1
ローカルLLMについて色々やっているにも関わらず、そもそもGPU持ってない人もいることがコミュニティをやっていて感じていた。ある時、ぴゅう太氏が「有志で中古GPUを有望な若人に渡して、中古GPUの流動性を高くしつつ有望な若人のできることを増やせるのではないか?」という発想を出してくれて、「僕の家にGPUを集めてLT大会してくれた若人に送付する」とかいう謎のイベントをやるに至った。結果的にだけど、このイベントはコミュニティの方向性を決める一番最初のきっかけになったような気がする。
サイン会のお知らせ📢
— saldra(サルドラ) (@sald_ra) January 13, 2024
01/22 (月) 18:00 ~
対談会・AITuber本サイン会やります!
無料オンライン視聴もありますです。今回はちょっと深堀りして、AIに命を吹き込むという側面で話そうかな。
宣伝枠としてLT登壇枠あります!
よろしくお願いします!https://t.co/4U3X8fOjV4
これは当時のPictoriaのオフィス(京橋)でやった。人生初のサイン会で、このイベントあたりまでは全然サインの書き方が安定していないので、皆と違うサインが書かれた本が一定ある。すみません。。。
あとはllama-cpp-pythonのexe配布の記事やllama-cpp-python+cuBLASの入門記事を作ったりした。
2月
2月は「LLMを使ったキャラクターの認知拡大」と「ブラウザ駆動LLMの挫折」、「ローカルLLMに向き合う人が直面するハードルを下げる」が大きなトピックだった。
まず、Witness氏と組み、ローカルLLMに向き合う会の内部で無料GPU貸出を行いました。

フォロワー、ローカルLLMに向き合う会の通知見て〜
— saldra(サルドラ) (@sald_ra) February 6, 2024

まだ環境のセキュリティ状況が確立されていなかったため、Twitterで公募するとまずいと思いクローズドで募集した。現在はこのサービス自体は終了し、セキュリティがしっかりしている環境を用意し、後述するハッカソンという企画に落とし込むことができた。「企業では利益問題がある、研究室では革新性がないといけない」となった時、我々ホビープログラマがやりたいことは現状でできることがどんどん減っていくはずで、それは2024年においてほとんどの場合はGPU資源が原因となる。なんとかしてその断念を減らしていきたいと考えている。
二月中旬にデブサミに登壇し、ChatGPTの話からさらに派生して、ローカルLLMの布教とCuBLASやCLBlastの話もした。
📢告知
— saldra(サルドラ) (@sald_ra) January 11, 2024
2/15 (木) 17:00 ~
「Developers Summit 2024」に登壇します🎉
皆が真面目な話をしているイベントで、LLMを用いたAI美少女についてオタク君の早口語りをするぞ💪
👇予約はこちら👇https://t.co/3HVqOkiE58
「LLMでできることは業務効率化だけでないよ」というのは、継続して話していきたいと思っている。
ご来場&爆盛り上がりありがとうございました😊Ask The Speakerブースも30分くらい人が尽きず楽しかったです‼️
— 𝙎𝙝𝙞𝙣𝙜𝙤 吉田真吾 (@yoshidashingo) February 15, 2024
資料↓(後半のディスカッション部分はトピック表示のみ)https://t.co/lUIeSGdgGzhttps://t.co/tK307hwfPW#devsumi #devsumiC pic.twitter.com/z1uldWOpsT
普通にいつものノリでデブサミに参加したら、皆きちんとした服だったので、一人だけ浮いていた。早く僕も社会に溶け込めるようになろう。
話した内容は記事になったが、ChatGPTの記事だったのでかなりカットされた。でもそれで良いとも思っている(かなり本筋からズレた話ばっかしてたから)
あとは将来のことをぼんやり考えていた。
「仮に全てをぶち壊す技術が誰でも使えるようになって、それによって絶望するか」を数日間考えてたけど「まぁ別にまた最初からやればいいし、それでクオリティが上がるなら容赦なく使えばいいか」って思い始めてる。エンジニアという職がなくなったらまた別の職を1からやろう。…
— saldra(サルドラ) (@sald_ra) February 19, 2024
定期的にキャリアや将来のことは考えている。面白いことを追求し続けて、結果的にそれで楽しく生きることができたら満点だが、一方で自分がそちら側の人間でないことも薄々わかってきている。自分が幸運なのは、AIという技術が台頭してきた時に、ぐんぐん伸びていく少年や青年を身近でみることができたことだろう。
3月
ここら辺から、コミュニティ運営及びイベントにかなり自分の時間を渡すことが多くなった。あまりアプリケーション実装をしなくなったし、入門記事や講座もできていない。だから2024年の目標だった「創る人を創る」を厳密に守れているかはわからない。だけど自分がやる意味がなんとなくあると思ったからそっちに自分の時間の舵を切った。
ローカルAIハッカソンの企画が立ち上がった。「240時間、A5000*7をぶん回してMITライセンスの成果物を作れる」という、日本最大規模のAIハッカソンの参加資格は面白く、「成果物を作るにあたり17GB以上のVRAMが必要である」というものだった。
📢日本最大規模のAIハッカソンやります
— saldra(サルドラ) (@sald_ra) March 12, 2024
「ローカルLLMに向き合う会」は「LOCAL AI HACKATHON」を行います!Witness氏、メタデータラボ株式会社さんと共同開催です。
各チームはVRAM168GBをクラウドで駆使してOSS成果物を作ります。… https://t.co/391RvnJakD
慣れてないからすごい時間がかかった。開催は4月1日だったが、準備期間や決勝期間自体は3月だったのでこっちに残しておく。
決勝チームのランダム選考もpublicにしたかったで、はサーバー内でシード値を決めてコードを公開するという遊びをした。
あとはgguf変換がかなり大事になってきたので単発でgguf変換記事は書いた。
4月
第0回ローカルAIハッカソンを開催した。水面下で一ヶ月半くらい?調整した。色々な人に会って話を聞いて進めて〜…というのを頑張った。物事を始めるのは得意で、進めるのは得意でなくて、きれいに進めるのは苦手だと思った。
皆さんのご協力あり、無事終了することができました!
— saldra(サルドラ) (@sald_ra) April 1, 2024
色々バタバタしてしまいました。本当にありがとうございました!
「LOCAL AI HACKATHON #000」の結果をお知らせします。敬称略。
金枠1:offtoung
金枠2:yuiseki
銀枠・銅枠:Apfel・pret-a-porter pic.twitter.com/JwF8oyJXUS
「中古のGPUでやることを増やす」という試みだけだと限界はあって、その限界を突破するためのイベントとして最初の試みとしては大成功と言えたと思う。
その1週間後にNISAに突っ込みすぎたとか色々あって普段使いの口座が大変なことになっている、新卒から何一つ変わっていない…
discordのブーストとかmeet課金とか色々やってたら普通に預金通帳見せられないレベルの残高になっててワロータ
— saldra(サルドラ) (@sald_ra) April 11, 2024
お金ないので寄稿でもインタビューでもなんでもします!お仕事ください!
2週間後には次のハッカソンの募集を始めた。同じノリでいけそうであることと、過労対策でチームにするのをやってみた(後述するけどチームにすること自体はそこまで大きな効力はなかったのかも)
「LOCAL AI HACKATHON#001」開催🎉
— saldra(サルドラ) (@sald_ra) April 12, 2024
「AIの民主化」をテーマに、AIハッカソンを行います。機械学習用環境を240時間無料で使えます。申込期限は13日24時。
ローカルLLMに向き合う会、AI声づくり技術研究会、メタデータラボ株式会社の共催です。
特設ページ:https://t.co/1w6meWfaKy
あとは「生成AIなんでも展示会」の実施があった。
生成AIなんでも展示会ありがとうございました!凄い楽しい会になりました。バタバタしていたのであまり込み入った話をする時間がなかったですが、またこういった機会に何かお話しできればと思います!
— saldra(サルドラ) (@sald_ra) April 22, 2024
これからもよろしくお願いします! https://t.co/LLpUYh6EeF
自分が諸々の諸準備を沢山やったかというとそうでもなくて、宣伝と当日の入り口案内が主な担当になっていた、一緒にやってくれているようさん、抹茶もなかさん、みけたこさん、やなぎさんが優秀すぎる…
個人開発で生成AI使ったプロダクト作ってる人と、どういうプロダクトがあるかを知りたい人のハブになるイベントにできた、と思う。これは今後もやりたいけど正直個人でハンドリングできる範囲を越えているな〜とも感じていて、如何にチームでやるかと、そのチームで自分は何ができるかは継続に考えようかなと。
あとはAITuberのワークショップをやった。
第1回AITuberワークショップ開催中です🤗
— Hitomi | Oshibloom CEO (@7gN1o) April 28, 2024
40人くらいでチームに分かれて協力しつつ、一人一人が自分だけのAITuberをつくっています!!🧑🏻💻
著者のサルドラさん(@sald_ra)が直接ご質問にお答えしてくれますよ〜🙋🏻♀️✨#Aegisイベント #AITuber https://t.co/HoDNEPAbFO pic.twitter.com/A2lcmzmYCT
この本、Python初心者向けの本になってて、環境構築さえやればかなり良い教材には、なり、そう…だと自負はしている。
OS差分が思った以上に色々あって、特にOBS周りで文字が上手くでないとかのトラブルが発生して、これはやってみないとわからない知見だよな〜と思った。物事の詰まりごとは事前に予測することはできない。
5月
これはAI声づくり研究会との共催という形で進めた「ローカルAIハッカソン」は、発表内容も興味深い物が多く「GPUも足りないし何よりデータセットが足りない」という話は面白かった。それこそコミュニティでなんとかできそうなものだが、、
ハッカソン、無事完了しました!皆さんありがとうございました!本当に色々な成果物や失敗が共有される身のあるハッカソンになったかと思います!
— saldra(サルドラ) (@sald_ra) May 1, 2024
結果は以下です。
金:Local Novel LLM Project(小説生成モデル)
銀:Auris(独自アーキテクチャの音声モデル向け大規模事前学習)… pic.twitter.com/Hs91IdpWSq
金賞と銀賞にそれぞれ音声とLLMが入ったのは良かったし、LLMに関しては7b程度の小説生成という「使えるLLM」がコミュニティからapache2.0ライセンスで出せたのは進歩だと思う。
あと超突発で大阪に遊びに行った。
明日弾丸で大阪行くんだけど、まだ往路の航空チケット取れてないです
— saldra(サルドラ) (@sald_ra) May 2, 2024
AIでじこ作るとか言ってる暇なかったかも
「おだやかおせち倶楽部」さんという日本橋にある雑貨屋さんでインターネット老人イベントをやるというので、急遽きめた。ついでに見せびらかすために空港で「AIでじこ」を作った。
ローカルAIハッカソンで作られたモデル(vecteus)を使い、ローカルAIでじこを爆誕させたぞ!
— saldra(サルドラ) (@sald_ra) May 3, 2024
大阪旅行限定で直接見せます、配布はしません。今日明日大阪にいるので見たい方は連絡ください pic.twitter.com/dHb9dpUZjU
あとファングッズも貰った。
大阪旅行、あさぎさん( @lmvle )から激アツグッズ貰った!
— saldra(サルドラ) (@sald_ra) May 4, 2024
美少女でよかった〜〜 pic.twitter.com/x6UpZeqcKp
現状でも楽しめるようなプロダクトは少なくとも作れるのはわかったし(AIでじこは喜んでくれた)、可能性も感じた。LLMの話もキャラクターの話もできたし良い旅行だった。
中旬にやったさくらのミートアップ登壇は結構必死に話した。
【告知】さくらのAI Meeup vol.1にPictoriaとして登壇します🔥
— saldra(サルドラ) (@sald_ra) May 9, 2024
時間: 5/17 19:30 ~
何話すかはまだ決めきれてないです。ローカルLLMの話かも?
先着順30人で残り6人の空き枠あります!増枠するかはわからないですが、もし気になる方いたら予約してみてください🙏https://t.co/Ha6ZMzf4LR
確か「推論にかかるGPU負荷はかかるしOpenAIもあるけど、LLMを作る遊びをしようとすると一気に参入障壁が上がるよね。できればそれを下げてコミュニティの力でapache2.0を増やしていくぞ!」みたいな話をした。楽しかった。
あと初めての5000バズを達成した(やった〜)
趣味で「感情ちゃん」ってソフト作ったからフォロワー見て~ pic.twitter.com/vkToHxujLP
— saldra(サルドラ) (@sald_ra) May 31, 2024
「最近個人開発できてないな〜」と思って、前々から思ってたアイデアを土日でコーディングした。最近はcopilotもあるから実装時間少なくなって良いですね。下記はこれを作るときの最初のアイデアメモ
発言内容のtokenと確率をリアルタイムでババババって出したらかわいいかも
このあたりからちょっとだけ仕事が忙しくて、Twitter見る時間がかなり減っていた。まぁでもタイムラインって意外とそんなに見なくてもなんとかなるという気がしてきている、本当にやばい技術は複数日見てなくても驚かれ続けているし、怖くなったらXの話題の記事見ておけばなんとかなる、みたいな…
Twitterで最近驚けなくてごめん、黙って進捗は出してるから信じてくれ、自分まだできます
— saldra(サルドラ) (@sald_ra) May 29, 2024
元々外部にDM撃つ用でXに課金してて、結果的に数カ月はお小遣い貰ったけど以降は全然呟いてないのもあって赤字。でも話題の記事読むことで可処分時間確保できるからTwitterで時間潰しちゃう人は課金する手も考えて良いな〜と感じている。
6月
LLMに向き合う会、データセット人力生成部が爆誕した。
LLMに向き合う会データセット人力練成部、爆誕…
— saldra(サルドラ) (@sald_ra) June 2, 2024
主催者はすでぃー君(@sudy_super )です pic.twitter.com/MYgZEXsdFs
主催、ロゴ作成はすでぃさんで、すでぃさん主導のもと10人くらい?集まって論理学系のデータセットをチマチマ作って公開。悪習因果とか「自分が何のデータセットを作っているか」を意識しつつ作るのは結構面倒ではあった、それこそLLMに任せたい気もするが、最初のデータはどうしても人が必要になる…
中旬はGoogle for JAPANに遊びに行った。
Google for JAPANに来てます〜、かなり浮いた格好で存在はしてるので、お気軽にお声がけください! pic.twitter.com/mRqSvhyRXR
— saldra(サルドラ) (@sald_ra) June 19, 2024
「確かにgemini良いな〜」という気持ちもありつつ、「これプロダクションにぶちこむなら各クラウドプラットフォームに依存することになるから、気軽にすぐ切り替えるとかしやすいプロジェクトならいいけどプラットフォームごと切り替えるのかなり手間だよな…」とかも考えていた。やっぱり個人の遊びと安定性やデグレを出せないプロダクトの違いはどうしてもある、この辺皆どうしてるんだろう。
後は月末恒例個人開発。今回のは「無限の掛け合わせをLLMに生成させることで対応できるようにする」というのがテーマだった。
「Primitive Gods」というLLMを用いたゲームを作ってみた。各要素を組み合わせて新しい世界を作るゲーム。使ってるのはNinjaのV2です。
— saldra(サルドラ) (@sald_ra) June 22, 2024
定期的にClaudeくんがやってきて、「ちゃんと世界創ってる?」って聞きに来て、うまくやってないとキレてくる pic.twitter.com/gRemavtlMb
「膨大な掛け合わせが必要になる」というのが個人的にLLMの台頭によって技術的な限界にならなくなってきたな〜と感じていて、(求める形式になってるかの後処理は必要だけど)掛け合わせ結果やそれに応じて発生したイベントの説明をLLMにさせるのは面白いと、思う。
これが僕の上半期。
まとめ
序盤は「創る人を創る」っていう言葉が良いな〜と思ってたから例えば環境構築がいらないツール作れないかなとかぼんやり考えてたんだけど、最終的にイベントブン回して登壇して時々個人プロダクト作って…という動きに最適化されていった気がする。特に3月以降からはかなり仕事や私生活含めバタバタしてたから自分からみたらバタバタ動いてるつもりだったけど、こうやってTwitterでの発信内容をベースに他人目線でみるとそこまで動いてないようにも、見える。一方で、一回一回の動きは去年に比べて大きくなってきてる気もしていて、だからあまりにも悲観的になる必要はないのかな〜
ということで2024の上半期総括を終える。2023年の総括もあるのでお暇な方はぜひ。
一万字で振り返る2023年のSaldraと、来年の抱負|Saldra @sald_ra https://note.com/saldra/n/n01dce8eb5b61
Twitterはこれなので、よかったらフォロー
してやってくたさい。