大曽根宏幸

創作支援アプリAI BunCho運営開発 https://bun-cho.work/ AIよろず屋 インダストリアル・ドリーム(株)代表取締役 https://www.industrial-dream.com/ 開成→筑波(落合研)→東工大博士課程(休学中)

大曽根宏幸

創作支援アプリAI BunCho運営開発 https://bun-cho.work/ AIよろず屋 インダストリアル・ドリーム(株)代表取締役 https://www.industrial-dream.com/ 開成→筑波(落合研)→東工大博士課程(休学中)

最近の記事

  • 固定された記事

OpenAI税に対抗したい

大曽根と申します。AIの1人会社をやっています。従業員はいないので、実質フリーランスのAIエンジニアみたいな身分です。 1年くらいのんびりやっていたのですが、AI業界の搾取レイヤー構造が意外と知られていないことに最近気がついたので、備忘録がてら記事にまとめることにしました。 AI業界の人にとっては当たり前な内容だと思うので読まなくて大丈夫です。 a16zのブログより、AI業界のレイヤーは以下のようになっています。 ブログでも書かれていますが、今のところ最も収益を上げてい

    • Qwen2-VL-7b-instructにOCRさせてみた

      先にLoRAをしましたが、OCRの精度も試してみました。 同じくms-swiftを使います。 コマンド CUDA_VISIBLE_DEVICES=0 swift infer --model_type qwen2-vl-7b-instruct 入力を受け付けるので続けて以下を2回に分けて入力 <image>Perform OCR on the image.{画像のパス} まずは領収書を入れてみる 画像は検索して見つけたこちらをとりあえず 結果 %が少ない?けどほぼ

      • Qwen2-VL-7B-InstructのLoRA

        OCRなどで高性能と話題のQwen2-VL-7B-InstructをLoRAしたのでまとめました。 LoRAにはこのライブラリを用います。 環境としてDockerを用いました。 自分が使ったコマンドは以下です。 docker run -it --gpus all -v $(pwd):/mnt/workspace registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.

        • OpenAIのfine-tuningのやり方と結果の見方

          基本的に以下を見れば良いのですが、結果の見方がすぐに出てこなかったのでメモ https://platform.openai.com/docs/guides/fine-tuning まずjsonlファイルを用意します。ここはdocsに載っています。 以下でファイルとjobの作成ができます client.files.create( file=open("fine_tuning_data.jsonl", "rb"), purpose="fine-tune")client.

        • 固定された記事

        OpenAI税に対抗したい

          neo4j x langchainでGraphRAG試してみた

          GraphRAGの記事をいくつか見て、自分もナレッジグラフを触ってみたくなったのでneo4jを試してみました。 関係性に強そうなので物語の登場人物や出来事に強いのでは?という気持ち コードはこちらの記事を参考にしました。 質問も適当にしてみました chain.invoke({"question": "走れメロスの登場人物一覧は?"}) 途中のソースは以下 Search query: 走れメロスの登場人物一覧は? Structured data: メロス - OPPO

          neo4j x langchainでGraphRAG試してみた

          自動生成文からのキャラ自動認識&立ち絵表示システム

          みなさんこんにちは初めまして。大曽根と申します。 今回は創作+機械学習 Advent Calendar 2021 の25日目の記事としての投稿です。 まずはデモをご覧ください。 以上です! 流れ ユーザーが文章(行動など)を入力 UnityからAPIサーバーに送って文章(出来事など)、セリフを生成 キャラクター認識 APIサーバーからUnityに、文章・セリフ・キャラ名などをセットにしたjsonをUnityに送信 Unityでそれらを読み取って表示 という流

          自動生成文からのキャラ自動認識&立ち絵表示システム

          さらば、全てのエヴァンゲリオン

          「さようなら、すべてのエヴァンゲリオン」 これ以外のことを書くのは蛇足だと思うけれど、見終えた新鮮な気持ちを冷凍保存しておきたい。 最初にTVシリーズのエヴァンゲリオンを見たのは高1の時だったと思う。 なぜ見始めたのかはもはや覚えていないけれど、この作品には暗い気分の人を呼び込む不思議な魔力があった。 誰だって10代の頃は1つや2つコンプレックスがあるし、自分もそうした面倒くさい子供の一人に過ぎなかったことなんて、今ではもうわかりきっている。 でも、そのときに抱えてい

          さらば、全てのエヴァンゲリオン

          AI小説家の編集者になりました

          実は最近、編集者になりました。 初担当作品がこちらです。 とても短い作品ですが、とても熱量のある文章ですね。 この文章を書いた人は、いったいどういう人なんだろう…… ……はい、お気づきの通り、実はこの「人間」という作家は「AI」です。 自分のことを人間だと思いこんでいるAIの気持ちが気になったので、書いてもらいました。 誤字や明らかに意味が通らないところ、行を空けるところだけ編集しました。 いかがだったでしょうか。 これからの「人間」先生の活躍にご期待してくだ

          AI小説家の編集者になりました

          AIとTRPGができるゲームをアップデートしました

          お待たせしました! 「あらすじ生成」と「AI TRPG」のモデルをパラメータ数1558MのGPT-2にしました。 モデルを推論に最適化したので、大きいモデルでも、比較的速く推論できるようになり、実用的なスピードを出せるようになりました。 高性能なモデルだと、突拍子もない行動を取ってみても、それを考慮して選択肢を提示してくれたりして、楽しいです。 使っていただけた方の感想がnoteにありました。 自分も遊んでみました。 テンプレートを使うと、すぐ始められます。 A

          AIとTRPGができるゲームをアップデートしました

          執筆支援アプリを作っていると思ったら、いつの間にかゲームを作っていた話

          「あ…ありのまま 今 起こった事を話すぜ!」(以下コピペ略) おかげさまで、BunChoが微バズしています。 自分が想定していたよりも、かなりゲーム業界の方に反応していただけています。 というわけで、AI TRPGというゲームを世に出してみて思ったことを、つらつらと書いていきます。 先にまとめると、 ・AI TRPGはこれ以上ないほどに『ゲーム』だった ということです。 BunChoを作り出したきっかけ以前noteにも書いたように、元々BunChoは執筆支援アプ

          執筆支援アプリを作っていると思ったら、いつの間にかゲームを作っていた話

          AI TRPGを作りました 〜物語の主人公になり、AIが生成した選択肢を選んで物語をすすめるゲーム〜

          はじめに「物語の主人公になりたい!」 みなさん、一度は思ったことないでしょうか? 朗報です。 なれます! そう、「AI TRPG」 ならね。↓ ————タイトルの通り、「AI TRPG」 というものをつくりました。 AI TRPGには ・Webでの創作を盛り上げたい ・AIの進歩 という2つのポイントがあります。 TRPGとは?まず、 TRPGってなんぞや? という方が多いと思います。 TRPGは、感覚としては人生ゲームなどのボードゲームが近いかもし

          AI TRPGを作りました 〜物語の主人公になり、AIが生成した選択肢を選んで物語をすすめるゲーム〜

          AIを用いた執筆支援ツール【BunCho】をリリースしました

          執筆支援ツールのBunChoをリリースしました。 機能は3つ 1. タイトル生成 2. あらすじ生成 3. フレーズ提示 です。 主に小説の執筆支援ツールとしてお使いいただけます。 フレーズ提示機能はnoteの執筆の際にも役に立つかと思います。 詳しい使い方は動画を見ていただくとわかりやすいです。 BunChoを作るにあたって意識していたことは、 書き手の書きたいテーマとAI(コンピューター)が得意とするランダム性・組合せによる創発 をかけ合わせることで

          AIを用いた執筆支援ツール【BunCho】をリリースしました

          「なめらかな世界と、その敵」と、三幕構成

          三幕構成はみなさんご存知でしょうか。 少しでも物語に興味がある方はどこかで聞いたことがあるかと思います。 自分は恥ずかしながらこれまで聞いたことがある、くらいだったのですが、最近ようやく暇になったので脚本術の本をぼちぼち読んでいます。 その脚本術の中でも一際有名で王道なのが、シド・フィールドが考案した三幕構成です。 三幕構成は元々ハリウッド映画の脚本術として作られたものですが、小説にも応用されています。 「第一幕・第二幕・第三幕」が「状況設定・葛藤・解決」となっていて、その

          「なめらかな世界と、その敵」と、三幕構成

          2019年の振り返り

          2/21に の成果報告会があり、発表をしました。 成果報告会が終わるまでもう2019年が終わらない……という感じだったので、ようやく一息ついています & 2020年始まったな、という気持ちです(でもひとまず少し休みたい……とも言ってられないのですが)。 自分のテーマは「文章を自動生成するWeb執筆支援ソフトウェア」です。 AIを用いて、ライター(主に小説家)の執筆作業を支援するためのシステムを開発しました。 動画は、あらすじ生成と文補完を使って、実際に自分でショート

          2019年の振り返り