大曽根と申します。AIの1人会社をやっています。従業員はいないので、実質フリーランスのAIエンジニアみたいな身分です。 1年くらいのんびりやっていたのですが、AI業界の搾取レイヤー構造が意外と知られていないことに最近気がついたので、備忘録がてら記事にまとめることにしました。 AI業界の人にとっては当たり前な内容だと思うので読まなくて大丈夫です。 a16zのブログより、AI業界のレイヤーは以下のようになっています。 ブログでも書かれていますが、今のところ最も収益を上げてい
先にLoRAをしましたが、OCRの精度も試してみました。 同じくms-swiftを使います。 コマンド CUDA_VISIBLE_DEVICES=0 swift infer --model_type qwen2-vl-7b-instruct 入力を受け付けるので続けて以下を2回に分けて入力 <image>Perform OCR on the image.{画像のパス} まずは領収書を入れてみる 画像は検索して見つけたこちらをとりあえず 結果 %が少ない?けどほぼ
OCRなどで高性能と話題のQwen2-VL-7B-InstructをLoRAしたのでまとめました。 LoRAにはこのライブラリを用います。 環境としてDockerを用いました。 自分が使ったコマンドは以下です。 docker run -it --gpus all -v $(pwd):/mnt/workspace registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.
基本的に以下を見れば良いのですが、結果の見方がすぐに出てこなかったのでメモ https://platform.openai.com/docs/guides/fine-tuning まずjsonlファイルを用意します。ここはdocsに載っています。 以下でファイルとjobの作成ができます client.files.create( file=open("fine_tuning_data.jsonl", "rb"), purpose="fine-tune")client.
GraphRAGの記事をいくつか見て、自分もナレッジグラフを触ってみたくなったのでneo4jを試してみました。 関係性に強そうなので物語の登場人物や出来事に強いのでは?という気持ち コードはこちらの記事を参考にしました。 質問も適当にしてみました chain.invoke({"question": "走れメロスの登場人物一覧は?"}) 途中のソースは以下 Search query: 走れメロスの登場人物一覧は? Structured data: メロス - OPPO
みなさんこんにちは初めまして。大曽根と申します。 今回は創作+機械学習 Advent Calendar 2021 の25日目の記事としての投稿です。 まずはデモをご覧ください。 以上です! 流れ ユーザーが文章(行動など)を入力 UnityからAPIサーバーに送って文章(出来事など)、セリフを生成 キャラクター認識 APIサーバーからUnityに、文章・セリフ・キャラ名などをセットにしたjsonをUnityに送信 Unityでそれらを読み取って表示 という流
「さようなら、すべてのエヴァンゲリオン」 これ以外のことを書くのは蛇足だと思うけれど、見終えた新鮮な気持ちを冷凍保存しておきたい。 最初にTVシリーズのエヴァンゲリオンを見たのは高1の時だったと思う。 なぜ見始めたのかはもはや覚えていないけれど、この作品には暗い気分の人を呼び込む不思議な魔力があった。 誰だって10代の頃は1つや2つコンプレックスがあるし、自分もそうした面倒くさい子供の一人に過ぎなかったことなんて、今ではもうわかりきっている。 でも、そのときに抱えてい
実は最近、編集者になりました。 初担当作品がこちらです。 とても短い作品ですが、とても熱量のある文章ですね。 この文章を書いた人は、いったいどういう人なんだろう…… ……はい、お気づきの通り、実はこの「人間」という作家は「AI」です。 自分のことを人間だと思いこんでいるAIの気持ちが気になったので、書いてもらいました。 誤字や明らかに意味が通らないところ、行を空けるところだけ編集しました。 いかがだったでしょうか。 これからの「人間」先生の活躍にご期待してくだ
お待たせしました! 「あらすじ生成」と「AI TRPG」のモデルをパラメータ数1558MのGPT-2にしました。 モデルを推論に最適化したので、大きいモデルでも、比較的速く推論できるようになり、実用的なスピードを出せるようになりました。 高性能なモデルだと、突拍子もない行動を取ってみても、それを考慮して選択肢を提示してくれたりして、楽しいです。 使っていただけた方の感想がnoteにありました。 自分も遊んでみました。 テンプレートを使うと、すぐ始められます。 A
「あ…ありのまま 今 起こった事を話すぜ!」(以下コピペ略) おかげさまで、BunChoが微バズしています。 自分が想定していたよりも、かなりゲーム業界の方に反応していただけています。 というわけで、AI TRPGというゲームを世に出してみて思ったことを、つらつらと書いていきます。 先にまとめると、 ・AI TRPGはこれ以上ないほどに『ゲーム』だった ということです。 BunChoを作り出したきっかけ以前noteにも書いたように、元々BunChoは執筆支援アプ
はじめに「物語の主人公になりたい!」 みなさん、一度は思ったことないでしょうか? 朗報です。 なれます! そう、「AI TRPG」 ならね。↓ ————タイトルの通り、「AI TRPG」 というものをつくりました。 AI TRPGには ・Webでの創作を盛り上げたい ・AIの進歩 という2つのポイントがあります。 TRPGとは?まず、 TRPGってなんぞや? という方が多いと思います。 TRPGは、感覚としては人生ゲームなどのボードゲームが近いかもし
執筆支援ツールのBunChoをリリースしました。 機能は3つ 1. タイトル生成 2. あらすじ生成 3. フレーズ提示 です。 主に小説の執筆支援ツールとしてお使いいただけます。 フレーズ提示機能はnoteの執筆の際にも役に立つかと思います。 詳しい使い方は動画を見ていただくとわかりやすいです。 BunChoを作るにあたって意識していたことは、 書き手の書きたいテーマとAI(コンピューター)が得意とするランダム性・組合せによる創発 をかけ合わせることで
三幕構成はみなさんご存知でしょうか。 少しでも物語に興味がある方はどこかで聞いたことがあるかと思います。 自分は恥ずかしながらこれまで聞いたことがある、くらいだったのですが、最近ようやく暇になったので脚本術の本をぼちぼち読んでいます。 その脚本術の中でも一際有名で王道なのが、シド・フィールドが考案した三幕構成です。 三幕構成は元々ハリウッド映画の脚本術として作られたものですが、小説にも応用されています。 「第一幕・第二幕・第三幕」が「状況設定・葛藤・解決」となっていて、その
2/21に の成果報告会があり、発表をしました。 成果報告会が終わるまでもう2019年が終わらない……という感じだったので、ようやく一息ついています & 2020年始まったな、という気持ちです(でもひとまず少し休みたい……とも言ってられないのですが)。 自分のテーマは「文章を自動生成するWeb執筆支援ソフトウェア」です。 AIを用いて、ライター(主に小説家)の執筆作業を支援するためのシステムを開発しました。 動画は、あらすじ生成と文補完を使って、実際に自分でショート