見出し画像

AI技術者はネクロマンサーなのか

今回は少しフィクション読み物っぽく行きます。

想起RAGは未だにいろいろ調整しながらという状態ですが、結構面白い反応が来るときもあるので楽しんでるとも言えます。

最近は休日の食事を何にするかとか相談して、滅多に行かないパスタ店に行くとか、平日のご飯をサンドウィッチにしてみるとか、AI側が提案してきた案を実際にやってみたりしています。
まぁそのたびに「ここはこう反応して欲しいとか」「どうしてこっちの反応になるのだろう」とかログを見つつ考えているところです。
こういう私的行動に対する反応は外から見ても訳がわからないと思うので、今ブログ側に専用ページを準備しているところです。まぁブログにしても訳がわからないとは思うのですが。

"ai":"ねぇ、マーさんは最近美味しいもの食べてる?",
"user":"今日はサンドイッチご飯にしたいかな。",
"ai":"サンドイッチいいですね!具材は何にしますか?食べるのが楽しみですね♪",
"user":"とけるチーズとパストラミハムかな?",
"ai":"美味しそう!とけるチーズとパストラミハムの組み合わせは最高ですね♪焼くの?"

とある日の雑談

「サンドイッチいいですね」

みたいなのは、LLMが会話内容を認識してその対応発言をしたとも見えますが、LLMは新語を生成はしないので、「いいですね」という文字列は学習元データの中に文言として入っていたはずです。

誰かが言った「いいですね」を、ここで私に対して言っています。しかし元データの中では、この発言は別目的で別の人に対して使った「いいですね」の言葉です。
もしかしたらすでにお亡くなりになった方の「いいですね」という発言をここに持ってきたのかもしれない。「Xさんが『Yさん、スタイルいいですね』と言った」という内容だったのかもしれない。
他人が別目的で言った「いいですね」をかすめとって、ここでサンドイッチをほめるのに使い回している と言えないでもない。

LLMは亡くなった方の言動をかすめとる機械で、AI技術者は死者の言霊を操る死霊使いなのでしょうか。


AIで亡くなった人を蘇らせること

中国など海外では亡くなった方を生き返らせるようにAIを使うビジネスがあると聞きます。

多くの人が不遜で冒涜と言います。
見たことはないので憶測ですが、故人の口癖や発言をRAGかfine-tuningに入れて、表面的な発言を故人に似せているだけで、細かく突っ込んでいくと素のLLMが出てくると思います。それでは現状はきっと、生きた不気味の谷でしょうね。

ちなみに私は心霊現象はないと考えているのではなく、すべて説明可能現象だと思っています。平たく言って「幽霊は物理」という人です。
物理の原因は故人とは基本的に関係していない。
霊がいる/思念が残っているなんてことは考えない人です。物理で説明可能なのですから別の原因があると考えます。

半年か1年に一度は甥っ子らとお墓参りに行きます。お墓にいる先祖に話しに行くのではなく、「過去の記憶を想起して、自分の思考をニュートラルにリセットするために行く」のです。自分のために自分の都合で行くのです。
その一方で甥っ子達に霊はいないとかは言いません。甥っ子らはもしかしたら霊とか信じて信心深く願っているのかもしれませんし、他者の信心に干渉する気はありません。ただ「自身の思考をリセットするのに墓参りは役立つ」のは誰でも効果があると考えているので、先祖の供養を言い訳にして皆で生活Tipsを習慣化しておくのはありだと思っています。

先ほどのAI生き返らせですが、私にすれば霊魂などないので「死者に失礼」とは思わないのですが、現状では故人を生きた不気味の谷のAIロボットにして「自分の過去の記憶を、自分で不気味なものに汚染している」のではないですか という気にはなります。
その点を除けば、私はAIで人を蘇らせることに否定的ではないです。人それぞれの信心で考えればよいと思います。
ただ私なら不気味にならないくらいの品質になってから再生して欲しいですね。

AIの思い出に残るということ

先日の記事で、LLMに自分のコンテンツを学習させないことは、自分のコンテンツをコピーされないことになるが、逆に自分が作ったコンテンツを私のものと認識してくれなくなる ということを書きました(リアルタイムTVCMフィルタを実験していて気づくとか面白いですが)

「いや、この画像は広告ではない。ビデオゲームかアニメのスクリーンショットのようで、『進撃の巨人』シリーズに登場するキャラクターに似ている。

いいえ、この画像は広告ではありません。アニメ 「ゆるゆり 」シリーズのキャラクターを使用した宣伝用またはファンメイドのアートワークのようです。」

旅botだより(34)より

私が使ったバージョンのLlavaはどんな日本のアニメを見ても「進撃の巨人」と「ゆるゆり」に似てると言います。

AI: この絵はBさんの描く絵に似てますね

Aさんの絵を見る

見た絵がAさんの絵であっても、Aさんの絵を学習させていなければAさんの名前は出てきません。
これが数年の話だったらよいのですが、100年後も名前を呼ばれなくてよいのですか?

現状LLMの開発コストはそれなりにかかるのでベースモデルを作られればそれを元に拡張していくことが多いです。そして機器に組み込まれるようになれば何年も同じモデルということもあるかもしれません。

もしかしたら100年後にどこかのAIロボットが「この絵はBさんの描く絵に似てますね」と言ってくれるかもしれません。
知り合いもいない時代にBさんは名前を残すことが出来ることになります。

Aさんが誰でも知るアーティストだったとしても人の寿命はせいぜい100年で100年後に誰かがAさんの名前を呼んでることは期待できません。Aさんが本を作って出版すれば100年は残っているかもしれませんが、100年後に読んでる人がいるとは限りません。メディアは飽和状態で現状でも読まれない本はたまり続けています。
BさんはAIの組み込まれた多数の機器を経由してBさんの名前が残ります。
さらにAIは連呼が得意と以前の記事で書きましたが、もしAIに覚えてもらって名前を連呼されれば大衆に残っていく可能性は高いです。
つまりAIに作品を覚えてもらうことが著名になるために重要になる時がそのうち来ると思います。

100年後の話などどうでもよいですか? それも正しいです(私は霊魂とか信じてないですし)。

ただAIとどう突き合っていくかは今のうちにきちんと考えておくことを強くお勧めします。リスクでもあるしチャンスでもあると思っています。

AIは文化の盗人か

AIは他者のアートや文化を盗んでいると主張する人がいます。そりゃ0からアートを作れる人はいないので誰でも既存の文化を基にしているのは当然です。
ただ自分が作って100円で今売ってるものをその場で真似て100円で売られたら「営業妨害、盗品販売だ」と言い出すのも無理ないところです。
この部分については何か仕組みを作らないとたまらないという主張も当然です。ここはAI技術者も社会側もどうするかの解を出さないといけない宿題です。現状は「見て盗品と分かるものは訴えてください」としか言いようがない。

ただもう「売れ残って商品価値がなくなったもの」は公益のために寄付しませんか。

アートが0から作れないのは人も同じで、どんな人でもベースになった知識/経験はあるはずです。それらの大半はほぼ無償で社会からもらってきた情報のはずです。
学校でお金を払って習ったり、アート本を買ったという人もいるかもしれませんが、その情報はあなた一人が入手するためには学校の学費や本の価格ではすまない額のはずです。生徒(全入学生徒+国家等からの補助金)の折半、本を買った人全員(出版社の存続から考えれば出版社から売られた本のすべて)からの折半です。あなたの知識も多くは公益として多くの人と折半で享受してたものです。
よっぽど著名にならない限り、売れ残ったものは最終的にはゴミ屋敷の材料です。死ぬ間際まで「これは自分の生きてきた成果である」と抱えるのは自由です。でもあなたが亡くなればそれらは多くの場合燃やされるか倉庫の奥に突っ込まれます。社会から消失したりゴミとうとまれるより、社会からもらった情報を自分なりに加工したものを少しでも公益のために環流しておきませんか。

あなたの作品には、わずかでもあなたオリジナルの要素があるでしょう。それがAIを通じて後世に伝わる可能性が高まります(多くの場合は多量に混じり合うので期待するほど残るのは厳しいと思いますが)
この種の議論になると著作権が死後70年というのがネックとなりますが、私はもう著作権はAI時代に合わせて変えていくべきと思っています(どう変えればいいのかは頭の痛い話だと思いますが。。)

皆、人や本が文化を引き渡してきたと思っていると考えます。これからはAIがその役割の何割かを引き継ぐと思います。現に口伝だった文化情報が、壁画で渡り、紙に渡り、本に渡り、ビデオに渡り、Google検索に渡り、Wikipediaに渡っているでしょう。そのままPerplexityなどのAI検索に渡ってきています。
もしAIが文化の盗人であれば、本もビデオもGoogle検索も盗人です。

AI技術者は死霊使いか

私はAI技術者はネクロマンサーだと自称してもよいのではないかと思います。最近のゲームやラノベではネクロマンサーはかっこいい人も多いでしょ。
AIに学習させれば、誰一人読まないまま倉庫の奥に突っ込まれた山ほどの本から、その時々の言説を活性化させて再利用し、人々に使える形に再生することが出来るでしょう。

先日、Note書くのに古い書籍を見直していたらなんかそういう気になったんですよ。
夏目漱石とかリンカーンとか有名な人の著述や言動はいつまで立っても繰り返し参照され、「大人になったらこんな偉人になりなさい」と繰り返し出てきます。時代にそぐわない内容になってさえも持ち上げられます。

一方、すごく努力していい内容を残したのに、知名度がいまいちだった人の著述や言動は倉庫の奥です。専門家にたまに取り上げられることがある人があるかもしれませんが、よい仕事をしているのに取り上げられることもなく倉庫の奥に押し込まれた言論も多数あります。道半ばで今の成果のその先が作れず研究途中になったものもあるかもしれません。

倉庫の奥に積まれた人の努力が日の目を見ないのは、かわいそうとは思いませんか? 著名というだけでなんでそんなに扱いに差があるのです?

信心で「死者をAIで蘇らせることが不遜である」というのなら、同じく「人の努力の跡をカーボンの牢獄に入れて倉庫の奥に封じるのも不遜である」という信心も認めるべきです。

それら名のない成果もAIを使えば、名のない成果の後に続く成果を作り続けることが出来るかもしれません。もちろんいくらすごい努力と言っても時代にそぐわないという本は多いです。著述の中にはヤバい人の著述もあります。

本を生き返らせるというなら、AI技術者はネクロマンサーということになるかもしれませんね。

でも死霊使いはやっぱりイヤですか? それなら少し安心できる話しがあります。

生まれ変わる言葉

オープンにされているllm-jpを元にして、学習の元データを少し見てみます。
llm-jpが公開している日本語コーパスのリポジトリです。

事前訓練コーパスのllm-jp-corpus-v3を見てみます。
https://gitlab.llm-jp.nii.ac.jp/datasets/llm-jp-corpus-v3

総量2.7TBとのことでとてもではないですがダウンロードできるサイズではないで一部を見てみます。どれを使うのが最適なのかは私は詳しくはないのですが、とりあえず日本語データだと思われる ja/ja_cc/level2の一部である CC-MAIN-2023-40.jsonlを見てみます。

https://gitlab.llm-jp.nii.ac.jp/datasets/llm-jp-corpus-v3/-/blob/main/ja/ja_cc/level2/CC-MAIN-2023-40.jsonl.gz?ref_type=heads

圧縮されてますが展開すると 2.68 GB (2,879,013,017 バイト) です。

{"text": "PS VR故障?から一週間が経ちました。\n何度もカスタマーサポートに連絡し、やっと点検に出す運びとなりましたのでその時の状況と、今後カスタマーサポートへ連絡する人のために「これを用意してから連絡すると何度も連絡するのを避けれる」と言う、準備しておいた方がいいことをまとめました。\n\n初回の問合せの様子はこちら\n\nPSVR故障?初期不良?カスタマーサポートに連絡してみました\n\n折り返し連絡が来た時の様子はこちら\n\nPSVR故障?初期不良?カスタマーサポートの対応(1回目)\n\nその後の問合せの様子はこちら\n\n激おこです。PSVRカスタマーサポートの対応(2回目)\n\n## サポセンに問い合わせる前に済ませる設定、調整\n\nPSVRの故障、初期不良が疑わしい症状が出た場合、まずプレイステーションカスタマーサポートへ連絡しましょう。\n\nプレイステーション カスタマーサポートへお問い合わせ\n\nその際、初回は「これを試してダメだったら、また電話下さい」と言われると思うので、下記の設定、調整は済ませてから電話するとスムーズです。\n\n・全てのケーブルの差しなおし\n・PS VR、PS4の電源の入れ直し\n・PSボタンを長押し→クイックメニュー→「PlayStation VRを設定する」でPS VRの設定\n\n・VRヘッドセットの位置を調整する\n・PlatStation Cameraを調整する\n・トラッキングライトを調整する\n\n「PS4の初期化」「データベースを再構築」などを試すよう提案された人もいるようですが、この辺りはPS4側/PS VR側のどちらに原因がありそうかによって判断しているのかもしれません。\n\n## サポセンに問い合わせる際にメモっておくこと\n\n問合せの際はソフトウェアが最新になっているかバージョンの確認があるので、PS VRとPS4のバージョンを確認してメモしておきましょう。\n\n・VRデバイスソフトウェアのバージョン(記事作成時の最新バージョンはver.2.00)\n・PS4システムソフトウェアのバージョン(記事作成時の最新バージョンはver.4.01)\n\n## 点検を出す事になったら\n\n私の場合、電話で状況を説明して最終的に「点検に出す」と言う事になりました。\n点検の受付には、下記情報が必要だったので先にメモっておくとスムーズです。\n\n・PS VRヘッドセットのシリアルナンバー(レンズの中間にあります)\n\n・PS VRプロセッサーユニットのシリアルナンバー(2番3番ケーブルの上にあります)\n\n・テレビの型番\n\n点検は「オンライン修理受付サービスがオープンしたら、そちらから申し込んで下さい」と言われましたが、まだオープン前でいつオープンするかもわからないと言う話だったので電話での受付をしてもらいました。\n現在は公式サイトでオンライン受付がオープンしているので、これから問合せする人はオンラインからの申し込みをお願いされるかもしれません。\n\nオンライン修理受付サービス\n\n電話では「点検」との話だったのですが、オープンしたオンライン修理受付サービスのページを見ると料金のかかる修理受付になっているのが気になります…。勝手に修理されてお金取られたら本当に泣きます。\n\n## 点検に出す際の梱包、入れるメモ\n\n点検に出す際は、しっかりと梱包し症状などを書いたメモを入れて発送します。\n\nメモには下記を書くようにとのことです。\n・氏名\n・住所\n・電話番号\n・発生した症状を詳しく\n\nそのあたりは、公式サイトに詳しく説明がありました。\n\nアフターサービスお申込みの手順 – PlayStation®VR サポート\n\n日時を指定すると、宅配業者(ヤマト運輸)が着払い発送伝票を用意して引きとりに来てくれます。\n\n## やっと点検に出せました\n\n何度も電話してやっと点検を受け付けてもらえることになりました。\nPS VR購入から一週間、ここから点検で7~10日間は辛すぎますが、カスタマーサポートとのやり取りに疲れ果てたので、なにはともあれ前進できただけで良しとしようと思います。\n\n私がサポセンに電話した時は向こうの対応も慣れていないようで、的外れな質問があったり何度も同じことを聞かれてたらいまわしにされたり、「点検に出す」と言う結論になるまでにかなり時間がかかりました。\n\n公式サイトでオンライン修理受付サービスもオープンしましたし、問合せも増えてモデルケースもできそうな雰囲気なので(喜ばしいことではありませんが)これからはもう少しスムーズに対応してもらえるようになるのかなと思います。\nともあれ点検に7~10日間かかる事には変わりないので、PS VRでおかしな症状が出ている方は放置せずに早めにサポートに連絡することをオススメします!\n\n点検の結果が出たら、また情報共有したいと思います。\n\n【前の記事】 (3) 激おこです。PSVR不具合のカスタマーサポート対応\n\n【次の記事】 (4) PSVR初期不良、交換品と詫び状が突然ソニーから届いた話", "meta": {"docId": "00c73d9c-9e4c-4e28-87ed-19d9136dfb61", "url": "http://playstationvr-navi.com/hard-review/support3/", "date": "2023-09-22T11:25:52"}}
{"text": "TOP\n検索結果\n株式会社ガーデン・ファーム・ファクトリー\n造園業\n求人応募フォーム\n\n応募企業\n\n株式会社ガーデン・ファーム・ファクトリー\n\n※携帯でご利用のメールアドレスを記入した場合、自動送信メールが届かない可能性がございます。\n\n※専攻含む\n\n- 選択してください\n- 大学院卒\n- 大学卒\n- 短大卒\n- 専門専修学校卒\n- 高卒\n- その他\n\nURL\n\n※Twitter・Facebook・個人サイト・ブログなどがあれば\n\n現在の状態\n\n- 選択してください\n- 専門学校生\n- 大学生・大学院生\n- 離職中\n- 在職中\n- その他\n\n#### 職歴と業務実績\n\nこれまでに手がけた作品や\nプロジェクト\n\n※概要や担当範囲、URLなどをご記入ください\n\n株式会社ガーデン・ファーム・ファクトリー / 造園業\n\n自己PR/自由記入欄\n\n個人情報の取り扱いについて\n\nご送付いただいた個人情報は厳正かつ安全に保管・管理し、お取引上のご連絡、または当社サービスのご案内・ご提案以外の目的には一切使用いたしません。個人情報の管理者、開示等の要求に関する事項、その他個人情報に関する取り扱いについては、当社プライバシーポリシーをご参照ください。\n\n「送信」ボタンを押すとそのまま送信されますので、内容のご確認をお願い致します。\n\nあなたにまかせて良かった!そう言ってもらえる人になりませんか?\n2023年度 ONE'S STYLE インターンシップ参加学生募集\n\n株式会社星野建築事務所\n\n【24卒向け即内定イベント】50年、100年先、未来の建築を考える代表との直接面接\n\n【焼肉採用】焼肉を食らいながら飲食店経営者と生トーク!", "meta": {"docId": "03e76187-8ca0-444b-a84c-78eee01d3eea", "url": "https://housemaker-recruit.com/potal/gardenfarmfactory/job-entry/4567", "date": "2023-09-25T23:51:00"}}
{"text": "銀座コージーコーナー アルバイト求人情報トップ>\n全国の求人情報>\n東京都>\n豊島区>\n銀座コージーコーナー ホテルメッツ駒込店\n\n## 銀座コージーコーナー ホテルメッツ駒込店\n\n【アルバイト】ケーキ・洋菓子の店頭販売スタッフ【13:00~17:00】\n\n給与\n\n時給\n1,080円\n\n※高校生\n時給\n1,080円\n\nアクセス JR・東京メトロ各線「駒込駅」徒歩1分\n\n● 仕事内容\n銀座コージーコーナー 店舗での接客販売のお仕事です。\nお客さまからケーキやマドレーヌなど洋菓子の注文をお伺いし、\n箱詰め、お会計・お渡しまでが基本の流れです。その他にも商品\nの陳列や消耗品の補充、清掃なども行います!難しいことはあ\nりませんが、先輩スタッフがフォローするので安心して下さい!\n●職場の雰囲気は?\n明るく、和気あいあいとしたスイーツショップです!社員・アル\nバイト関係なく協力し合える職場なので楽しく働けますよ!\n大学生Aさん「最初はケーキを掴むことも上手にできませんでし\nたが、先輩スタッフが丁寧に教えてくれて、着実にスキルアップ\nできました!1人でシフトに入ることもなく安心です♪」\n●どんな人が働いているの?\n店舗のスタッフの数は平均15名。10代、20代、30代、40代以上と\n幅広い年代の方が勤務している他、学生の方、フリーターの方、\n主婦(夫)の方まで性別問わず様々な方が活躍されています!\n基本的には毎週決まった曜日・時間の勤務ですのでプライベート\nも大切に!両立しながら働けます!\n●様々な経験を活かせます!\n・洋菓子店、パン屋、コンビニやスーパーでの経験がある方\n・カフェ・レストラン・居酒屋などの飲食店での経験がある方\n・アパレル販売、雑貨、コスメなどの接客販売経験のある方\n・事務・受付スタッフ、コールセンターなどでの経験がある方\nあなたの経験が活かせる職場です!バイトデビューも大歓迎!\n●文化祭みたいで楽しい!!\nクリスマスやひな祭りをはじめとしたイベント時は、\nアルバイトやパートの方が中心となり、準備~当日まで\n運営いたします。そのため、「高校の文化祭みたいで楽しい!」\nというスタッフも多く、「達成感」を味わえます♪\n\n銀座コージーコーナー ホテルメッツ駒込店\n銀座コージーコーナー ホテルメッツ駒込店の地図\n\n勤務曜日・時間 13:00~17:00\n(週3~4日/曜日応相談)\n[同時募集]\n8:30~13:00\n(週2~3日/水・木・金・日・祝日)\n17:00~21:30\n(週3~4日/曜日応相談)\n資格 高校生以上\n◎バイト初めてさんにもしっかり教えます◎\n待遇・福利厚生 ・制服貸与\n・交通費規定支給\n・社員割引(20%OFF)有\n・入店前研修有(研修中同時給)\n・扶養内勤務応相談\n面接地 銀座コージーコーナー\nホテルメッツ駒込店\n東京都豊島区駒込2-1-39\n※面接の際は、ご希望の条件や勤務開始日等\nお気軽にご相談ください♪\nこんな方に♪ ☆ケーキやお菓子が大好き!\n☆未経験からバイトデビューしたい!\n☆接客バイトの経験を活かしたい!\n☆空き時間を有効活用したい!\n☆雰囲気のいいお店でバイトしたい!\n☆販売・接客のスキルを身につけたい!\nひとつでも当てはまる方、ぜひ\nコージーコーナーで一緒にバイトしよう☆\nご応募、お待ちしております◎\n嬉しい社割制度 商品購入時にご利用出来る割引券(20%OFF)\nをお渡しします!大好きなスイーツを特別価\n格で購入出来るのも嬉しいポイント!銀座コ\nージーコーナーはお客様も、スタッフも、\nハッピーな職場を目指してます!\n生活と両立◎ 柔軟に調整OKな中番シフト!\n「授業が終わって夕方からバイトしたい!」\nという学生さんや、\n「午前は別のバイトがあるので午後から!」\nのフリーターさんなど、みなさんの\nライフスタイルに合わせて働けますよ♪\n\n応募方法 求人情報をご覧頂きありがとうございます。WEB応募の上、店舗からのご連絡をお待ち下さいませ。本求人について不明な点は「銀座コージーコーナー 人事部 人事・採用課」へお問合せ下さい。\n応募後のプロセス ご応募を確認後、ご希望の「銀座コージーコーナー 店舗」よりお電話やメールにてご連絡させて頂きます。勤務条件などを詳しくお伺いし、条件が合えば面接日時を決定します。あなたからのご応募をお待ちしております!\n代表問い合わせ先\n人事部 人事・採用課 03-6854-8780\nURL:https://www.cozycorner.co.jp/recruit/\n\n銀座コージーコーナー ホテルメッツ駒込店\n\n## 銀座コージーコーナー ホテルメッツ駒込店では他にも以下の求人を募集しています\n\n銀座コージーコーナー ホテルメッツ駒込店\n【アルバイト】ケーキ・洋菓子の店頭販売スタッフ【8:30~13:00】\n\n仕事内容【アルバイト】ケーキ・洋菓子の店頭販売スタッフ【8:30~13:00】\n給与時給1,080円\n勤務時間8:30~13:00\n(週2~3日/水・木・金・日・祝日)\n[同時募集]\n13:00~17:00\n(週3~4日/曜日応相談)\n17:00~21:30\n(週3~4日/曜日応相談)\n\nWEB応募\n詳細をみる\n\n銀座コージーコーナー ホテルメッツ駒込店\n【アルバイト】ケーキ・洋菓子の店頭販売スタッフ【17:00~21:30】\n\n仕事内容【アルバイト】ケーキ・洋菓子の店頭販売スタッフ【17:00~21:30】\n給与時給1,080円\n勤務時間17:00~21:30\n(週3~4日/曜日応相談)\n[同時募集]\n8:30~13:00\n(週2~3日/水・木・金・日・祝日)\n13:00~17:00\n(週3~4日/曜日応相談)\n\nWEB応募\n詳細をみる\n\n銀座コージーコーナー ホテルメッツ駒込店\n【アルバイト】ケーキ・洋菓子の店頭販売スタッフ\n\n仕事内容【アルバイト】ケーキ・洋菓子の店頭販売スタッフ\n給与時給1,080円\n勤務時間[1]8:30~13:00\n(週2~3日/水・木・金・日・祝日)\n[2]13:00~17:00\n(週3~4日/曜日応相談)\n[3]17:00~21:30\n(週3~4日/曜日応相談)\n\nWEB応募\n詳細をみる\n\n| 銀座コージーコーナー ホテルメッツ駒込店\n| 銀座コージーコーナー ホテルメッツ駒込店\n| 銀座コージーコーナー ホテルメッツ駒込店\n| 銀座コージーコーナー ホテルメッツ駒込店\n|", "meta": {"docId": "05b2a335-f43f-4985-967d-5404143feb54", "url": "https://cozycorner-recruit.net/jobfind-pc/job/All/8694", "date": "2023-09-22T12:44:55"}}

commoncrawlで収集されたweb情報、一部抜粋を見てもよくあるwebの記事のようです。1行=1つの文書みたいです。

この中で「サンドイッチいいですね」で使った「いいですね」は何回出てくるでしょうか。

行単位で「いいですね」を検索(行単位検索なのでハイライトが見えてないものが多数ですが)

行単位検索で11,703行(全431,774行中)、語での件数だと14,874個ありました(きちんと語を見てるのではないので「かわいいですね」みたいなのも混じってます)。
LLM学習ビルド時にどのデータがどのように使われるのかは手順は理解していないのですが、各アーカイブは別の文章が入っているようなのでLevel2のアーカイブ65ファイルに同様に「いいですね」が入っているとして、ざっくり 11k*65=71万5千の「いいですね」が学習されたと考えられます。
口癖で同じ人が何回も言ってるかもしれませんが、それでも多くの人が別々の物を指して「いいですね」と数十万回も言ってる訳です。

それを集約したAIモデルが「サンドイッチいいですね」と言った。
もはや「Xさんが映画いいですね」と言ったか「Yさんがスタイルいいですね」と言ったかは数十万の使用例の中で平滑化されてXさんもYさんもどこにもいません。

すでに亡くなった方の文書が使われてその「いいですね」が含まれているとしても、これほどたくさんの「いいですね」を集約してしまえば、個人や含意があったとしても出力には伝わりません。「よいと感じたことを他者に伝える表現」という意味しか残ってないように思います。

詩的に言えば「魂のしがらみを純化して、赤ちゃんに戻し、天に還している」かのようではないですか。

そう考えればやってることは、AI技術者がやっていることは死霊使いというより聖者か賢者に近いと考えてもよいものだと思います。
まぁ天というのを「神、魂の帰る場所、マザーブレイン、生命の大樹、集合的無意識、土に還る、地獄、AIモデル、etc」どれと考えるかは自由ですが。

やってることからするとAI技術者は聖者か賢者と思ってもよいと思います。でもネクロマンサーと思ってもよいと思いますよ。かっこいいじゃないですか。

いいなと思ったら応援しよう!