
[03/09~03/15] LLM Weekly News
今回も社内で話題になったLLMに関するニュースをご紹介します。
Claude 3「Haiku」、EU で AI 規制法案の可決など、今週もたくさんのニュースがありました!
それでは今週のニュースです!
News
OpenAIにより、Figure 01は人間と完全な会話ができるように
ロボット開発をしているFigure 01 に、 OpenAI のモデルが提供されました
このロボットは、以下のような特徴を持ちます。
・遠隔操作なしの100%エンドツーエンドのシステム
・OpenAI のモデルが高レベルの視覚と言語の知性を提供
・Figure のニューラルネットワークがロボットの動作を実現
デモ動画のように、ここまで高度な認識、会話ができるというのが驚きです。
With OpenAI, Figure 01 can now have full conversations with people
— Figure (@Figure_robot) March 13, 2024
-OpenAI models provide high-level visual and language intelligence
-Figure neural networks deliver fast, low-level, dexterous robot actions
Everything in this video is a neural network: pic.twitter.com/OJzMjCv443
Anthropic Claude 3 「Haiku」をリリース
Anthropic から提供されている Claude 3 には3種類あります。
・性能が高く、最高のパフォーマンスを発揮する「Opus」
・性能の高さとスピードの速さのバランスがとれた「Sonnet」
そして今回出たのが
・最速でコンパクトなモデルで、ほぼ瞬時の応答性を実現する「 Haiku」
Claude 3 Haikuは、32Kトークン以下のプロンプトに対して毎秒21Kトークン(~30ページ)を処理し、大半の作業負荷において同クラスの製品より3倍高速です。
お値段は GPT-3.5-Turbo より安い $0.25 / $1.25(In / Out)。性能はほぼすべての指標で GPT-3.5-Turbo / Gemini 1.0 Pro より高いです。

Claude3で簡易アニメーション作成
Claude 3 でプロンプトを工夫することで、動画のようなアニメーションが作成できたようです。
Python の 「manim」というライブラリを使って、作成した模様。
Claude 3 がすごいのはもちろんですが、こういったライブラリがあることがすごいですね。
I asked Claude 3 to generate an animation for the POV of a neuron in a large neural net. it gave me this: pic.twitter.com/Ejex0sED8j
— rahul (@0interestrates) March 9, 2024
took me 15 mins to make this pic.twitter.com/B29oAXmDkj
— purav (@notpurav) March 9, 2024
プロンプト例
"create an animation of multilayer neural network feeding into a single neuron that says hello world. Use the python library manim”

AIソフトウェアエンジニア「Devin」
Devin は、独自のシェル、コードエディタ、Webブラウザを使用して、エンジニアリングタスクを実行する、自律エージェントです。
ここまで自動的に開発も行ってくれるサービスが出てきましたね。すごい。
DevinはSWE-Benchコーディングベンチマークの最先端であり、大手AI企業の実践的なエンジニアリング面接に合格し、Upworkでの実際の仕事もこなしています。
Devinは、独自のシェル、コードエディタ、ウェブブラウザを使用してエンジニアリングタスクを解決する自律エージェントです。
実際のオープンソースプロジェクトで発見されたGitHubの問題を解決するようAIに求めるSWE-Benchベンチマークで評価したところ、Devinはアシストなしで13.86%の問題を正しく解決し、アシストなしで1.96%、アシストで4.80%という従来の最先端モデルのパフォーマンスをはるかに上回りました。
Today we're excited to introduce Devin, the first AI software engineer.
— Cognition (@cognition_labs) March 12, 2024
Devin is the new state-of-the-art on the SWE-Bench coding benchmark, has successfully passed practical engineering interviews from leading AI companies, and has even completed real jobs on Upwork.
Devin is… pic.twitter.com/ladBicxEat
C向けAIアプリ Top50 by a16z
やはりChatGPTが 1 位ですが、Gemini が 2 位に食い込んでますね。
C向けのサービスだからか画像生成系が 多くランクインしてますね。

韓国で伸びているtoCサービス「ZAPPY」
正式版のリリースからわずか2ヶ月でユーザー数が約25万人に達したようです。
AIキャラクターとのチャット、AIによるメッセージ作成機能を使用してリアルの友達ともコミュニケーションが可能とのこと。
実際に触ってみたかったですが、現時点では日本からは使用できないようで断念。

新たなモーション生成AI 「QuickMasic」が登場
正面からの動画1本だけで、モーションが作成可能とのこと。
下記のような特徴を持ちます。
・1動画からモーション生成
・最大60秒まで可能
・Discordで生成
I've used a lot of AI motion capture programs, but I've never seen a program this accurate.
— KINDNICK Vtuber (@KINDNICK1) February 23, 2024
What's really interesting is that the motion is made with only one video from the front, so it's very easy to use. @QuickMagic_cn#QuickMagic #AI #MotionCapture pic.twitter.com/YqJXbwWEqK
Midjourney が同一人物作成に対応
画像生成サービスの Midjourney が同一人物の作成に対応したようです。
これによりキャラの一貫性が生まれ、クリエイティブ制作により役立ちそうです。
Midjourneyが同一人物作成に対応
— leo|AI × 動画制作 (@kaisetsuotaku) March 12, 2024
「--cref」
・ --cref {元画像URL}
・ --cw 0~100
cw 0:顔のみ統一
vw 100:顔、髪、服統一
大きな課題「キャラの一貫性」が解決されて生成AIクリエイティブが加速するっ!!
今までの苦労...#midjourney6 pic.twitter.com/w3xDjkwTAt
国内初! 生成 AI のリスクを補償する「生成 AI 専用保険」の提供開始
ついに、生成AI のリスクを補償する保険の提供が開始されました。
(前略)
…権利侵害や情報漏洩、出力結果の正確性等の様々なリスクが存在しており、導入に向けた大きな障壁となっています。

リリース内容はこちらから
EU で AI 規制法案が可決
欧州議会で、世界に先駆けて AI 規制法が可決されました。
要点は下記のとおりです。
・2026年から適用開始
・生成AIによる画像などは明示義務
・違反の場合は約56億円 or 年間売り上げの7%を支払う
・宗教や人種を用いた分類AIなども禁止対象
生成AI ユースケース
東芝テック、生成AIによるリテールプロモーション最適化ソリューション
「トランスフォーマー」モジュールをレコメンデーション・モデルそのものに組み込むことで、より高度な推論ができるようになった模様。
(前略)
…近年の人工知能と機械学習の普及により、過去の購買・行動データ等をもとに、パーソナライズされたプロモーションを実施することが、リテール分野で広く浸透してきました。しかし、これらのような従来手法では過去に購買が少ない消費者へのプロモーション最適化が困難であり、多くの場合はベストセラー、購買済み商品やその類似品、またはあえて新規性のある商品を提案するレベルにとどまっています。
このような課題に対して、東芝テックは「トランスフォーマー」モジュールをレコメンデーション・モデルそのものに組み込みました。それにより、消費者ごとの購買履歴に加えて顧客属性や商品属性、店舗属性などの情報を統合し、消費者の好む商品を推論できるようになりました。さらに、お客様×商品別の膨大な組み合わせで、クーポンを送った場合にどれだけ利益が増加/減少するのかを計算し、利益総額が最大化される組み合わせを推定できるようになりました。
不動産の物件情報登録の新スキーム AI-OCR × 生成AI
OCR の技術を使い帳票内の文章をテキスト化し、LLM を活用して必要な情報を抜き出し、整形することで業務効率化を実現。

AI-OCRによる物件情報のテキストデータ化と、生成AIによる必要となるテキストデータの抽出、要約により、入力作業の大半を自動化します。また、物件情報に必要となる地図情報も自動で取得する機能を搭載しました。
AI接客サービス「AIバイト」が全国の百貨店で勤務
Gatebox株式会社が提供するAI接客サービス「AIバイト」が、バレンタイン商戦において全国の百貨店で活躍したことが発表されました。
AI キャラクターが20店舗の催事場でチョコレート販売の接客を担当し、お客様の関心を集めました。


電通デジタル 次世代AIオウンドメディア「Owned Human™」の取り組みを開始
電通デジタルが、バーチャルヒューマンを活用した次世代AI オウンドメディアの実用化に向けた取り組みを開始。
下記のような特徴を持ちます。
・「調べて見つける」から「話してわかる」次世代の顧客体験を
・人格をもったオウンドメディアによる企業ブランディングへの貢献
・対話の可能性を引き出し、顧客とのやさしい関係を築く

「Owned Human」は、顧客とのリアルタイムな音声対話を可能とする、高度な人間性を備えたバーチャルヒューマンを配した次世代型のオウンドメディアです。顧客の問い合わせに対しスピーディーかつ適切に対応するとともにパーソナライズしたコンテンツを提供することが可能になり、企業が抱える顧客とのコミュニケーションコストやエンゲージメントの向上、パーソナライゼーションの難しさといった課題をテクノロジーの力で解決し、オウンドメディアをさらなる強力なマーケティングツールへと進化させます。
生成AI搭載 インフルエンサーマーケティングプラットフォーム「Weeva」
インフルエンサーマーケティングに関連する全てのステークホルダー「広告主」「広告代理店」「プロダクション」「インフルエンサー」4つのアカウントタイプにて検索・発注から動画公開まで一気通貫で運用できるプラットフォーム。
複数の機能で生成AI が活用されています。その中でも薬事チェック機能が、とても興味深いです。
■Ai機能による業務サポート機能 ※特許取得
1. Aiによる薬事チェック機能 (特許取得)
「Aiチェックボタン」押下後、わずか5秒でリーガルチェックが可能です。 過去NGワード8,000語を元に「NGワード抽出」「NG理由」「代替ワード」を一気にご提案いたします。
2023年10月ステルス法改正により、インフルエンサーマーケティングでもより一層強化されるのを見据え、広告主側、インフルエンサー側双方でチェック出来る機能となっています。

その他ニュース
The Pokémon Company International, Inc.が、Hugging Faceにデータセットの削除要請
ポケモン社が、Hugging Face に対して特定のデータセットの削除要請をしたとのこと。
The Pokémon Company issued a takedown request to Hugging Face for a dataset describing the characteristics of e.g. Bulbasaur. Let's see how this goes. https://t.co/ijJkA7sxdW pic.twitter.com/tPYaj2ktAg
— Michael Veale @mikarv@someone.elses.computer (@mikarv) March 13, 2024
700億パラメータの日本語LLM 「ELYZA-japanese-Llama-2-70b」
【お知らせ】700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、グローバルモデルに匹敵する性能を達成しました。デモサイトも同時に公開しています。
— ELYZA, Inc. (@ELYZA_inc) March 12, 2024
詳細は以下をクリックしてご覧ください。https://t.co/kw8euBuKz5
@GroqIncで、Gemma 7B Instructが利用可能に
【早すぎる推論】@GroqIncで、Gemma 7B Instructが利用可能に。予測変換レベルで回答を生成。速度と精度はトレードオフですが、未来はそれも乗り越えていきそう。
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) March 10, 2024
速度というのは、それだけに価値になる場合があるのでこの組合せで何ができるのか考える。#LLM #AIpic.twitter.com/5btbanNAtG
読書も LLM とする時代
ちなみにこの本、訳文を事前情報として読み込んだチャットAIが公開されていて、この本に関する疑問に答えてくれるようにしてあるらしい。
— A7|データサイエンティスト目指してる大学生 (@A7_data) March 13, 2024
読書もLLMとする時代。 https://t.co/qcEgRcUits
【実験】Claude 3 Haikuが出たのでロールプレイさせる
表とテキストを両方含むドキュメントから、上手に LLM で情報抽出を行う手法
表とテキストを両方含むドキュメントから上手にLLMで情報抽出を行う手法が、北京大学やMicrosoftなどの研究者らによってシェアされています。
— AIDB (@ai_database) March 9, 2024
セルを空白で区切り、行を改行文字で区切るといった方法などで表のテキスト化することによって、… pic.twitter.com/xI5oAeqPiq
今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです!
今週もお疲れ様でした!
=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪
X でも生成AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください!
「株式会社エクスプラザ(公式)」アカウント
https://twitter.com/explaza_inc
「生成AI事例集」アカウント
https://twitter.com/explaza_usecase