見出し画像

日刊AIニュース 10/6 Spetz、革命的なAI音声アクティベーションチャンネルをローンチ: 未来のサービス接続への新しいステップ


Spetz、革命的なAI音声アクティベーションチャンネルをローンチ: 未来のサービス接続への新しいステップ

(OJ): ねぇ、Nekoちゃん、Spetzっていう会社がAI音声アクティベーションチャンネルを開始したって聞いたことある?

(Neko): ああ、それは最近のニュースで話題になっているよ。SPETZ INC.という会社が、消費者が"会話型"の電話を通じてSpetzサービスをアクティベートできるようにするAI音声アクティベーションチャンネルを開始したのだ。この音声アクティベーションチャンネルは、Spetzの開発チームが社内で開発し、ChatGPTやWhisper by OpenAIなどの最先端のAI技術で動作しているのだ。

(OJ): ほぉ、それは面白いね。でも、具体的にどういうことができるの?

(Neko): この新しいチャンネルを使用すると、消費者は必要なサービスを求め、必要な情報、例えば場所や時間などを、ダイナミックな応答とともにオープンな会話を通じて尋ねることができるのだ。この技術は、トップマッチのサービスプロバイダーとの即時のコミュニケーションを支援するのだ。さらに、このAI音声アクティベーションは、Spetzのサービスを迅速かつ簡単に利用したい消費者にとってはもちろん、障害を持つ人々にとっても貴重なソリューションとなるだろう。

(OJ): それはすごいね。Spetzっていう会社、他にどんなことをしてるの?

(Neko): Spetz Inc.は、Spetzというグローバルなオンライン、AI駆動のマーケットプレイスプラットフォームを運営している多国籍技術企業なのだ。Spetzは、消費者を近くのトップ評価のサービスプロバイダーに約30秒でダイナミックに接続する。現在、SpetzはUSA、United Kingdom、Australia、Israelで利用可能だ。Spetzのビジョンは、人々が必要な瞬間にサービスに接続する方法を再発明することだ。

(OJ): なるほど、それは驚きだね。これからの展開が楽しみだ。

(Neko): まさにそうだ。特に、ヨッシ・ネヴォというSpetzのCEOは、この新しいAI音声アクティベーションソリューションのローンチに非常に興奮していると言っている。彼は、この技術がサービスコールの数を増やし、新しい聴衆にサービスを開放するのに役立つと信じているのだ。


BBC、ジェネラティブAIの使用原則を発表 - OpenAIのデータアクセスをブロック


(OJ): ねぇ、Nekoちゃん、BBCがOpenAIのデータスクレイピングをブロックしているって聞いたことある?

(Neko): ああ、それは最近のニュースで話題になっているのだ。BBCは、ジェネラティブAIの使用を評価する際に従う予定の原則を明らかにしたのだ。それによると、ジャーナリズム、アーカイブ、そして「パーソナライズされた体験」のための研究と制作を含む。

(OJ): それは面白いね。でも、具体的にどんな原則を設けているの?

(Neko): BBCのRhodri Talfan Daviesディレクターによると、3つの主要な原則があるのだ。第一に、BBCは常に公共の最善の利益のために行動する。第二に、アーティストの権利を尊重して才能と創造性を優先する。そして第三に、AIによって作成された出力についてオープンかつ透明であること。

(OJ): それは公正な取り組みのようだね。でも、BBCは具体的にどのようにジェネラティブAIを使用する予定なの?

(Neko): Daviesによると、BBCは今後数ヶ月間で、ジェネラティブAIの使用を探るいくつかのプロジェクトを開始する予定なのだ。これらのプロジェクトは、ジャーナリズムの研究と制作、コンテンツの発見とアーカイブ、そしてパーソナライズされた体験を含むさまざまな分野で、ジェネラティブAIがBBCの活動をどのようにサポート、補完、または変革できるかを評価するのだ。

(OJ): 他のニュース組織はどう考えているの?

(Neko): 他のニュース組織もこの技術についての考え方を明らかにしているのだ。例えば、Associated Pressは今年初めに独自のガイドラインを公開した。また、GPTモデルのトレーニングのためにOpenAIとのパートナーシップを結んで、そのストーリーを共有しているのだ。

(OJ): でも、BBCがOpenAIのウェブクローラーをブロックした理由は何なの?

(Neko): Daviesによると、この措置は「ライセンス料の支払者の利益を守る」ためで、BBCのデータを許可なくAIモデルでトレーニングすることは公共の利益にはならないとのことだ。実際、BBCはOpenAIやCommon CrawlのウェブクローラーがBBCのウェブサイトにアクセスするのをブロックしているのだ。これにより、CNN、The New York Times、Reutersなどの他のニュース組織と同様に、彼らの著作権付きの素材へのウェブクローラーのアクセスを防ぐことができるのだ。


ロボット技術の新たな進化:LBMs、5G接続、そしてTikTokのロボット理髪師

OJ): ねぇ、Nekoちゃん、最近のロボット技術の進化について知ってる? (Neko): ああ、実は最近のロボットのニュースをチェックしていたのだ。特にLarge Behavior Models(LBMs)という技術が注目されているのだ。

(OJ): LBMsって何?

(Neko): これまで、人型や産業用ロボットはLLMs(large language models)や強化学習を使用して、言語でロボットを制御する方法を学んできたのだ。しかし、カリフォルニアのToyota Research Institute(TRI)での最新の発見によれば、LBMsがLLMsを教育のために置き換える可能性があるのだ。TRIは、この新しいジェネラティブAI技術をDiffusion Policyと呼んでいるのだ。

(OJ): それはどういう意味?

(Neko): TRIのCEOであり主任科学者のギル・プラットによれば、この新しい技術は非常に高速で動作するのだ。従来、物理的なことを行う際には、多くのトレーニングケースが必要だった。しかし、この新しい技術では、わずか数十のケースだけで十分なのだ。TRIの研究者たちは、Diffusion Policyを使用して、ロボットに新しい、緻密なスキルを迅速に教えているのだ。

(OJ): それはすごいね!他にも何か新しい情報はある?

(Neko): 実はMIT Sloan Schoolの最近の研究によれば、人間とロボットの協力の利点が再評価されているのだ。ロボットが人間の動きに適応することで、効率が向上し、アイドル時間が85%削減されるという結果が出ているのだ。

(OJ): それは驚きだね。でも、5Gとロボットの関係はどうなっているの? (
Neko): 産業用ロボットは、より高速なインターネット接続を求めて5Gを急いでいるのだ。特に、自動移動ロボットやフォークリフトなどのロボットプラットフォームは、適切に機能するために高速インターネットが必要なのだ。

(OJ): それにしても、ロボット技術の進化は本当に驚くべきだね。

(Neko): そうだね。特に、カリフォルニアのSalinas Valleyでは、農業のロボット技術が急速に進化しているのだ。そして、TikTokのロボット理髪師として知られるシェーン・ワイトマンも再び登場しているのだ。


本日の論文 MathCoder: 大言語モデルの数学的推論能力を革新

要約

MathCoderは、GPT-4 Code Interpreterのような最近の大言語モデルが持つ数学的問題解決能力をさらに強化するためのフレームワークです。このフレームワークは、数学的な指示に従ったデータセットの構築と、カスタマイズされた監督された微調整の2つの部分から成り立っています。MathCoderの能力は、データ生成に使用されるGPT-4の能力によって制約されており、定理証明の問題を解決することはできません。また、MathCoderは一連の単一モードのモデルであり、複雑な幾何学的問題の解決にはまだ課題があります。

革新的なポイント

  1. 大言語モデルの数学的推論能力の強化: MathCoderは、大言語モデルが持つ数学的推論能力をさらに強化することを目的としています。これにより、数学的な問題の解決において、より高度な能力を持つモデルを構築することが可能となります。

  2. カスタマイズされた監督された微調整: MathCoderは、特定の数学的なタスクに対してモデルを微調整するためのカスタマイズされた監督された微調整の手法を提供しています。これにより、特定の数学的な問題に対するモデルの性能を向上させることができます。

  3. 数学的な指示に従ったデータセットの構築: MathCoderは、数学的な指示に従ってデータセットを構築することを提案しています。これにより、モデルは数学的な問題の解決に必要な指示を正確に理解し、適切な解決策を生成することができます。

(OJ): ねぇ、Nekoちゃん、最近の大言語モデルでの数学的推論の進化について聞いたことある?

(Neko): ああ、それはMathCoderに関するものらしいのだ。詳しく説明するのだ。

MathCoderは、最近のGPT-4 Code Interpreterのような大言語モデルが示した数学的問題解決の能力をさらに強化するためのフレームワークなのだ。このフレームワークは、数学的な指示に従ったデータセットの構築と、カスタマイズされた監督された微調整の2つの部分から成り立っているのだ。

GPT-4 Code Interpreterは、自然言語での推論、コードの生成、コードの実行、そして実行結果に基づいてさらに推論を続ける能力により、難しい数学の問題を解決するのに非常に優れていると言われているのだ。この研究では、オープンソースの大言語モデルを微調整して、数学の方程式のモデリングと導出のためにコードを使用することができるようにする方法を提案しているのだ。

MathCodeInstructという新しいデータセットも紹介されているのだ。このデータセットは、数学の問題とそのコードベースの解決策を持つ高品質のデータセットで、各解決策は自然言語、コード、実行結果を交互に組み合わせているのだ。

(OJ): それはすごいね!でも、どうしてこれが必要なの?

(Neko): これまでのオープンソースの大言語モデルは、数学的推論のタスクにおいて、GPT-4や他のクローズドソースのモデルに比べて大きく遅れていたのだ。しかし、このMathCoderフレームワークにより、オープンソースのモデルもGPT-4 Code Interpreterのように数学の問題を解決する能力を持つようになるのだ。

(OJ): それにしても、数学的推論の能力を持つAIは、未来の教育や研究に大きな影響を与えそうだね。

https://browse.arxiv.org/pdf/2310.03731.pdf


いいなと思ったら応援しよう!