
決して忘れないAIモデル! Mistralの新しい最先端オープンモデル、ChatGPTが医師を上回る
6,321 文字
MicrosoftのAI部門CEOのムスタファ・スリマンが、舞台裏で取り組んでいた内容を共有しています。「ほぼ無限の記憶力を持つプロトタイプを開発してきました。そのため、まったく忘れることがありません」と述べ、これは2025年までにAIモデルで実現され、AIの使い方を完全に変革し、新しい可能性の世界を切り開くと主張しています。
次にMistralが参入しました。彼らはPixTR Largeと呼ばれる1,240億パラメータのオープンソースモデルをリリースしました。これは複数のベンチマークで最先端の性能を達成し、ウェブ検索、Fluxによる画像生成機能を備えたキャンバス、さらにはビジョン機能など、多くの新機能を搭載しています。最も素晴らしいのは、これらが完全に無料だということです。
最後に、ニューヨークタイムズが発表した新しい研究によると、AIチャットボットは現在、病気の診断において医師の性能を上回っているとのことです。この動画では、皆さんを驚かせるであろうその調査結果について詳しく掘り下げていきます。
早速本題に入りましょう。ムスタファ・スリマンが記憶力の進歩について説明している動画をお見せします。彼は、これがAIシステムにおける欠けているピースであり、AIの使い方を完全に変革する方法について説明しています。
「記憶が重要な要素です。現在のAIは、毎回新しいセッションを開始すると、直前や少し前の会話は覚えていますが、5回前や10回前のセッションは覚えていません。これは人々にとってかなりフラストレーションのたまる経験です。AIが忘れてしまうことを知っているため、深く関わったり、多くを共有したり、以前の会話を基に発展させようとはしないからです。そのため、しばらくすると表面的な体験になってしまいます。
しかし、私たちが開発しているプロトタイプは、ほぼ無限の記憶力を持っており、まったく忘れることがありません。これは本当に革新的です。変曲点について話すとき、記憶は明らかに変曲点です。なぜなら、時間を投資する価値があるからです。あなたが話すことすべてが、将来有用な形で返ってくるのです。サポートを受け、アドバイスを受け、時間の経過とともに、一日の計画を立てたり、生活を整理したりすることができます。この機能だけでも、2025年にはオンラインで利用可能になると予想していますが、本当に革新的なものになるでしょう」
これについて皆さんはどう思いますか?個人的には、現在のAIシステムとの対話は非常に表面的で短絡的だと思います。しかし、もしこれらのAIモデルがほぼ無限の記憶力を持ち、会話を覚え、あなたについて実際に知ることができるならば、ChatGPTのような単なるツールから真のコンパニオンAIへと変わる可能性が見えてきます。
Googleはすでにこれに取り組んでおり、最近ではGemini Advanceのユーザーが興味、日付、重要な情報などを覚えさせることができる機能をリリースしました。もちろん、現在のAIモデルもある程度の記憶力を持っています。例えば、今ChatGPTに「私について知っていることで、私が知らないことを教えて」と尋ねると、特に頻繁に使用している人であれば、その応答に驚くかもしれません。
しかし、MicrosoftのAI部門CEOによれば、2025年には実現する可能性があるとされる、すべてを真に記憶できるAIシステムを持つことができれば、これらのモデルとの対話方法は根本的に変わるでしょう。特にAIの音声技術がどれほど進歩したかを考えると、また、過去数十年にわたって先進国で着実に増加している孤独の割合を考えると、極端なケースでは、人々がAIをコンパニオンや、さらにはパートナーとして求める可能性も十分にあり得ます。
労働市場への影響についてはまだ触れていません。ほぼ無限の記憶力を持つAIシステムは、単純により効率的で有用なものとなるでしょう。OpenAIは最近、ChatGPTがMacユーザー向けのXcodeやTerminalなど、特定のサードパーティアプリにアクセスできるようになることを発表しました。彼らは明らかに、最終的にはコンピュータ上でタスクを実行できるようになることを期待するAIエージェントの基盤を築いています。
無限の記憶力があれば、これらのAIエージェントをより信頼性が高く、訓練しやすいものにできることは想像に難くありません。これは興奮する一方で、懸念も生じます。AIはすでに労働市場を大きく変革し、多くの懸念を引き起こしています。数週間前の記事でもそのことが議論されていました。
UCバークレーのコンピュータサイエンス教授、ジェームズ・オブライエンの言葉を直接引用すると:「技術系の学位はもはや就職を保証するものではありません。最近、学生たちから同じような話を聞きます。以前は、バークレーのCS卒業生は、トップの学生でなくても、仕事の種類、場所、給与、雇用主の面で魅力的な求人を複数受けていました」彼は、4.0のGPAを持つ優秀な学生でさえ、印象的な成績証明書と経験があるにもかかわらず、求人を受けられないことを心配して連絡してくることに気づいたと述べています。
彼は、これはほぼすべての求職者、すべての分野に影響を与えている広範な問題の一部である不可逆的なトレンドのために起きていると結論付けました。さらに「私たちは今日、何かをすべきです」と述べています。
オブライエンはまた、テクノロジー関連の仕事が減少しているように見えることについて、ウォールストリートジャーナルの記事を引用しています。同紙によると、Indeed.comのデータでは、2020年2月以降、ソフトウェア開発職の求人は30%以上減少しているとのことです。
これは、今後も続き、さらに悪化するトレンドだと私は考えています。テクノロジー関連の仕事で最初に見られるのは、AIがこれらの分野でより高い率で実装されており、すでに飽和状態にあるためです。高度な音声・推論能力と無限の記憶力を持つAIエージェントが登場する中、オブライエンが指摘したように、このトレンドは不可逆的であり、AIは本当に私たちの仕事を奪いに来ているように見えます。
しかし、NVIDIAのCEOであるジェンスン・ファンはそうは考えていないようです:「すべてのエージェントが50%の仕事をこなせるようになるでしょう。これは大きな成果です。AIが50%の人々の仕事を置き換えると考えるのではなく、AIが100%の人々の50%の仕事をこなすと考えるべきです。そう考えることで、AIがあなたの生産性、あなたの会社の生産性を向上させることに気づきます。人々は私に『AIは私の仕事を奪うのか』と尋ねますが、私はいつも真実を答えます。AIはあなたの仕事を奪いません。他の誰かが使うAIがあなたの仕事を奪うのです。だから、できるだけ早くAIを活用するようにしてください」
明らかに、これはAI革命の最前線にいる人物であり、より多くの人々がAIを使用することから恩恵を受ける立場にいます。コメント欄で教えてください。彼の見解に同意しますか?それとも、単に人々の不安を和らげるために言っているだけだと思いますか?
他のAIニュースでは、フランスのAI企業Mistralが今週非常に忙しく活動しています。新しい最先端のビジョンモデルPixal Largeをリリースし、また、ウェブ検索、画像生成、キャンバスなどの機能を追加してLChatを刷新しました。
新しいPixTRモデルから始めましょう。これは1,240億パラメータのモデルで、完全にオープンソースで無料であり、128Kのコンテキストウィンドウを持っています。ご覧の通り、様々なベンチマークでGPT-4.0、Gemini 1.5 Pro、Claude 3.5 Sonnetなどのモデルを上回る性能を示しています。特に、Math VistaやDocVQA、VQAv2などのビジョンベンチマークで注目すべき結果を出しています。
オープンソースモデルがこのレベルの性能を発揮していることは非常に印象的で、しかも今すぐLChatで無料で試すことができるのは驚くべきことです。LChatについて、まだ詳しくない方のために説明すると、これは基本的にMistralのAIアシスタント、あるいは彼らのモデルと対話するためのAIインターフェースです。
彼らは主要な新機能をいくつか追加しました。簡単に触れていきましょう。まず、ウェブ検索については、特に目新しいものではありません。多くのAI企業が自社のモデルにこの機能を追加しており、AIモデルを通じてウェブを検索する機能により、検索エンジンを使用する必要がほとんどなくなっています。
次に、Canvasを発表しました。これはOpenAIのCanvasやAnthropicのArtifacts機能に非常によく似ています。チャットログの横の別ウィンドウでリアルタイムに生成物を修正・編集することができます。特にコーディングに便利で、コード全体を実行することなく、特定の行を変更してその効果を即座に確認することができます。
チャットは現在、画像やPDFを理解・分析することもできます。ベンチマークで見たように、これは他のすべてのモデルを上回る性能を発揮している分野です。最後に、Black Forest Labsと提携して、彼らの画像生成エンジンFluxをチャットに導入しました。
これらすべての素晴らしい機能と驚くべき性能を持ち、しかも完全にオープンソースで無料なのです。
今週の他のニュースとして、ご存知かもしれませんが、イーロン・マスクはOpenAIが非営利組織の構造を守っていないとして訴訟を起こしました。これにより、彼らの古いメールの大部分が公開されています。このウェブサイトにはそれらすべてがまとめられています。興味のある方のために説明欄にリンクを貼っておきますが、すべての発端となったメールをお見せしたいと思います。
2015年5月25日、サム・アルトマンはイーロン・マスクに次のように書き送っています:「人類がAIを開発するのを止めることが可能かどうか、多くの考えを巡らせてきました。答えはほぼ確実にノーだと思います。もし必ず起こることならば、Googleではなく他の誰かが最初に実現する方が良いように思えます。Y Combinator(YC)がAIのためのマンハッタン計画を始めることが良いかどうかについて、何か考えはありますか?」
マスクは「おそらく話し合う価値はある」と返信しています。このメールが基本的にOpenAIを立ち上げるきっかけとなりました。さらに進むと、イーロン・マスクとサム・アルトマンの対立が始まった正確な時点を見ることができます:
「もう十分だ。これが最後の一線だ。自分で何かを始めるか、OpenAIを非営利組織として継続するかのどちらかだ。あなたがはっきりとした約束をするまで、私はもはやOpenAIに資金を提供しない。さもなければ、私はただスタートアップを作るための無料の資金を提供している愚か者になってしまう。議論は終わりだ」
他のメールから見ると、サム・アルトマンは利益と収益により焦点を当てていました。これはマスクが明らかに気にしていなかったことですが、マスクはまた会社のより強い支配力を求めていました。これはサム・アルトマンが受け入れられないことでした。その結果、マスクは去ることになりました。
ご覧の通り、彼らの対立は今でも非常に生々しく続いています。サム・アルトマンは最近、Xで、Grok 2が「ウォーク」であり、最良の大統領候補を尋ねられた際にトランプよりもカマラ・ハリスを選んだことを指摘しました。一方、GPT-4.0はより微妙な回答をし、どちらかを特に支持することはありませんでした。
ここで分断を生み出そうとしているわけではありませんが、あなたはマスク派ですか、それともアルトマン派ですか?コメント欄でお知らせください。
また、Grok関連の話題として、xAIは最近、メンフィスのデータセンターに10万個のNVIDIAチップを購入するため、最大60億ドルを調達しました。これらは今年末に登場予定のGrok 3の動力源となります。
他のAIニュースでは、ニューヨークタイムズが「AIチャットボットが病気の診断で医師を上回る」という記事を掲載しました。研究で発見されたことは実に驚くべきものです。記事によると、ロドマン博士が設計を手伝った研究では、ChatGPT-4と従来のリソースを与えられた医師は、ボットにアクセスできなかった医師よりもわずかに良い成績を収めただけでした。そして研究者を驚かせたことに、ChatGPT単独で医師の性能を上回りました。
さらに、OpenAI社のチャットボットは、症例報告から医学的状態を診断し、その理由を説明する際に平均90%のスコアを獲得しました。チャットボットを使用するようにランダムに割り当てられた医師は平均76%のスコアを獲得し、使用しないように割り当てられた医師は平均74%のスコアでした。
この研究についてはさらに多くの詳細があり、興味のある方のために説明欄にリンクを貼っておきますが、基本的な要点は、AIを使用した医師でさえもAI単独の性能には及ばなかったということです。ジェンスン・ファンが「AIがあなたの仕事を奪うのではなく、AIを使用する人間が奪う」と言ったことに戻りますが、私はそれほど確信が持てません。
また、見逃していたかもしれない「Evo」という新しいモデルもあります。これはDNAで訓練され、一から遺伝子を作成するAIモデルです。正直に言うと、ここで話されている多くのことは私の理解を超えていますが、基本的に、スタンフォード大学のブライアン・ヘイと他の研究者たちが、何十億もの遺伝子配列で訓練されたAIモデルを設計し、細菌やウイルスのゲノムがどのように機能するかを推測し、その情報を使って新しいタンパク質や、さらには完全な微生物のゲノムを設計できるようにしたということです。
Evoとして知られるこのモデルは、科学者が進化を探求し、病気を調査し、新しい治療法を開発し、さらには他の多くの生物医学的な疑問に答える可能性を持っています。そのため、確実に注目していく必要があります。少なくとも今のところ、彼らは実際に画期的な発見をしていないようですが、このモデルはAIによる合成ゲノムの設計に向けて大きな一歩を記したものと言えます。
最後のニュースとして、最初の自律型機械学習エンジニアである「Neo」を紹介します。はい、これは自律型MLエンジニアであり、OpenAIのCode-1モデルの性能を大幅に上回り、MLE-Benchで26%のスコアを記録しています。現在は利用できませんが、ウェイトリストに参加することはできます。説明欄にリンクを貼っておきます。もし彼らが主張するような性能を発揮するのであれば、これは本当に驚くべきことです。機械学習モデルが機械学習モデルを作成するようになったのです。
以上が今日のAIニュースです。視聴していただき、ありがとうございました。動画を楽しんでいただけたなら、ぜひいいねを押してください。そして、これからもこのような最新のAIニュースを見逃したくない方は、必ずチャンネル登録ボタンを押してください。