見出し画像

#512 テクノロジーネタ~Google DeepMindがGemini 2.0を発表:AIパフォーマンスとマルチモーダル統合における飛躍

おはようございます!本日もよろしくお願いします。今日も暖かい感じが確かにしますね。このままだと桜も今年はだいぶ早くに咲くかもしれませんね。何となくバタバタしながらスタートした新年でしたが、今日辺りから少し落ち着いて仕事が出来そうです。かなり後回しになっていたことがあるので、ちょっとずつ片付けていこうと思います。特に自分が担当しているマーケティング関連の活動が完全に止まっていて、それは何としていかないといけないなと思っていて、今日はその辺りから手を付けていこうと思います。さてさて本日は「テクノロジーネタ~Google DeepMindがGemini 2.0を発表:AIパフォーマンスとマルチモーダル統合における飛躍」です。

Gemini 2.0

更新頻度が落ちていて、なかなかテクノロジー関連の話題を取り上げていなかったなと思いまして、今日は久々のAI関連のネタです。以下、記事からの抜粋です。Google DeepMindは、前モデルのGemini 1.5 Proの2倍の処理速度を実現するAIモデルGemini 2.0を発表した。このモデルはテキスト、画像、その他の入力を組み合わせて高度な推論を行う複雑なマルチモーダルタスクをサポートしている。JAX/XLAフレームワーク上に構築されたGemini 2.0は大規模に最適化され、複雑なトピックを探索するためのDeep Researchなどの新機能を含んでいる。現在、開発者と信頼できるテスターに提供されており、近くGeminiやSearchのようなGoogle製品に統合される予定である。

OpenAI連合 VS Google

マルチモーダル対応になって、だいぶOpenAIに追いついてきた印象ですね。ただ、ここからはGoogleは強いんじゃないかなと思います。というのもこのマルチモーダルなモデルを現在のプラットフォームに統合していけるので、かなりユーザーインターフェースとして使いやすい使用にしやすいんじゃないかなと。あとGoogleはスマホもあるので、そのUIとの統合も結構、うまくいきそうな気がします。こうなってくるとOpenAIはビジネスはマイクロソフト、個人向けはアップルと組んでGoogleと戦っていく構図が明確になってきた感じがします。今年の後半にはだいぶ内容が見えてくると思いますし、いよいよ楽しみになってきました。

まとめ

いかがでしたでしょうか?今日は久しぶりのAI関連の記事でしたが、やはり進化のスピードは段違いですね。ただそろそろ最終形が見えつつあるところにきたので、勉強を始めるには良い頃合いかもしれません。少しでも他の人よりも知識をためて、いざ実装フェーズになったときに良いポジションでスタートするイメージは持っておいた方がいいかなと思いました。もうコードを書いて何かをするとか、そういうレベルのことは知る必要はないけど、そもそもAIを使うとどういう事ができるようになるのかとか、どのプラットフォームの何を使えば、出来るようになるのかみたいな話を整理しておくといいのかなと。ではでは、また!


いいなと思ったら応援しよう!