生成AI関連情報(2024/08/16) GrokにFLUX.1が搭載?ほか
XのAIサービスであるGrok 2.0における画像生成処理にFLUX.1が搭載されたようです。利用するためにはプレミアム、Xプレミアムプラスの利用が必要です。価格はどのプラットフォームで払うか次第ですが…ブラウザからですとこう。
実際に調査した人の詳細情報はこちら。プロンプトが500文字までで、日本語は英語翻訳処理経由で入るので注意かな。
Made by Google 2024関連
音声で操作する"Gemini Live" を発表
ChatGPTの音声モードのようなものがGeminiで出来るようになるとのこと
ただ…個人的には現状の生成AIを音声でやるのは限度があると思っててます。というのも、精度をある程度求めたり確認をする為には応答に対するやり取りがあるので、音声でそれを指摘したり、長文の依頼をするのは無いなぁと。(例えば毎度「ステップバイステップでお願いね」とか言うの…?という)
Made by Google 2024関連
複雑な問題をリサーチし、レポートにまとめる"Research with Gemini" を発表
と発表されており、GeminiがリサーチャーとしてWeb全体の情報を駆使して質問に合致する研究レポートを作るとのこと。
資料に必要な図解をテキストからいい感じに生成してくれるNapkin AI
プレゼンテーションなどで使う図をすぐにテキストから読み解いて作ってくれます。どういうことかといいますと実際に叩いてみたのですが…
例えばドラマと映画という比較についてなんとなく、文章を書いてみました。(これも日本語→英語にDeepL翻訳で通したものです)
これをもとに図を作って!とやるとこうなります。
結構すごくないですか?ちなみに日本語で投げると日本語を英語に翻訳して、その上で英語で図が出ます。今回は精度が欲しかったので英語にしたものを渡してみましたが。
今後業務で使う図とか、こういう感じでテキストを起こしたらいい感じにその会社のブランドに合わせた図とか出してくれる世界線があるとめっちゃいい気もしています。もはやそうなってくるとコンサルティングファームとかのスキルが少し陳腐化しそうですが…