![見出し画像](https://assets.st-note.com/production/uploads/images/150915086/rectangle_large_type_2_1dc5e52951b00453d9d5c3e06d4cbaed.png?width=1200)
【AI Biweekly News 2024/8/16号 #1】Metaは独自のAIチャットボットを作成できる「AI Studio」を米国で提供開始 / Midjourney V6.1がリリース / 「Stable diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表 / Sakana AIがお題を与えるだけで学術論文を書いて査読までするAIを発表 / xAIが視覚言語モデルのGrok-2発表 / …他
みなさま、お久しぶりです。Pomaloの佐藤です。
まだまだ暑い日が続き、台風の季節にも突入しましたが、いかがお過ごしでしょうか?
Pomaloでは今後のnoteの運用をどうするのかと色々社内で議論しており、少し投稿が止まっておりました…(サボっていたわけではありません!)
改めて再スタートということで、今日から隔週でAIの最新アップデート・お役立ち情報をお届けします。(今後他の記事も投稿していく予定です。)
では、なぜPomaloがAIのニュースを発信するのか?
Pomaloでは、多くのコンテンツ制作に取り組みながら、「AIを使ってユーザーの心を動かせるコンテンツを作れるのか?」という問いに挑戦しているからです。
AIは大量のコンテンツを生成できますが、それが人間の感情に響くかどうかは別問題です。そこで、私たちはAIと人間の創造性の本質を解明し、両者が協働して新しいコンテンツを生み出す可能性を探求しています。
詳しい内容はこちらのnoteにも書かれているのでご覧ください!
日々とてつもないスピードでAIの進化が進み、情報を知っている人、知らない人の間では業務効率化などあらゆる側面で、大きな差が生まれてしまいます。
「AIがわからない」ではなく、「AIを活用する」ために、これから一緒に最新情報をインプットしていきましょう!
Metaは独自のAIチャットボットを作成できる「AI Studio」を米国で提供開始
![](https://assets.st-note.com/img/1723621481034-yk0JgO4CW2.png?width=1200)
Metaは、独自のAIチャットボットを作成できるサービス「AI Studio」を米国で提供開始。AI Studioは同社の「Llama 3.1」をベースとしており、同サービスのウェブサイトおよび「Instagram」アプリからアクセスでき、技術的スキルは不要で、誰でも独自のAIチャットボットを作成可能。
技術的スキルは不要なので、SNSの担当者だけでInstagramのアカウント運用の幅を広げることができる。顧客とのコミュニケーションを活性化してSNSからのEC売上向上やファンの創出といった新しい打ち手に挑戦していきたい。
Midjourney V6.1がリリース
Midjourenyの最新モデルv6.1がリリース。画像の一貫性向上や品質の向上、生成速度の上昇など全体的な機能が向上している。
パワーポイントの資料に差し込む画像など、クオリティの高い画像が作成できます。プロンプトもChatGPTと組み合わせて作成することで、イメージに近いものが生成できます。まだ使ったことのないという方は、ぜひ1度挑戦してみることをオススメします!
Midjourney V6.1 is now live! V6.1 greatly improves image quality, coherence, text, and comes with brand-new upscaling and personalization models. It’s smarter, faster, clearer, and more beautiful. We hope you enjoy our best model yet <3 pic.twitter.com/4qfervgbhM
— Midjourney (@midjourney) July 30, 2024
Google 批判受け、AIに子供の手紙を代筆させるCMを撤回
GoogleがオリンピックのCM撤回を発表。父親がGeminiを使って娘にファンレターを書かせるという内容に対し、「子どもの創造性をコンピュータに書かせた言葉になぜ入れ替えるのか」などと疑問の声が相次いだ。
AIの活用を推進することは、あらゆる面でポジティブな影響を与えると思います。一方で、こうした特定の個人の感情が重要とされるシーンでは、導入を慎重に検討をする必要があると感じます。AIに任せることと人がやらないといけないことを考えてAIの活用をしていきたいですね。
小学館がAIで人気作品を翻訳してライトノベルを海外発信
小学館が、人気漫画の小説版などのライトノベルをAIで英語に翻訳する事業を開始。今冬に北米圏で専用アプリ「NOVELOUS(ノーべラス)」をリリース。AIで翻訳する前に、翻訳者の手で登場人物の特徴や時代背景、文脈などを細かく整理し、物語の世界観や作品の質を担保。海賊版で見られる単純な機械翻訳との差別化を図っている。
今まで時間のかかっていた翻訳も、AIで効率化、コスト削減を実現しています。こちらの事例のように、コスト面がネックで手をつけられていなかった領域もAIの活用によって、事業化の可能性が出てくるかもしれません!
「Stable diffusion」開発者たちが新たな画像生成AI「FLUX.1」を発表
「Stable Diffusion」の共同開発者らによって設立されたベンチャー企業「Black Forest Labs」は最新の画像生成AIモデル「FLUX.1」を発表。FLUX.1は複数の要素を付け心地組む複雑な場面を正確に描写することを得意とし、従来のAIモデルで課題とされていた人間の指の描写も改善され、より自然な表現が可能となっている。
![](https://assets.st-note.com/img/1723629872574-AxQf10IV1d.png?width=1200)
FLUX.1はMidjourneyやStable Diffusionを凌駕するとも言われており、今まで画像生成において課題とされていた人間の指の描写もきれいに表現できます。早速「ジムでスクワットする男性」をFLUX.1で作成してみました。プロンプトの作成にはChatGPTを使用しています。
下記のページからFLUX.1を使えるので、ぜひ体験してみてください!
GPT-4o アップデート
![](https://assets.st-note.com/img/1723688366111-4beiQVLKao.png?width=1200)
GPT-4oがアップデートをリリース。APIの入力単価が半額に値下げ、出力単価も約30%値下げされた。性能も向上し、コストパフォーマンスが改善された。
生成AIの精度は日々向上していますが、1年前と比較するとどのサービスも普段使いする分には問題ない水準に達してきています。そのため、今後は各社価格競争が激化すると思われます。最新の動向を確認して、自社に合ったサービスを導入したいですね。
OAI quietly released a new model today!!
— Bindu Reddy (@bindureddy) August 6, 2024
The new GPT-4o is slightly better and 50% cheaper than the old one!! Right now, it's only a tad below Sonnet 3.5 on Livebench!
I suspect the main motivation was to show everyone that they can be better and cheaper than Llama-3 405B and… pic.twitter.com/91U5RZ6v2r
「Gemini 1.5 Flash」が大幅値下げ
![](https://assets.st-note.com/img/1723688330715-dW1ZC0a74p.png?width=1200)
「Gemini 1.5 Flash」が利用料金の大幅値下げを発表。入力トークンの価格を78%、出力トークンの価格を71%引き下げた。この値下げにより、100万トークンあたり0.075ドル、出力トークン価格は0.3ドルと業界最安値の水準となった。
GPT-4oに続いて、Gemini 1.5 Flashも大幅に値下げをし、業界最安値の水準となりました。社内ツールをGoogleで統一している企業であればGeminiを導入するのが他の機能にも拡張しやすいので良いかもしれないですね。
Sakana AIがお題を与えるだけで学術論文を書いて査読までするAIを発表
![](https://assets.st-note.com/img/1723624030150-YmXrQSYNF3.png?width=1200)
Sakana AIはLLMを組み合わせ、アイデア出しから実験の実施、論文執筆、査読までをAIが自動化するシステム「The AI Scientist」を発表。研究のアイデア出しから実験、論文執筆、査読までを自動化するシステムとなっている。このAIはLLMを活用し、科学研究の全プロセスを自動化して研究の質を向上させることを目指している。
一部でアイデア実行における正確性の問題や、データの扱いの誤り、倫理的な使用に関する懸念もありますが、これまでの研究のあり方を大きく変える可能性があります。今後、あらゆる研究分野で発展が急速に進むことも期待できます。
Googleが分析系サービスにGeminiを組み込み
GoogleがBigQueryやLookerにGeminiを組み込むという分析系サービスのアップデートを発表。BigQueryのコーディング支援やLookerのスライド作成、ビジュアリゼーションの支援が可能になる。
社内でBigQueryやLookerが標準ツールとされている企業にとっては非常に助かる機能ではないでしょうか。大枠はGeminiで作成して、細かい部分を修正するという形で、これまでの作業を大幅に効率化できそうです。
xAIが視覚言語モデルのGrok-2発表
![](https://assets.st-note.com/img/1723688623126-ldTcUXdA6v.png?width=1200)
Grok-2はxAIの最先端の言語モデルであり、その前身であるGrok-1.5と比較して推論、チャット、コーディング機能が大幅に向上。Claude 3.5 SonnetやGPT-4 Turboのような主要な競合を凌駕している。このモデルは、テキストとビジョンの両方のタスクに優れており、リアルタイム情報処理や企業向けソリューションなど、さまざまな用途に高い汎用性を発揮することが期待。
各社AIモデルを開発する中で、そのモデルが得意とする領域がやや異なります。自身の担当する職務や業務、リサーチしたい内容に合わせてサービスを使い分けるということもAI活用において必須のスキルになりそうですね。
GoogleがAIアシスタント「Gemini Live」を発表
![](https://assets.st-note.com/img/1723701670032-ddj1Fxb2Nl.png)
Googleは現地時間8月13日に開催したMade by Google 2024にて新しいPixelシリーズと搭載されるAI機能「Gemini Live」を発表。 「Gemini Live」は、生成AIの「Gemini」と会話形式でやりとりできるサービスで、人間のような自然な会話をサポートし、会話中の割り込みにも対応できる柔軟性が特徴。
柔軟に会話割り込みにも対応できるので、Geminiを常に横において仕事もプライベートも一緒に過ごすというようなことも出てくるかもしれないですね。
最後までお読みいただきありがとうございました!
これからもみなさんの業務に活かせる内容を発信していく予定なのでぜひフォローしていただけると嬉しいです。
それでは、また2週間後にお会いしましょう!
この記事を書いた人
![](https://assets.st-note.com/img/1723624858112-edxtpAO85d.png?width=1200)