Microsoft 365 Copilot、Teamsの音声同時通訳を提供 / Perplexity、ワンクリック・ショッピングを追加 / Geminiにメモリが搭載、生活や仕事、好みなどの情報を記憶できるように / TikTok、コンテンツを自動生成するSymphony Creative Studioをリリース / 「Gemini Live」がiPhoneに登場【AI Biweekly News #8】

2024年11月22日 18:06

今週もお疲れ様でした！Pomaoの佐藤です。

今年も気がつけば残り１ヶ月ちょっとで、１年が本当に早いなと感じております。2024年の残りも悔いのないようにやり切っていきましょう！

それでは、2週分のAIに関するニュースをお届けします！

AIのアップデート情報や、活用事例の収集にお役立てください。

Microsoft、Copilot Action等を発表

MicrosoftはITチームの生産性向上を目的とした新機能「Copilot Actions」などを発表。Microsoft 365 Copilotユーザーが、Teams会議のアクションアイテムの要約、週次レポートの生成、会議準備といった日常的な反復作業を自動化することができる。

Microsoft 365 Copilot、Teamsの音声同時通訳を提供

Microsoftは、イリノイ州シカゴで開催した「Microsoft Ignite 2024」で、Microsoft 365 Copilotの新機能として音声同時通訳の提供を発表した。この機能はTeamsで利用可能となります。 Teamsの右上にある設定ボタンから音声同時通訳機能を利用するための「Language and Speach」メニューが用意され、中国語、英語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、スペイン語の9言語を選択できる。

後述するDeepLでもリアルタイム翻訳機能がリリースされました。そちらと比較しても非常に使いやすいものとなっているのではないでしょうか。英語以外の言語にも多数対応しており、企業は海外とのミーティングで感じる言語の壁を解消できるかもしれません。

Geminiにメモリが搭載、生活や仕事、好みなどの情報を記憶できるように

Geminiにメモリ機能が搭載されたことが発表された。Gemini Advancedにおいて、個人の興味や好みを記憶してもらい、より役立つ適切な回答を得ることが可能になる。

個人の好みや性格などをGeminiに記憶するように指示するとそれをメモリに記録し、よりその内容にあった回答をしてくれるようになります。自身の置かれている前提条件などで、共通するものは事前に記憶させることで、プロンプト作成の手間が省けます。

Rolling out starting today, you can ask Gemini Advanced to remember your interests and preferences for more helpful, relevant responses. Easily view, edit, or delete any information you've shared, and see when it’s used.

Try it in Gemini Advanced → https://t.co/Yh38BPvqjp pic.twitter.com/gR354OZxnV
— Google Gemini App (@GeminiApp) November 19, 2024

Perplexity、ワンクリック・ショッピングを追加

Perplexityは、米国のProユーザー向けのワンクリック・チェックアウト機能「Buy with Pro」や、アップロードされた写真と商品の候補をマッチングさせるビジュアル検索機能「Snap to Shop」など、新しいショッピング機能を導入した。この機能の潜在的な欠点として、PerplexityのAI応答におけるエラーやハルシネーションの発生頻度については明らかにしていない。

添付の記事内の動画を見るとどのような内容かがイメージできるのでそちらをご覧ください。欲しい商品の特徴などを入力することで、商品の提案とそれを直接Perplexity内で購入まですることができるようです。

Perplexity、米国で広告プログラムを展開

Perplexityは、AIが生成したユーザーからの質問に対する回答とともに、スポンサー付きのフォローアップ質問を表示する広告プログラムを米国で開始する。 Perplexityは、スポンサー付きの質問に対する回答は依然としてAIが生成したものであり、広告主の影響を受けることはなく、広告パートナーはユーザーの個人データにアクセスすることはないと主張している。

スポンサー広告が出てくることによってPerplexityユーザーの反応がどう変化するのかが気になりますね。ユーザーの感想や今後のアップデートも様子を見ていきましょう！広告の戦略などに影響が出てくるかもしれません。

Replit Agentで非エンジニアも簡単にWebアプリ開発が可能に

Replitの新機能「Replit Agent」は、自然言語による指示でフロントエンドからバックエンドまでのWebアプリを自動生成する革新的なツール。非エンジニアでも「TODOアプリを作って」のような簡単な指示でアプリ開発が可能となり、リアルタイムでの開発進捗確認や細かい調整もAIとの対話を通じて行える。また、多様なデプロイオプションを提供し、完成したアプリを迅速に公開ですることもできる。データベースとの連携もできる点が強み。

他にも要件定義をしてくれたり、プログラムを組んでくれるAIはありますが、データベースまで考慮されておらずに、すぐに後悔できる状態ではないという場合が多いです。一方で、Replit Agentはデータベースまでも考慮し、そのまま公開できる状態まで作り上げてくれる点で、よりエンジニアの負担を軽減することができるのではないでしょうか。

GoogleドキュメントでGeminiを活用した画像生成機能を提供開始

Googleは、AIモデル「Gemini」を活用してGoogleドキュメント内で画像を生成する新機能を導入。これにより、ユーザーは画像を簡単に作成し、文書に挿入することができる。主な機能として、インライン画像の生成やページレスモードでのカバー画像作成があり、ビジネス資料や個人用途に適した画像を直感的に作成可能。

一つのサービス内で、作業を完結することができる点で、これまでの業務を効率的に進行できるのではないでしょうか。現状は一部有料ユーザーのみ利用可能ですので、利用できる方はぜひお試しください。

ピッツバーグ大学の研究によると、有名な詩人の作品よりも、AIが作成した詩の方を高く評価

ピッツバーグ大学の研究によると、AIが作成した詩と人間が書いた詩の違いは読者にはわからず、シェイクスピアのような有名な詩人の作品よりもコンピュータが作成した詩の方が高く評価されることがわかった。

研究者たちは、ChatGPT 3.5によく知られた英語の詩人のスタイルで詩を作成させ、作者の実際の詩と比較した。その結果、リズムや美しさなどの点で、AIが作成した詩の方が人間の詩よりも優れていた。研究者らは、AIが作成した詩の方が、専門家でなくても理解しやすい、わかりやすい表現になっていることが、高評価の理由である可能性を示唆している。 AIが作った詩であることを事前に知らされた参加者の評価は低かった。

AIが人間の好みを学習して再現性高くそれを実現できそうだという一方で、AIが作ったことを知ってしまうとユーザーの評価に大きく影響を与えてしまうというバイアスもあるようです。

AIが生成したコカ・コーラの広告「Holidays Are Coming」、見た目は華やかだが人工的とのコメント

コカ・コーラは、Leonardo、Luma、Runway、Klingなどの生成AIモデルを使って、1995年のクラシックなクリスマスCM「Holidays Are Coming」を再構築した。 AI制作によって、従来の方法に比べて時間とコストを大幅に節約することができたが、一部の批評家は、このCMがオリジナルと比べて安っぽく、時折奇妙に見えると主張している。

やはり、AIで作成したことがわかりやすいと制作物の評価は良いものにならないような傾向にあると思います。AIで作ったことを表示せざるを得ない場合は別として、そうでない場合はAIで作ったことを公表しなくても良いのではないかと考えています。

TikTok、コンテンツを自動生成するSymphony Creative Studioをリリース

TikTokは、ブランドが広告コンテンツを制作・拡大するためのAI搭載の動画生成プラットフォーム、Symphony Creative Studioをリリース。このプラットフォームは、商品情報やURLを数分でTikTok対応動画に直接変換、広告パフォーマンスの高い動画を生成、広告主はAIデジタルアバターを活用できるようになり、音声、位置、スタイルなどを編集できる複数のオプションを選択できる。

TikTok動画のクリエイティブ制作の効率化が進みそうです。動画内の情報の正しさや盗作をしていないかといった点は制作時にしっかり確認しましょう！

一時停止していた「DMMボイス」→「にじボイス」として再開

Algomatic（東京都中央区）は11月20日、提供を一時停止していたAI音声生成サービス「DMMボイス」を、「にじボイス」に名称変更して再開した。提供の一時停止に至った背景については「予想外に反響が大きかった」と説明した。

作成したものが意外にも大反響で予想以上のトラフィックの多さでサービスを提供停止したそうです。今はNDA締結を結ぶなどの条件のもとでAPI利用もできるそうです。

macOS版ChatGPTがデスクトップ上のアプリと連携できるように

OpenAIはデスクトップアプリのアップデートを行い、ChatGPTがMac上のサードパーティアプリケーションと直接対話し、シームレスなAIアシストワークフローを実現した。「Work with Apps」機能により、ChatGPTはVS Code、Xcode、Terminal、iTerm2を含む選択した開発者ツールからコンテンツを読み取り、分析することができる。

連携できるアプリは限られてはいるものの、開発の領域では活用できる余地が多そうです。他のアプリとの連携も進んで、活用の幅が広がることに期待ですね！

ChatGPT 🤝 VS Code, Xcode, Terminal, iTerm2

ChatGPT for macOS can now work with apps on your desktop. In this early beta for Plus and Team users, you can let ChatGPT look at coding apps to provide better answers. pic.twitter.com/3wMCZfby2U
— OpenAI Developers (@OpenAIDevs) November 14, 2024

DeepL、音声と動画からリアルタイムでテキストベースの翻訳を行うDeepL Voiceを発表

【引用元】https://www.itmedia.co.jp/news/articles/2411/14/news106.html

DeepLは、英語や日本語など複数の言語でリアルタイムの翻訳サービスを発表した。テレビ会議やライブ会話でテキストベースの翻訳が可能になった。創業者のクチロフスキー氏は、将来的には音声処理製品の改良を進める計画であり、音声とビデオの高速生成技術にまだ改善の余地があるとしている。

ウェブ会議や対面での会話をリアルタイムで翻訳する２つのソリューションがあり、どちらも現在は企業向けとのことでした。現状は字幕の生成のみですが、音声も生成できるようになる日もそのうち来るかと思います。

隣に通訳がいるみたいな感じでしょうか。

「Gemini Live」がiPhoneに登場

Googleは「Gemini Live」をiOSで提供開始した。 YouTube Musicやマップなどの他Googleサービスと通信することができる。 Siri以外のチャットボットと同様、GeminiはiPhoneの設定を変更したり、他のアプリにアクセスしたりすることはできない。

Googleのサービスをメインで使っている方はぜひ利用してみてはいかがでしょうか。アプリを起動して右下のアイコンをタップするとGemini Liveに遷移します。

Google、AI動画作成ツール「Vids」をワークスペースに追加

Googleは、AIを活用した新しい動画作成サービス「Vids」の提供を開始した。組み込みのAIが、スクリプトの生成、トランジションの設計、フィラーの排除など、動画作成の技術的・創造的な側面でユーザーを支援する。

ドキュメントやスライドからクリエイティブを作成できるので、トレンドや提案資料などをソースにしてアイディアの創出に活用できるのではないでしょうか。どう運用するのが効率的かなど試行錯誤していきたいですね。

GoogleのReCapture、既存のビデオのカメラアングル変更を可能に

Googleの研究者たちは、録画後の動画のカメラの動きをユーザーが修正できる新しいAI技術「ReCapture」を開発した。このシステムは、プロ級のビデオ編集機能をカジュアルユーザーに提供することを目的としている。

添付画像のように、オリジナルの動画の画角に動きをつけることができます。イメージ動画は添付のニュースリンク先にあるのでご覧ください！

ビートルズのAIアシスト曲「Now and Then」がグラミー賞2部門にノミネート

ビートルズが今年のグラミー賞で2部門にノミネートされた。ビートルズの楽曲「Now and Then」はAIを駆使してリファインされ、昨年リリースされたが、年間最優秀レコード賞と最優秀ロック・パフォーマンス賞にノミネートされている。

ピアノの音と歌唱を分離し、それぞれのパートを追加して楽曲を作成しているとのことでした。この事例のように、他のアーティストも過去と未来を繋ぐコラボレーションが今後も出てきそうですね。

生成AIで作成した福岡のPR記事、“架空の祭りや景色”への指摘が続出し開始1週間で全て削除する事態に

Webで地方の魅力をPRする「つながり応援プロジェクト」は、福岡県でのキャンペーン「福岡つながり応援」の公式Webメディアで「誤った情報を発信した」と公式Xで謝罪した。生成AIを活用してPR記事を制作したところ、ユーザーから間違いを指摘する声が相次いだという。11月1日のキャンペーン開始から、わずか1週間で全ての記事を削除する事態となった。

下記、Xでの投稿です。

【情報発信に関するお詫び】 pic.twitter.com/h6WWQEKynp
— 🤝つながり応援プロジェクト【公式】 (@tsunagari_ouen) November 7, 2024

今回はAIで作成したコンテンツを確認せずに使用していたために発生したとのことでした。AIを活用する場合でも、最終的には人間の確認は必要です。もし、確認していなかった方がいれば今日から改めていきましょう！

手術ビデオを見ていたAIロボット、人間の医師並みの技術を披露

ジョンズ・ホプキンス大学の研究者たちは、人間の外科医が作業しているビデオをロボットに見せるだけで、複雑な医療処置を行なえるように訓練するという、外科用ロボットの画期的な進歩を成し遂げた。針の操作や縫合といった重要な手術作業を学習し、人間レベルの技術で実行する。

これにより、術者の負担が減り、より高度な作業に集中することができるかもしれません。今後も医療領域でのAI活用がどう進んでいくのか楽しみですね！

最後までお読みいただきありがとうございました！

これまでのAIニュースも含めてマガジンにまとめていますので、過去のニュースもチェックしたい方は下記よりご覧ください。

それではまた、次のAIニュースでお会いしましょう！

この記事を書いた人