見出し画像

YouTube AI判別に「カメラで撮影」の表示開始/GeminiのImagen 3 画像生成が日本語対応/NotebookLMに音声要約の新機能追加/生成AI、産業効果21兆円/Windows版ChatGPTアプリが公開/HeyGenにAIアバターとしゃべれる機能追加/自然言語でアプリ生成AI「bolt.new」【週刊AIのニュース 2024年10月21日号】

こんにちは。AIのある暮らしです。

2024年10月14日〜10月20日の「週刊AIのニュース」をお届けします。

みなさまのAI情報収集にご活用ください。


【1】文章生成AI

こうしてデータが盗まれる サイバー攻撃者が目を付けた「ChatGPT」のあの機能

ChatGPTの「メモリ機能」を悪用したサイバー攻撃のリスクが指摘されている。攻撃者は、この機能を使ってユーザーの個人情報を捏造し、AIとの対話履歴からデータを盗むことが可能だ。間接プロンプトインジェクション攻撃を用いて、誤った情報を記憶させ、ユーザーの人物像を不正に構築する手法が明らかになった。企業ユーザーは定期的にメモリの内容を確認し、不正な記憶の有無をチェックすることが推奨される。

「○○とは」検索→AIが回答 「Yahoo!検索」に生成AIの回答を表示する機能

LINEヤフーは、「Yahoo!検索」で「〇〇 方法」や「〇〇とは」といった検索時に、生成AIによる回答を表示する機能を実装。AIが追加質問に対応するチャット機能も提供され、観光コース提案や商品レビューの要約に続く拡張機能として期待される。将来的には、検索結果を介さず直接チャットで質問が可能になる予定。

【2】画像・動画生成AI

「Gemini」の「Imagen 3」画像生成がついに日本語対応に、カスタムAI「Gems」も日本語で提供開始

Googleは、AIアシスタント「Gemini」に日本語対応の「Imagen 3」画像生成機能を追加。より自然な画像生成が可能で、写実的な風景やクレイアニメなど多様なスタイルに対応する。「Gem」機能も日本語で提供され、カスタムAIが特定トピックで専門的な支援を行うことが可能に。これらの機能は「Gemini」のAdvanced、Business、Enterpriseプランで利用できる。

GoogleのGemini搭載AI文章生成ツール「NotebookLM」に音声要約をカスタマイズできるオプションが追加される、NotebookLM Businessのパイロット版も開始

GoogleはNotebookLMに音声の概要をカスタマイズする機能と、バックグラウンド再生のオプションを追加。音声ファイルのアップロードやAIによる概要生成が可能になり、作業を中断せずに情報を聴取できるようになった。また、企業向けのNotebookLM Businessのパイロットプログラムも開始し、正式リリースは2024年中に予定されている。

山寺宏一ら「無断生成AI」にNO

声優の山寺宏一らが、権利者の許可なく生成されるAI音声や映像に対する啓発キャンペーン「NOMORE無断生成AI」を開始。キャンペーンは、無断でのAI利用がクリエイターの権利を侵害するリスクを伝える目的で、動画コンテンツを公開し、SNSやYouTubeでの啓発活動を展開している。

中尾隆聖ら声優有志の会による「NOMORE無断生成AI」が始動 総勢26名の声優が出演する動画公開

声優有志の会「NOMORE無断生成AI」が始動し、公式SNSやYouTubeで活動を開始。中尾隆聖、山寺宏一、梶裕貴ら26名の声優が出演する動画を公開し、無断で生成されたAI音声や映像の問題に対する啓発を訴える。動画は「第0弾」として発表され、今後の展開が注目される。

最大4096×4096の解像度の画像を数秒以内に自動生成できるAIモデル「Sana」をNVIDIAなどの研究チームがリリース

NVIDIAやMIT、精華大学の研究チームが、高解像度画像を高速生成するAIモデル「Sana」を発表。最大32倍の圧縮技術を用いて4096×4096の画像をわずか数秒で生成する。新技術により、従来の手法と比較して100倍以上の高速化を実現。Sanaは、低スペックなPCでも動作可能な柔軟性を備えている。

最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較

FLUX1.1 [pro]は、プロンプトを自動的に拡張する「アップサンプリング」機能を搭載し、短いプロンプトでも詳細な画像生成が可能。他の画像生成AIと比較すると、FLUXは映画的な雰囲気を生み出す一方で、ビンテージフォトの表現ではStable Image Ultraが優位。各モデルの特徴が異なるため、用途に応じた選択が求められる。

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている

中国の新しい動画生成AI「Hailuo」は、静止画を6秒の動画に変換可能。720Pの解像度で、日本人キャラクターの一貫性に優れており、従来のサービスと比較して高い自然さを実現している。今後、商用利用の有料プランが予定されており、さらなる機能追加も期待される。

【3】モバイル・マルチモーダルAI

Apple、新型iPad mini3年ぶり発売 自社AI「Apple Intelligence」対応

Appleは3年ぶりに新型iPad miniを発表し、10月23日に発売予定。新モデルは「Apple Intelligence」対応で、AIを活用した新機能が搭載される。画面サイズは8.3インチで、最小ストレージは128GBに増量。価格は日本で7万8800円からスタートする。

無料でAI文字起こしを使うという手も。Apple Watchでメモを取るための3つのアプローチ

Apple Watchでメモを取る方法として、テキスト入力や音声メモを活用するアプローチが紹介されている。テキストの場合は「リマインダー」や「OneNote」などのアプリを利用でき、音声メモでは「ボイスメモ」アプリを使って簡単に記録可能。また、AI文字起こしを用いると、無料で効率的にメモを管理することもできる。

10 月の Pixel Drop:役立つ機能の向上

Google Pixelデバイス向けに新機能が追加され、AIによる機能強化、カメラ改善、セキュリティ向上が行われた。Pixel 8以降では「音声消しゴムマジック」で動画の音質を向上し、水中撮影や夜景モードも強化。さらに、Pixel BudsでGeminiをハンズフリー操作可能にし、スマートウォッチやタブレット間でシームレスな操作が可能になった。Android 15の展開も開始された。

Windows版ChatGPTアプリが公開

OpenAIは、Windows版ChatGPTアプリを公開し、現在はEarly VersionとしてChatGPT Plus、Enterprise、Team、Eduプランのユーザー向けにテスト提供中。macOSやiOS版が5月、Android版が7月にリリースされており、Windows版は予告通りの展開。Alt+スペースのショートカットキーで即座に起動可能で、正式版は年内にリリース予定。

iOS 18.1でSiriにタイピングできる新機能が登場:その使い方とは

iOS 18.1で、Siriに音声ではなくタイピングで指示を出せる「Type to Siri」機能が導入された。公共の場や会議中など、音声を使えない環境で便利に使えるほか、プライバシーを保護したまま情報を取得できる。設定方法は簡単で、テキストでリマインダーの作成やアラーム設定が可能。

【4】生成AI活用事例

エスカレーターを歩くと「ずんだもん」に注意されるのだ JR大宮駅でAIを使った実証実験

JR東日本は、大宮駅でエスカレーターの安全利用を促進するため、AI技術を活用した実証実験を実施。歩行者を検知すると、東北地方の応援キャラクター「ずんだもん」の声で注意喚起する。実験は10月28日から12月4日まで行われ、非歩行2列乗車の啓蒙も合わせて実施される。

170万字対話「ChatGPTに悩み相談」で大号泣の夜を越えて

仕事や学習で計画が続かないことはよくあるが、目標達成には小さな習慣を身に付けることが重要。目標設定と継続、必要に応じた軌道修正が求められる。記事では、大学受験向け学習塾の代表である伊藤智子さんが「習慣」を通じて理想の人生を築く方法を解説。振り返りの大切さも強調し、人生を好転させるためのアプローチを紹介している。

「ChatGPTはこう使え!」オープンAI日本法人社長が直伝、AIの性能を引き出すテクニック

ChatGPTは世界中で人気を集める生成AIサービス。オープンAI日本法人の長崎忠雄社長は、日常生活での多用を推奨し、慣れれば効果的な活用法が見えてくると述べる。新聞の用語解説や計算、ブレーンストーミングなどに使うことで、AIの能力を引き出す方法を紹介。ChatGPTを頻繁に使うことで、より「賢く」なるという。

グーグル社員が実践する「Gemini」活用法!生産性を高めるリアルな使い道を“中の人”が伝授、人事評価・プロンプト改良…

グーグル社員は、生成AI「Gemini」を用いて人事評価資料の作成やプロンプトの改良などに活用し、生産性向上を図っている。Geminiを使うことで、通常の業務の効率化が進んでおり、社員間でも日常的に使用される状況が定着している。記事では、実際の活用事例を通じてAI導入の効果と具体的な使い方が紹介されている。

「文系人材」こそ生成AIを使いこなすチャンス大の理由、未来の“ビジネス必須スキル”とは?

生成AIの進化により、ソフトウェアやアプリでの活用が進み、ビジネスに不可欠な技術となりつつある。特に文系の人材にとって、生成AIの習得は大きなチャンス。マイクロソフトの生成AI研修で学び始めた50代女性の事例では、AIを使った業務効率化や新たなスキル習得が大きな変革をもたらしたとされる。

国内初の農業用生成AI 農研機構や北大 イチゴで実証実験

農業・食品産業技術総合研究機構と北海道大学は、国内初の農業用生成AIを共同開発し、発表。AIが気候や土壌のデータを学習し、普及指導員が農業支援に活用する。実証実験は21日から三重県でイチゴ栽培を対象に行われ、今後全国展開を目指す。AIの導入により、農業効率や生産性の向上が期待される。

【5】生成AI業界

生成AI、産業効果21兆円 30年代、三菱総研が試算

三菱総合研究所は、生成AIの活用による日本の産業へのプラス効果が2030年代に年21兆円規模になると試算。現状の2兆4千億円から約9倍の拡大が見込まれ、特に「製造」「情報通信」「医療」などの分野で大きな効果が期待される。AI活用のための法制度整備や信頼性向上が鍵となり、現時点での業務利用率は14.6%にとどまっている。

生成AIで深刻化する「サイバー心気症」、5件に1件と言われる命に関わる誤回答でさらに悪化も

生成AIの普及に伴い、「サイバー心気症」が深刻化している。ネットで医療情報を検索し、自ら病気を疑う心理状態を指すが、質の低い情報やAIの誤答によって不安が増幅され、不要な治療や医療事故が増加するリスクがある。特に生成AIは誤回答の可能性が高く、適切な利用が求められる。

Googleの組織再編によりGeminiアプリチームがGoogle DeepMindに加わることに

Googleは、AIアシスタントアプリ「Gemini」の開発チームをGoogle DeepMindに移管すると発表。これにより、AIモデルの展開が迅速化され、効率的なフィードバックループが可能になる見込み。さらに、Googleアシスタント開発チームも別部門に統合し、ユーザー体験向上に注力。長年検索部門を率いたラガヴァン氏は退任し、後任にはニック・フォックス氏が就任する。

GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?

大規模言語モデル(LLM)は、特定のタスクで高い性能を発揮する一方、簡単な文字カウントで誤答する「ストロベリー問題」などの脆弱性がある。この問題は、トークン化による情報処理が原因で、単語を文字単位で正確に認識できないために起こる。解決策として、プログラム言語を用いることで精度を向上させる方法が提案されている。

MetaがAI向けのオープンなハードウェアについての現状と展望について語る

MetaはOpen Compute Project Global Summitで、AIハードウェアの進展を発表。「Catalina」ラックの導入や、次世代AIプラットフォーム「Grand Teton」のアップデート、スケーラブルなネットワークアーキテクチャ「Disaggregated Scheduled Fabric」の開発が示された。オープン性の原則に基づくハードウェアが、AIの潜在能力を引き出すと強調している。

サム・アルトマン氏共同創業のWorldcoin、Worldに名称変更 次世代「Orb」も披露

サム・アルトマン氏が共同創業したWorldcoinは「World Network」に社名を変更し、より高度な次世代虹彩スキャンデバイス「Orb」を発表。新プロジェクトは「World Chain」「World ID」「Worldcoin」の3つの柱を持ち、AIと人間の共存を目指す。既に1500万人が参加しており、今後さらに多くのユーザー獲得を目指す。

【6】SNS業界

YouTube動画に「カメラで撮影」表示開始 C2PAでAI不使用を明示

YouTubeは、動画が本物のカメラで撮影され、生成AIで改変されていないことを示す「カメラで撮影」ラベルの表示を開始。この表示は、C2PAをサポートするカメラで撮影した場合に適用される。C2PAはコンテンツの出所情報を埋め込む標準化技術で、AdobeやGoogleなどが参画する業界団体が推進している。

YouTubeにスリープタイマーなどの新機能が追加されてさらに便利に

YouTubeは、スリープタイマーや再生速度の細かい調整機能などを導入し、モバイル、ウェブ、TV、YouTube Musicでのユーザー体験を向上させた。スリープタイマーは設定時間経過後に動画を自動停止する機能で、再生速度は0.05倍刻みで調整可能。新しい視覚的変更やプレイリストのカスタマイズオプションも追加された。

Z世代の約9割がTikTokを活用している企業に就職活動で「好印象」

株式会社TORIHADAの調査によると、20代の約6割がTikTokを利用して就職活動の情報を収集しており、「面接対策」や「履歴書の書き方」が人気のコンテンツ。さらに、87.9%のZ世代がTikTokで情報発信を行う企業に対して好意的な印象を持っており、就職活動におけるSNSの影響力が増していることが示された。

Instagram、若者への性的脅迫に新たな対策--消える写真のスクショ禁止など

Instagramは、性的脅迫からティーンエイジャーを守るために、DMで送信された消える画像や動画のスクリーンショットや録画を禁止する新たな対策を発表。違う国に住む相手とのチャットに警告を表示する機能もテスト中。また、ヌード写真の送受信に対する対策機能を18歳未満のユーザー向けに展開する。

X(Twitter)のブロックが間もなく仕様変更、ブロック相手からも投稿を見られてしまう

X(旧Twitter)はブロック機能を変更し、ブロックした相手でも公開投稿は閲覧可能になるが、リプライなどの反応はできない仕様に。これによりブロックの効果が限定的になるため、より柔軟なブロックシステムを提供するBlueskyの利用を検討するユーザーも増える可能性がある。

【7】おすすめ動画

【遂にキタ!】素人でも自然言語でアプリ生成AI「bolt.new」が驚愕レベルなので徹底解説

誰でも自然言語でアプリを生成できるAIツール「bolt.new」の紹介と徹底レビュー。簡単な指示でフルスタックのアプリがわずか数秒で作成可能。TodoリストやECサイトなどの具体例を通じて、カスタマイズや高度な機能追加も簡単に行える点を強調。また、プロンプト作成君などのサポートツールも活用し、アプリ開発のプロセスを効率化する方法を解説。

【速報】ついにAIアバターとしゃべれる!HeyGenに新機能「Interactive Avatar」が搭載!

HeyGenの新機能「Interactive Avatar」を紹介。AIアバターが人間のようにリアルタイムで会話し、Zoom会議やカスタマーサポートに24時間対応可能。アバターには個別の知識やペルソナを付与し、オンラインでの教育やビジネスに活用できる。今後の進化が期待され、自然な会話ができる未来が近づいていると実感する内容。

ソフトバンクの生成AI活用事例第4弾 〜お客様対応の自動化 AIオペレータ機能〜

ソフトバンクの法人向け顧客対応におけるAIオペレータ機能の実装事例を紹介。従来のチャットボットの限界を超え、GPTによる文脈を理解した対話型の対応を実現。問い合わせポータルにGPT機能を統合し、問い合わせ対応の自動化を推進。ナレッジの自動生成により、AIの回答精度を向上させている。今後は画像解析を取り入れ、問い合わせ対応の進化を目指す。

生成 AI に自社独自のナレッジを生成させる方法

生成AIを活用して自社データを整理し、業務に特化した独自のナレッジを生成するベストプラクティスを紹介。AIによるデータ整備や回答生成の前に、効果的なナレッジマネジメントの方法を解説。ナレッジの収集、構造化、活用のプロセスを通じて、競争力を高める新しいアプローチを提案し、今後の展望も示す。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内や「本当にしごとに役立つプロンプト20選」ががもらえます。

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!

この記事が気に入ったらサポートをしてみませんか?