見出し画像

2024/6/12のIT・AIニュースピックアップ!

【新技術】 2024-06-12 03:10:00 New algorithm discovers language just by watching videos

MIT博士課程学生のMark Hamiltonは、機械を使って動物のコミュニケーションを理解したいと考えています。その目的のために、「DenseAV」と呼ばれるシステムを開発しました。このシステムは、映像と音声の関係を学習することで、言語を「ゼロから」学習しようとするものです。具体的には、DenseAVは何百万もの動画に対して、その音声と映像の関係を照合することで、言語の意味を学習します。例えば、「ケーキをオーブンで350度で焼く」という音声を聞いた際に、ケーキやオーブンといった映像要素を見つけ出すことができます。このように、DenseAVは音声と映像の関係性を学習し、単語の意味を発見していきます。

興味深いことに、DenseAVは単語の意味だけでなく、単語と音声の違いも学習することができます。例えば、「犬」という単語と犬の吠え声の違いを理解することができるのです。これは、DenseAVが「二つの脳」を持っていることによるもので、一方は言語処理、もう一方は音声処理を担当しています。DenseAVの応用例としては、YouTubeなどの膨大な動画コンテンツから学習することや、文字記録のない動物のコミュニケーションの理解などが考えられます。特に後者については、DenseAVが新しい言語の発見に役立つ可能性があります。

DenseAVの開発にあたっては、言語モデルなどの事前学習された知識は一切使用せず、まさに「ゼロから」の言語学習を目指しました。そのために、音声と映像の情報を完全に分離し、対照学習によって言語の特徴を学習させる手法を採用しています。これにより、DenseAVは細かな詳細まで把握することができ、従来のモデルよりも優れた性能を発揮することができます。

動画からのゼロからの言語学習!たしかに赤ちゃんはそうやって言語を獲得するはずなので、このアプローチが上手くいったら人間の言語の獲得についても理解が深まるかもしれません。また、動物とのコミュニケーションが取れるようになったら楽しいだろうなあ。
MITのブログを購読しているのですが、結構面白い研究が多くておもしろいです。
--------------------------------

【セキュリティ】 2024-06-12 12:46:00 ランサム攻撃の被害相次ぐ、5月下旬から各所で 企業だけでなく自治体、病院にも影響


例えば5月20日には、岡山県精神科医療センターが電子カルテなどに不具合が起きたと発表。後にランサムウェア攻撃が原因だったと明かした。6月11日には、患者情報約4万人分や、会議の議事録が漏えいした可能性があることも発表した。

5月29日には、システム機器の製造販売を手掛けるイセトー(京都市)が、ランサムウェア攻撃の被害を発表。追って、同社に事業を委託していた三井住友海上あいおい生命保険、神奈川県横須賀市、藤沢市、茅ケ崎市などが、イセトーに委託していた業務に関する情報漏えいの可能性を発表している。

6月3日には、九州電力グループで電気温水器の販売などを手掛けるキューヘン(福岡県福津市)が、第三者によるランサムウェア攻撃を受けたと発表。5日までに約10万4000件の個人情報が漏えいした可能性があることも分かった。 

6 月10日には、免震・制震装置を手掛けるオイレス工業(神奈川県藤沢市)や、ニデックグループのニデックインスツルメンツ(長野県諏訪郡)、税理士法人の高野総合会計事務所などからなる高野総合グループ(高ははしごだか)などがランサムウェア攻撃の被害を発表した。

こんなに多くの企業でランサムウェア攻撃の被害を受けているのですね。ニコニコ動画も激しい攻撃にあったというニュースがありました。
セキュリティの問題は年々重要度を増しています。
--------------------------------

【ロボットとAI】 2024-06-12 13:00:00 Researchers use large language models to help robots navigate

この研究は、ロボットが言語に基づいて視覚情報を処理し、ユーザーの指示に沿って目的地まで移動する方法を提案しています。従来の手法では、画像の特徴量を直接使ってナビゲーションを行っていましたが、大量の視覚データが必要でした。一方、この研究では、ロボットの視点を表す言語キャプションを生成し、それを大規模言語モデルに入力することで、効率的にナビゲーション行動を学習できるというアプローチを取っています。


具体的には、まず簡単な画像キャプション生成モデルを使って、ロボットの視点を表す言語キャプションを生成します。次に、その言語キャプションと、ユーザーからの言語指示を大規模言語モデルに入力することで、次のナビゲーション行動を予測します。この行動の予測結果は、ロボットの移動履歴を更新するためにも使われます。

--------------------------------

【ニュース】 2024-06-12 14:00:00 Samsungが元Apple幹部を責任者とするAI特化の研究センターを新設

SamsungがAI研究に特化した北米の2つの研究センターを統合し、この新しいAI研究センターの責任者に元Appleの幹部を起用する予定であることが報道により明らかになりました。

--------------------------------

【AIと法律・規制】 2024-06-12 18:18:30 アップルやグーグルら大手IT規制 スマホソフト競争促進法が成立


スマートフォンのOSやアプリストアなどを手掛けるGoogleやAppleら、大手テクノロジー企業を規制する「スマホソフトウェア競争促進法」が、12日の参議院本会議において可決、成立した。
スマホソフトウェア競争促進法(スマートフォンにおいて利用される特定ソフトウェアに係る競争の促進に関する法律案)は、スマートフォンが国民生活や経済活動の基盤となっている中で、そのOSやアプリストア、ブラウザ、検索エンジンなどの「ソフトウェア」における市場競争環境の確保を狙うもの。

この記事が気に入ったらサポートをしてみませんか?