2024年のAIの状況を説明する15のグラフ
みなさんこんにちは!
今回は、”IEEE Spectrum”記載のAI関連記事を要約してみました。
ようやくと言うべきか、最近になりLLMや画像生成といったものが日本に浸透してきましたね。この次は、動画生成AI?音楽生成AI?。といった具合にわたしのような俄かAI信者は語るでしょう。
そんな人に、”AIってどんな状況なの?”と聞かれても中々答えられないのではないでしょうか。
そこで今回は、わたしのような俄かAI信者でもわかるように、2024年4月15日に公開されたIEEE Spectrum掲載のAI と生物医学工学を担当するEliza Strickland 氏の記事で2024年のAIの状況を説明する15のグラフを要約してみました。
いまのAIはどうのような状況なのか。
そもそもAIをどう説明するのか。
あらたな視点から物事を考える力をわたしと一緒につけていきましょう。
1. 生成AIへの投資が急増
昨年、企業投資は全体的に減少したが、生成AIへの投資は急増した。今年のレポートの編集長であるネスター・マスレイ氏は、世界がChatGPTや画像生成DALL-E 2などの生成AIシステムの新しい機能とリスクに取り組む中、このブームは2023年のより広範な傾向を示しているとSpectrumに語った。「昨年の話題は、人々が[生成AIに]反応することに関するものでした」とマスレイ氏は言う。「それが政策であれ、世論であれ、あるいは投資が大幅に増加した産業界であれ」。レポートの別のグラフは、生成AIへの民間投資のほとんどが米国で行われていることを示している。
2. Googleが財団モデル競争を支配している
基礎モデルは、大規模な多目的モデルです。たとえば、OpenAI のGPT-3とGPT-4 は、 ChatGPTユーザーがコードやシェークスピアのソネットを記述できるようにする基礎モデルです。これらのモデルのトレーニングには通常膨大なリソースが必要なため、現在では業界がほとんどのモデルを作成し、学界はごく少数のモデルしか公開していません。企業が基礎モデルをリリースするのは、最先端の技術を前進させるためと、開発者に製品やサービスを構築するための基盤を提供するためです。Googleは2023 年に最も多くのモデルをリリースしました。
3. クローズドモデルはオープンモデルよりも優れている
現在、AI 分野で白熱した議論の 1 つは、基盤モデルをオープンにすべきかクローズドにすべきかという点です。オープン モデルは危険だと熱く主張する人もいれば、オープン モデルがイノベーションを推進すると主張する人もいます。AI Index ではその議論には立ち入らず、代わりに、リリースされたオープン モデルとクローズド モデルの数などの傾向に注目しています (ここには含まれていませんが、別のグラフでは、2023 年にリリースされた 149 の基盤モデルのうち、98 がオープン、23 が API を通じて部分的なアクセスを提供し、28 がクローズドであることが示されています)。
上のグラフは別の側面も明らかにしています。クローズド モデルは、一般的に使用されている多くのベンチマークでオープン モデルよりもパフォーマンスが優れています。Maslej 氏は、オープンとクローズドに関する議論は「通常、リスクの懸念を中心に展開されますが、パフォーマンスのトレードオフが意味のあるものであるかどうかについてはあまり議論されていません」と述べています。
4. 基礎モデルは超高価になった
業界が基礎モデルの分野を支配している理由は、次の通りです。大規模なモデルのトレーニングには莫大な資金が必要です。しかし、正確にはどの程度の資金が必要なのでしょうか。AI 企業がモデルのトレーニングにかかる費用を明らかにすることはめったにありませんが、AI Index は AI 研究機関Epoch AIと協力することで、一般的な推測の範囲を超えました。レポートの説明によると、コストの見積もりを出すために、Epoch チームは出版物、プレスリリース、技術レポートから収集した情報を使用して、「トレーニング期間、トレーニング ハードウェアの種類、数量、使用率を分析しました」。
興味深いことに、今日のほぼすべての大規模言語モデルの基盤となるアーキテクチャを導入したGoogle の2017 年のトランスフォーマー モデルは、わずか 930 ドルでトレーニングされました。
5. 二酸化炭素排出量も大きい
AI Index チームは、特定の大規模言語モデルのカーボン フットプリントも推定しました。レポートでは、モデル間の差異は、モデルのサイズ、データ センターのエネルギー効率、エネルギー グリッドの炭素強度などの要因によるものだと指摘しています。レポートの別のグラフ (ここには含まれていません) は、推論 (モデルがトレーニングされた作業を実行しているとき) に関連する排出量の最初の推定値を示しており、このトピックに関するさらなる開示を求めています。レポートでは、「推論のクエリごとの排出量は比較的低いかもしれませんが、モデルが毎日数千回、場合によっては数百万回クエリされると、全体的な影響はトレーニングの影響を上回る可能性があります」と述べています。
6. 米国は財団モデルでリードしている
マスレイ氏は、この報告書は「この競争の勝者を宣言する」ものではないとしながらも、公開された基礎モデルの数(上記)や、重要な技術的進歩と見なされるAIシステムの数など、いくつかの分野で米国がリードしていることを指摘している。しかし、AI特許の付与や産業用ロボットの導入など、他の分野では中国がリードしていることも指摘している。
7. 業界が新たな博士号取得者を募集
業界が生成型 AI に多額の投資を行い、多くの刺激的なモデルをリリースしているという前述のデータを考えると、これは驚くことではありません。2022 年 (インデックスのデータがある最新の年) には、北米で新たに AI 博士号を取得した人の 70% が業界に就職しました。これは、ここ数年続いている傾向の継続です。
8. 多様性に関する一定の進歩
何年もの間、AI を白人中心、男性中心から遠ざけるという点では、ほとんど進展がなかった。しかし、今年のレポートには、希望の兆しがいくつかある。たとえば、AP コンピューター サイエンス試験を受ける非白人および女性の学生の数は増加している。上のグラフは民族の傾向を示しており、ここには掲載されていない別のグラフは、試験を受ける学生の 30 パーセントが現在女子であることを示す。
報告書の別のグラフでは、学部レベルでは、コンピューター サイエンスの学士号を取得した北米の学生の間で民族的多様性が増加するという前向きな傾向も見られますが、コンピューター サイエンスの学士号を取得した女性の数は過去 5 年間ほとんど変わっていません。Maslej 氏は、「ここでやるべきことはまだたくさんあると認識することが重要です」と述べています。
9. 決算説明会での雑談
企業はAIの可能性に目覚めている。Indexは、市場情報会社Quidからフォーチュン500企業の業績発表の電話会議に関するデータを入手した。同社は自然言語処理ツールを使って「人工知能」「AI」「機械学習」「ML」「ディープラーニング」への言及をすべてスキャンした。企業の約80パーセントが電話会議でAIについて議論していた。「ビジネスリーダーたちは、この技術を使わないとチャンスを逃してしまうという恐れを抱いていると思います」とマスレイ氏は言う。
こうした雑談の一部は、CEO が流行語を並べ立てているだけである可能性が高いが、レポートの別のグラフでは、マッキンゼーの調査対象となった企業の 55%が少なくとも 1 つの事業部門で AI を実装していることが示されている。
10. コストは下がり、収益は上がる
AI が単なる企業の流行語ではない理由は次の通りです。同じマッキンゼーの調査では、AI の統合によって企業のコストが下がり、収益が上がったことが示されています。全体として、回答者の 42% がコストが削減されたと回答し、59% が収益が増加したと主張しています。
レポートの他のグラフは、この収益への影響が効率性の向上と労働者の生産性の向上を反映していることを示唆している。2023年には、さまざまな分野での多くの研究で、AIによって労働者がタスクをより迅速に完了し、より質の高い仕事をすることができるようになったことが示された。ある研究ではCopilotを使用しているコーダーを調査し、他の研究ではコンサルタント、コールセンターエージェント、法学部の学生を調査した。「これらの研究はまた、すべての労働者が恩恵を受けるものの、AIは高スキル労働者よりも低スキル労働者を助けることを示しています」とマスレイ氏は言う。
11. 企業はリスクを認識している
今年、AI Index チームは、企業が責任ある AI についてどう考えているかを理解するために、収益が 5 億ドル以上の企業 1,000 社を対象に世界規模の調査を実施しました。その結果、プライバシーとデータ ガバナンスが世界中で最大のリスクと認識されている一方で、公平性 (アルゴリズムの偏りという観点から議論されることが多い) はほとんどの企業でまだ認識されていないことがわかりました。レポートの別のグラフは、企業が認識しているリスクに対して対策を講じていることを示しています。地域を問わず、大多数の組織が、関連するリスクに対応して少なくとも 1 つの責任ある AI 対策を実施しています。
12. AIはあらゆる面で人間に勝てるわけではない...まだ
近年、AI システムは読解や視覚的推論など、さまざまなタスクで人間を上回っており、Maslej 氏は AI パフォーマンスの向上ペースも加速していると指摘しています。「10 年前は、ImageNet のようなベンチマークがあり、AI 研究者は 5 ~ 6 年はこれに頼ることができました」と同氏は言います。「現在、競技レベルの数学の新しいベンチマークが導入され、AI は 30 パーセントから始まり、1 年で 90 パーセントに達します」。人間が AI システムを上回る複雑な認知タスクはまだありますが、来年はそれがどうなっているか確認しましょう。
13. AIの責任に関する規範の策定
AI企業が大規模なモデルをリリースする準備をしている場合、そのモデルをその分野で人気のあるベンチマークでテストするのが標準的な方法であり、これによりAIコミュニティは技術的なパフォーマンスの点でモデル同士がどの程度匹敵するかを把握できます。しかし、有害な言語出力(RealToxicityPromptsとToxiGen)、応答の有害な偏り(BOLDとBBQ)、モデルの真実性の度合い(TruthfulQA)などを評価する責任あるAIベンチマークでモデルをテストすることはあまり一般的ではありませんでした。しかし、これらのベンチマークでモデルをチェックすることが責任ある行動であるという認識が広まりつつあり、状況は変わりつつあります。ただし、レポートの別のグラフは一貫性が欠けていることを示しています。開発者はさまざまなベンチマークでモデルをテストしているため、比較が難しくなっています。
14. 法律はAIを促進すると同時に制限する
AI Indexによると、2016年から2023年の間に、33か国が少なくとも1つのAI関連法を可決しており、そのほとんどは米国と欧州で発生しており、合計で148のAI関連法案がその期間に可決されている。Indexの研究者らはまた、法案を、国のAI能力を強化することを目的とした拡張法と、AIのアプリケーションと使用に制限を課す制限法に分類した。多くの法案が引き続きAIを推進している一方で、研究者らは世界的に制限的な法律制定への傾向があることを発見した。
15. AIは人々を不安にさせる
この指数の世論データは、 AIに対する態度に関する世界規模の調査から得たもので、31カ国の22,816人の成人(16歳から74歳)から回答を得ている。回答者の半数以上がAIに不安を感じると答えており、前年の39%から増加している。また、回答者の3分の2が、今後数年のうちにAIが日常生活を大きく変えると予想している。
マスレイ氏は、この指標の他のグラフを見ると、人口統計によって意見が大きく異なっており、若者はAIが自分たちの生活をどのように変えるかについて楽観的な見方をする傾向があると指摘する。興味深いことに、「この種のAI悲観論の多くは、西洋の先進国から来ている」と同氏は述べ、一方でインドネシアやタイなどの回答者はAIのメリットが害を上回ると予想していると述べた。
以上がStrickland 氏の記事で2024年のAIの状況を説明する15のグラフになります。
とても興味深く研究されているので確信をついた内容になっています。
これらの情報を全部理解している方はまさにAI博士です。
少しでも理解できていた方はAI精通者でこれからの時代に必要な人材といったところではないでしょうか。
どちらにせよ、知らずにAIを使っているよりかは知っていてAIを使っているということでは意味合いや深さが違ってくると思うので、ここまでこの記事を読んでくださった方はこれを機会にAIのリスキリングを行い、これからくる超AIに関わる時代に触れていきませんか?
わたしの記事では定期的にこのような配信をしてますので、気になる方がいましたらフォローをお願いします。
それでは今日はこのへんで!また、次回に。