見出し画像

生成AIとかかわる企業

生成AIとは何か?

 生成AI(Generative AI)とは、機械学習モデルを使って新しいコンテンツ(テキスト、画像、音声など)を生成する技術を指します。

主な特徴は以下の通りです。

  • トレーニングデータから学習した確率モデルに基づいて出力を生成する

  • 入力に対して単一の正解ではなく、多様な出力を生成可能

  • ディープラーニングの発達により、近年高品質な生成が可能になった

  • 画像、音声、動画などマルチモーダルな生成にも対応が進んでいる

具体的には、以下のようなタスクがあげられます。

  • 自然言語生成(チャットボット、作文、詩作など)

  • 画像生成(イラストや風景画の生成など)

  • 音声合成(アナウンスや朗読などの音声生成)

  • 動画生成(短編映像の生成など)

  • 音楽やコードの生成

  • 新薬の開発、新薬のシミュレーション

 新薬の開発については、中外製薬のホームページなどでも書かれています。

中外製薬「AIを活用した新薬創出」

==以下、中外製薬HPより抜粋
CHUGAI DIGITAL VISION 2030の3つの基本戦略の1つである「デジタルを活用した革新的な新薬創出」について、各取り組みを紹介します。
中外製薬は、AI技術を活用して医薬品開発の成功確率向上を推進するとともに、創薬プロセスの時間やコストを大幅に短縮し、圧倒的な効率化と革新を実現します。
==

リカージョン・ファーマシューティカルズ

 私自身、余り知見が深い分野ではありませんが、新薬開発は依然として時間やコストがかかり、リスクの高いプロセスです。製薬業界はこうした課題を克服するために、人工知能(AI)、機械学習、仮想現実(VR)、自動実験を活用する方法を模索しています。

 リカージョン・ファーマシューティカルズは、バイオテクノロジー分野におけるパイオニアの1社です。2023年には、自社が持つBiohive-1スーパーコンピューターの演算能力の強化を図り、エヌビディア[NVDA]と提携しました。また、精密医療を手掛けるテンパスとも提携し、データを共有しています。

これらの提携の主な目的は、リカージョン・ファーマシューティカルズが持つ、がん治療などの高価値分野における創薬プロセスをコスト効果的に加速させることを目的とした独自のテックバイオ・プラットフォームのカバー範囲を拡張することにあります。

ここまで「リカージョン・ファーマシューティカルズ」に関する情報ソースは下記URLより
https://media.monex.co.jp/articles/-/23452

 生成AIモデルとしては、GPT、DALL-E、Stable Diffusion、WaveNet、MuseNetなどが知られています。今後もマルチモーダル対応や生成品質のさらなる向上が期待されています。

生成AIは創作の支援ツールとしてだけでなく、コンテンツ制作の自動化など、様々な分野での活用が見込まれる重要な技術分野です。

生成AIの市場動向

生成AIの市場は近年急速に成長しており、様々な分野で活用が広がっています。

主な動向としては以下のようなことが挙げられます。

  1. 画像生成AIの進化 DALL-E、Stable Diffusion、Midjourney などの画像生成AIが注目を集めています。高品質な画像を簡単に生成できるため、デザインやマーケティング、エンターテインメント分野での需要が高まっています。

  2. 文章生成AIの実用化 ChatGPTをはじめとする大規模言語モデルの文章生成能力が飛躍的に向上し、コンテンツ制作、カスタマーサポート、コーディングアシスタントなどの実用化が進んでいます。

  3. 音声合成の高度化
    AIによる自然な音声合成が可能になり、ナレーション、音声ガイド、バーチャルアシスタントなどの分野で導入が広がっています。

  4. クリエイティブ分野への浸透 デザイン、音楽、映画制作などのクリエイティブ分野で、AIがアイデア出しや作品制作のサポートツールとして活用されつつあります。

  5. 倫理的課題への取り組み AIの発展に伴い、プライバシー、バイアス、誤情報拡散などの倫理的課題にも注目が集まり、適切な運用のためのルール作りが進められています。

こうした中、生成AIの市場規模は今後も拡大が見込まれており、さまざまな産業でイノベーションを生み出すと期待されています。

DALLE-3

Stable Diffusion XL

midjourney

https://www.midjourney.com/home

生成AIの日本国内企業の取り組み



生成AIの日本国内でも生成AIの開発や事業化に取り組む企業が複数存在します。

主な競合企業としては以下が挙げられます。
○大手IT企業

・NTTグループ


自然言語処理や画像生成などの研究開発を行っています。
例として、テキストマイニングツールなどが有ります。「大量のテキストデータから効率的に知見を発掘したい、テキストを読んでまとめているが、もっと主観によらない多角的な解釈を行いたい」などテキストを利用して友好的な分析が行えるツールが有ります。

https://www.msi.co.jp/solution/tmstudio/index.html

・富士通

生成AIの研究に加え、製造業向けのデジタル化支援にも注力しています。

・日本マイクロソフト

DALL-E 2をはじめ米本社の生成AIを日本市場に投入しています。

・スタートアップ

Pixelied
画像生成AIのサービスを提供しています。

・AI搭載・自動英文校正ツールTrinka

生成AIを活用した自然言語処理サービスを手掛けています。

大学発ベンチャー

・イライザ


東大発のAI開発スタートアップです。

・アイクリスタル

名古屋大発のAI企業で、生成AIも開発しています。
さらに主要企業と大学が連携して、生成AI技術の基礎研究にも注力しています。国産の生成AIで海外勢に対抗できるよう、官民を挙げての取り組みが進められています。

今後は製品やサービスの高度化、倫理的課題への対応、人材確保などが鍵となり、企業間での競争が一層激しくなると予想されます。


各国のEUに対する規制について


主要国でこれまでに以下のような法規制が策定または検討されています。

【欧州連合(EU)】

・AI法案(2023年4月提案)  高リスクAIシステムに対する 厳格な要件や人的監視義務付けを盛り込む予定。

AI法案は、AIのリスクに応じてAIを規制しており、リスクが高いほど規制が厳しくなる。容認できないリスクを伴う用途については、AI利用そのものが禁止される。禁止対象として両機関が合意したのは、欧州委が提案した、個人の行動操作、ソーシャルスコアリング(社会的行動や個人の特徴に基づく信用格付け)の運用、年齢・障がい・社会経済的状況による個人の脆弱(ぜいじゃく)性の搾取だ。加えて、欧州議会が主張した、政治・宗教・思想・性的指向・人種など慎重に取り扱うべき特性を利用した生体分類システムの運用、インターネット・監視カメラからの無差別での顔画像の収集、職場・教育機関での感情認識技術の利用、個人に対する予測的取り締まりの一部も禁止される。顔認証などの遠隔生体認証技術の公共の場でのリアルタイム利用については、欧州議会は全面的な禁止を求めたが、最終的にはEU理事会の要求どおり、セーフガードを追加することで、被害者の捜索やテロ防止などの限定的な状況において認められる。

【アメリカ】


・AI権利章典(米国) AIシステムにプライバシー・公平性などの権利を保証するよう求める法案。 ・AI法案各州で検討中

出典元:https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/pdf/2022_008_s02_00.pdf

国科学技術政策局(OSTP)は、「AI権利章典の青写真」を2022年10月に発表した。
⚫ AIシステムの設計、使用、導入の際の指針となる5つの原則を提示した。
• 非実用的であったり、偏見や差別につながる有害なAIが存在する中、国民が様々なサービスやリソースに公平にアクセスできる機会均等の権利の保障や、あらゆる差別・プライバシー侵害からの保護等を目的に策定された。• 5つの原則は下記のとおり(後述)。各原則について、それぞれの重要性や当該原則に期待すること、原則の実践に向けた取組みの事例が整理されている。
①安全かつ有効なシステム
②アルゴリズムから生じる差別からの保護
③データのプライバシー
④告知と説明
⑤問題発生時の人間による代替、検討、対応
• 一部有識者からは、当該章典は、法的拘束力を有していないため、AIシステムを開発する企業等に対して実効力に欠けるとの指摘もある

【日本】

・AI事業者ガイドライン  企業に人権デューデリリジェンスを求める指針。
□経済産業省URL AI 事業者ガイドライン(第 1.0 版) 別添
https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/pdf/20240419_3.pdf
□総務省 
 AI事業者ガイドライン (第1.0版) 概要
https://www.soumu.go.jp/main_content/000943080.pdf


【中国】


・グローバルAIガバナンスイニシアチブ
AI技術の発展を「経済・社会の発展や人類文明の進歩に大きな影響を及ぼし、世界に莫大なチャンスをもたらす」と評価する一方、「予見し難いリスクと複雑な課題ももたらす」と指摘した。

各国で多少のアプローチの違いはあるものの、生成AIを含むAIシステムに対し、一定の規制やガバナンスの枠組みを設けようとする動きが見られます。今後、技術の進展に合わせて、法整備がさらに進むものと予想されます。

生成AIのエコシステム

第1層 化学、半導体

日本国内の主要な化学・半導体企業

日本国内企業の主な化学企業としては、

  • 三菱ケミカル

  • 住友化学

  • 旭化成

  • 東レ などがあげられます。これらの企業は有機EL材料や高分子材料、液晶材料など、AIチップ製造に不可欠な素材を供給しています。

半導体企業では、

  • 東芝

  • 日立製作所

  • ルネサスエレクトロニクス

  • ソニーセミコンダクタソリューションズ などが代表的です。これらの企業はCPUやGPU、メモリなどのAI向け半導体を開発・製造しています。

特に東芝とルネサスは電力効率に優れたAI半導体の分野で高い技術力があり、将来の生成AIに大きく貢献すると期待されています。

その他、住友化学や信越化学工業など、高純度シリコンウェハやレジストなど半導体製造プロセス用の材料を供給する企業も重要な役割を担っています。

□住友化学のURL
 フォトレジストやアルミニウムスパッタリングターゲット、化合物半導体材料、高分子有機EL材料

このように、日本の化学・半導体企業はAI分野で欠くことのできない存在であり、今後も生成AIの発展に貢献していくことが見込まれています。

海外の主な生成AIでの化学・半導体企業

 日本国外でも、生成AIの開発に貢献する主要な化学・半導体企業が多数存在しています。

【化学企業】
・BASF(ドイツ) - 高性能ポリマー、電子材料など
・DowDuPont(米国) - 高純度シリコン、フォトレジスト材料など
・Saudi Aramco(サウジアラビア) - 精製石油化学製品

【半導体企業】
・TSMC(台湾) - 世界最大の半導体ファウンドリ
・Samsung Electronics(韓国) - メモリ、システムLSIなど
・Intel(米国) - CPU、FPGA、人工知能チップなど
・NVIDIA(米国) - GPUを中心とした AI向け半導体
・Qualcomm(米国) - モバイル向けプロセッサ、5Gチップセット
・AMD(米国) - CPU、GPUの開発 ・ARM(英国) - モバイル向けプロセッサIPの設計

 特に台湾のTSMCは7nmや5nmの先端プロセスで生産を行っており、多くの主要AIチップメーカーの製造を請け負っています。米国の半導体大手も力を入れており、IntelはAIチップ「Nervana」、NVIDIAは「Tensor Core AI」と呼ばれるGPUを投入しています。

 このように、生成AIの高度化に伴い、プロセッサ性能の向上が重要となり、先端の半導体技術を有する企業が貢献度を高めています。

第2層 インフラストラクチャー

クラウド】

  • Google Cloud Platform (GCP)

  • Microsoft Azure

  • Amazon Web Services (AWS) これらの主要クラウドプロバイダーは、AI向けの高性能コンピューティングリソースやサービスを提供しています。

【専用AIハードウェア】

  • Cerebras Systems

  • SambaNova Systems

  • Groq これらのスタートアップ企業は、生成AIに特化した大規模チップやシステムを開発しています。

【サーバー】

  • Dell EMC

  • Hewlett Packard Enterprise (HPE)

  • Lenovo

  • Supermicro

【ネットワーク機器】

  • Cisco Systems

  • Juniper Networks

  • Arista Networks

【ストレージ】

  • NetApp

  • Pure Storage

  • Dell EMC

【FPGA/ASIC】

  • Xilinx

  • Intel (Altera)

【冷却ソリューション】

  • CoolIT Systems

  • LiquidCool Solutions

このように、生成AIのインフラは幅広い企業によってサポートされています。特にクラウドプロバイダーと専用AIハードウェアベンダーの役割が重要視されつつあります。これら企業の技術革新が生成AIの高度化を下支えしています。

第3層  生成AIの開発に役立つライブラリ

生成AIの開発に役立つライブラリやフレームワークを提供している主な企業は以下のとおりです。

  • NVIDIA

    • CUDA-X AI(cuDNN、TensorRTなどのAI向けライブラリ群)

    • RAPIDS (データ分析ライブラリ)

  • Meta(Facebook)

    • PyTorch (深層学習フレームワーク)

  • Google

    • TensorFlow (機械学習フレームワーク)

  • Microsoft

    • Microsoft Cognitive Toolkit (CNTK)

    • NNI (Neural Network Intelligence)

  • Amazon

    • AWS Deep Learning AMIs

    • Amazon SageMaker (機械学習開発環境)

  • IBM

    • IBM Watson Studio

    • PowerAI

  • Intel

    • Intel Distribution of OpenVINO toolkit

    • Intel AI Analytics Toolkit

  • AMD

    • ROCm (GPUコンピューティングプラットフォーム)

  • Xilinx

    • Vitis AI

特にNVIDIAのCUDA-X AIとMeta(Facebook)のPyTorchは、生成AIなどのディープラーニング分野で幅広く使用されているライブラリやフレームワークとなっています。

また、Google、Microsoft、Amazon、IBMといった主要クラウドプロバイダーは、自社のクラウドAIサービスと連携したライブラリやツールを提供しています。

このように、ハードウェアベンダーからクラウド企業まで、さまざまな企業が生成AI開発を支援するライブラリ、ツール、プラットフォームを提供しており、AI開発者はこれらを活用しながらモデルの構築を行っています。

第4層 Learning Model

・OpenAI Generative AI Deep Learning Model
・Reinforcement Learning Model
Generative models

Generative modelsについて教師なし学習を伴う生成アルゴリズムは、データ点の分布をモデル化し、与えられたデータ点が特定の空間に現れる確率P(x,y)を予測することを目的とする。生成的コンピュータビジョンモデルは、それによって、「車のように見えるものは通常4つの車輪を持っている 」とか、「目は眉毛の上に現れる可能性は低い 」といった相関関係を識別するかもしれない。

□Reinforcement Learning Model参考URL

第5層 生成AI ユースケース

生成AIは様々な分野で活用が進んでおり、多くのユースケースが存在します。以下、主なユースケースについて解説します。

5-1.コンテンツ制作支援

広告コピー、小説、シナリオ、詩などの文章生成
イラスト、デザイン画像、製品3Dモデルの画像生成
動画やアニメーションの部分生成
音源や曲のデータからの音楽生成

人工知能が創作の一部を支援し、効率化が期待できます。

5-2. 個人アシスタント

文章の校正、改善、要約
画像からのテキスト解説生成
動画や図解の生成による解説支援
チャットによる質疑応答・課題解決支援

個人のニーズに合わせたカスタマイズされた支援が可能です。

5-3. マーケティング支援

SNS投稿文、プロモーションコピーなどのコンテンツ自動生成
製品画像の自動生成
動画広告のシナリオ・パーツ生成

マーケティング施策の自動化や高度化に貢献します。

5-4. 教育・学習支援

講義スライド資料、テキスト教材の自動生成
学生への応答、質疑応答の自動生成
視覚教材の動画・画像生成

教材開発の効率化や個別最適化された学習支援が期待できます。

5-5. 創薬・科学研究支援

分子構造や化合物の生成による探索支援
研究論文の自動生成・要約
科学イラスト、図解の自動作成

生成AIの成長ドライバー

生成AIの成長を後押ししている主な要因としては、以下のようなドライバーが挙げられます。

GPUやTPU

  1. 計算能力と学習データの飛躍的増加 GPUやTPUなどの高性能計算リソースと、大規模なデータセットの蓄積により、より大規模で高性能な生成AIモデルの開発が可能になってきました。

新しい深層学習アーキテクチャの登場

  1. ディープラーニング技術の進化 Transformerをはじめとする新しい深層学習アーキテクチャの登場で、自然言語や画像の生成精度が大幅に向上しました。

オープンソースの普及

Stable Diffusion、DALLE-2、GPT-3など、優れた生成AIモデルがオープンソースで公開され、さまざまな応用が加速しています。

クリエイティブ産業の需要拡大

デザイン、コンテンツ制作、広告など、クリエイティブな分野で生成AIへの需要が高まっており、開発を促進しています。

AIアシスタントの実用化

ChatGPTなどの文章生成AIが注目を集め、AI助手やチャットボットの実用化につながりました。

マルチモーダル対応の進展

画像、音声、動画など、マルチモーダルな生成能力が向上し、応用範囲が広がっています。

規制やガバナンス体制の整備

倫理的課題への取り組みにより、生成AIを安全に活用できる環境が整備されつつあります。

このように、技術的な進歩と社会的ニーズが相まって、生成AIの発展が加速する要因となっています。

用語メモ

マルチモーダルとは何か? 

マルチモーダル(Multimodal)とは、複数のモダリティ(入力や出力の種類)を組み合わせた処理を指します。生成AIの文脈では、以下のようなことを意味します。

  • 入力として、テキスト、画像、音声などさまざまなモダリティを受け入れられること

  • 出力としても、テキスト、画像、音声、動画などさまざまなモーダルでの生成ができること

つまり、単一のモーダル(例えばテキストのみ)に限定されず、モダリティを横断した入出力処理ができる生成AIのことをマルチモーダル生成AIと呼びます。

例えば、以下のようなユースケースがあげられます。

  • 画像とテキストの両方を入力し、その内容に基づいてストーリーを生成する

  • 音声を入力し、その内容に沿った画像や動画を生成する

  • テキストや画像を入力し、それらを組み合わせた解説動画を生成する

単一モーダルに比べ、入出力の自由度が高く、より高度で実用的な生成が可能になります。しかし同時に、モーダル間の関係性を適切に捉えるモデル構築が課題となります。

マルチモーダル生成AIは、AI技術の発達により今後さらに注目が集まる分野で、様々な産業でのイノベーションにつながると期待されています。

マルチモーダルとは何か?(atmark itより)

マルチモーダルAIMultimodal Artificial Intelligence)とは、テキスト/画像/音声/数値など複数の種類のデータ(=モダリティーModality*1)を一度に処理できる統合されたAIモデル(基本的にはニューラルネットワークのモデル)を指す。また、複数のモダリティーから学習することはマルチモーダル学習Multimodal Learning)とも呼ばれる。


この記事が気に入ったらサポートをしてみませんか?