生成AIの活用が進む画像や言語。グローバルな技術の進展や動向についての勉強会を開催
DEEPCOREは、Generative AI領域の最新動向についてのメディア向け勉強会を開催しました。
はじめに、代表の仁木よりDEEPCOREのファンド概要や2号ファンドクローズについて、投資先スタートアップや、AI技術者・研究者・起業家のためのコミュニティ「KERNEL」について説明しました。
2号ファンドクローズについては、プレスリリースもぜひご覧ください。
続いて、CFOの雨宮より、Generative AI領域の最新動向についてお話ししました。
Generative AI(生成AI)は、コンテンツやモノについてデータから学習し、それを使用して創造的かつ現実的な、まったく新しいアウトプットを生み出す機械学習手法のこと。
勉強会の会場では、DEEPCOREの投資先のSOUNDRAW社によるAI作曲クラウドサービス「SOUNDRAW」で作成した音楽をBGMに流しました。
ここからは、発表内容の一部をご紹介します。
生成AIへの投資市況について
生成AIへの投資総額は増加傾向でしたが、2023年に入ってからも大型の調達が多数実施されています。カテゴリは画像生成ビジュアル領域と言語領域が2大領域で、直近ではヒューマン・マシーン・インターフェイス領域も拡大しています。
生成AIの“画像生成”について
画像生成エンジンは、画像の内容やスタイル等を指示するテキスト(プロンプト)を入力することで、指示に合った画像を生成します。代表的な画像生成エンジンとして、Stabiity AIの「Stable Diffusion」、OpenAIの「DALL-E2」、Midjourneyなどが広く知られており、いずれもテキストを入力すれば画像を作り出してくれます。
画像生成の技術としてこれまで広く使われていた「GAN(Generative Adversarial Network)」は、偽物の画像を生成する生成器、画像がデータセットにある本物の画像か否かを判断する識別器からなり、識別器が正解率の最大化、生成器が識別率の正解率の最小化を目指して競争する過程を通じてモデルを構築する仕組みです。
最近は、画像にノイズを加える過程を逆算することでノイズから画像を作り出すことを可能にしたモデル「Diffusion(拡散) Model」が多く使われるようになりました。
画像生成エンジンがテキストを変換し表現する技術には2021年にOpenAIによって公開された「CLIP(Contrastive Language-Image Pretraining)」という事前学習モデルが活用されています。Webから収集した大量の画像とテキストの組み合わせ(4億ペア)をデータセットとして利用し、画像とテキストの類似度を算出することで画像とテキストの結びつきを学習します。2022年にOpenAIが公開した「DALL-E2」は、「CLIP」と「拡散モデル」がベースになって作られています。
画像生成技術も進展しています。画像の端の情報を利用することで描かれていない画像の外側まで推測して周辺画像を生成する「アウトペインティング」や、画像の一部のみを別の画像に置き換える「インペインティング」機能等によって、思い通りの画像の生成がより容易にできるようになりました。
そのほか、追加学習やファインチューニングツールも発展しています。例えば、「ControlNet」はStable Diffusionと組み合わせて最終的な出力画像をコントロールできるツールで、生成画像の人間の姿勢や構図の指定等が可能です。
「LoRa」は、生成画像に特定のキャラクターや画風を加えるための追加学習モデルです。少ない学習データでさまざまな画風が簡単に再現できるため既に多くの方に活用されています。しかし同時に、特定のクリエイターの作風を真似た作品を簡単に作り出せてしまう、という著作権侵害につながる問題も発生しています。
画像生成AIの課題について
学習データの著作権においては、ストックフォト大手のGetty Imagesが、同社画像1,200万枚以上を無断・無償で学習に利用したとしてStability AIを提訴しています。これは、サンプル画像に入っていた透かしがStability AIの生成画像上で再現されてしまっていたことから判明。米国著作権上のフェアユースにあたるのかどうかが問題になっているという事例です。
続いて、大規模言語モデル(LLM)についても、活用領域やサービス、主な企業の動向についても発表しました。
Generative AIを活用する際は、倫理的な配慮を意識することが必要です。
懸念点を考慮した上で革新を続けることにより、Generative AIの可能性を最大限に引き出し、全ての人にとって良い未来を生み出すことができると考えています。
勉強会の詳しい内容は、ご参加いただいたメディアでも記事化いただきました。
こちらもよろしければご覧ください。
2号ファンドのクローズについて
5月31日に、「DEEPCORE TOKYO2号」を総額117億円でクローズしたことを発表しました。
2号ファンドでは、Generative AIやロボティクスなど先進的技術分野に重点的に投資する予定です。AI・ディープテック領域におけるイノベーションを加速させるとともに、日本および世界の社会課題の解決に貢献するスタートアップ創出に向け、引き続き投資先企業の価値向上を支援してまいります。
▼DEEPCORE及び投資先への取材について
問い合わせフォームよりご連絡ください。
https://deepcore.jp/contact
▼採用情報
DEEPCOREで働くことに関心がある方は、以下の問い合わせフォームよりご連絡ください。