最新海外トレンド・ジェネレーティブAIが開拓する未来と、そのリスクとは?
こんにちは!Dawn Capitalインターンの八並映里香です。
本稿ではジェネレーティブAIの具体的ユースケース、使用リスクについて詳細に解説します。
【読了時間目安:7分】
なお、本稿は下記のnoteの続編となっております。
本記事単体でも独立して読めますが、ジェネレーティブAIの定義や仕組みをより詳しく知りたい!という方は、ぜひこちらもご覧ください。
前回記事に引き続き、本稿の見出し画像は『beautiful women』というワードでジェネレーティブAIが生成したものです。
リアルな顔合成ながら、どこか不自然…この画像、ひいては当該AIの特性は、本記事の内容と深く関わってきます。
ジェネレーティブAIの具体的ユースケース
ジェネレーティブAIは、具体的に何ができるのか。
以下に示した画像はセコイアキャピタルが作成した、ジェネレーティブAI市場の各カテゴリを強化するプラットフォーム層と、その上に構築される可能性のあるアプリケーションの種類を説明する概略図です。
セコイアの概略図によれば当該AIが活用されうる主な分野として、
などが代表的な使用例に挙げられます。
以下ではテキスト生成・画像作成・合成音声・動画作成に事例を絞り、そのユースケースをご紹介します。
- テキスト生成
こちらの記事では言語生成AIによって作られた『歴史上の著名哲学者の説明文』が紹介されており、AIが多少難解な内容でも文章として十分に成り立つ成果物をアウトプットできることが示されています。
実際に、AI を活用したブログ作成や広告のキャッチコピーなどのコピーライティング事業を行うスタートアップJasper.aiは、今年10月18日にシリーズAで、15億ドルの評価額で1億2500万ドルの資金調達を成功させるという勢いを見せています。
さらに『ジェネレーティブ AI の最大のチャンスは言語であって、画像ではない』と銘打たれたFobesの記事は、『世界中のすべての業界、すべての企業、すべての商取引は言語に依存している。言葉がなければ社会も経済も止まってしまうのだ。』と述べ、『言語を自動化する機能は、まったく前例のない価値創造の機会を提供する。』
としてあらゆる想定ユースケースを挙げています。
例えばテキスト文書に関する質問を要約して回答できる言語モデル機能は、法的調査・証拠開示・訴訟プロセスのさまざまな部分を変革すると述べ、法律の世界において言語生成AIが及ぼしうる影響の大きさを予測しています。
学術界では生成言語モデルは、助成金の提案書の草案作成、既存の文献の統合と調査、研究論文の執筆に使用されるとし、学生が生成言語ツールを使用してエッセイを書くというスキャンダルが間近に迫っているというユニークな見解を述べました。
他にも営業取引の記録や科学的イノベーションのプロセス、政府書簡やヘルスケア分野の医療メモ、ジャーナリズムに至るまであらゆるユースケースが想定されており、言語生成には文字通り無限の可能性が開かれています。
Forbesが予測する通り現在ではジェネレーティブAI=画像生成といったイメージが大きいですが、将来的にはテキスト生成が生産性革命の比重の多くを占めるかもしれません。
- 画像生成
ジェネレーティブAIはあるキーワードから画像を作成したり、インプットしたデータからリアルな写真を合成したりできるほか、まばらなスケッチからもリアルな写真を作成できることが中国の研究チームによって2020年に実証されました。
これは例えばデザイナーが描いたスケッチデッサンから立体的な商品画像を合成するのに役に立ち、商品開発がよりスムーズになる可能性があります。
他にも、犯罪者の目撃証言や簡素なスケッチからリアルな写真を合成することも可能になるでしょう。
それだけでなく米国の名門大学UCバークレーによるAIリサーチレポートは、
・抽象的な画像をリアルな画像に変える
・白黒写真に色をつける
・昼間の写真を夜の写真に変える
・衛星写真をGoogleマップビューに落とし込む
といった活用方法も提示しています。
これらの高度な画像生成技術を有効に使用できれば、アクセンチュアのBusiness & Technology FuturistであるDominik Krimpmann氏が示唆したように、ある病気に感染した患者の医療用スキャン画像を多数インプットして病気の発生過程をリアルに描写する合成画像を生成したり、
患者の特徴的な行動や動作パターンに基づいてオーダーメイドの義肢を設計することができます。
他にもジェネレーティブ AI を使用して衛星画像を地図ビューに正確に変換し、まだ調査されていない場所の探索のアシストに使用したり、
さまざまな角度から撮影した写真から乗客の顔写真を作成することで空港の顔識別および検証システムを変えることができるとAltexsoft社は述べています。
直近のスタートアップの動きですと、オープンソースの画像生成AI・Stable Difussionを提供するStability.aiは今年10月17日、評価額10億ドルで1 億100万ドルの資金調達を発表しており、当該事業に対する期待値の高さが伺えます。
他にもAIを駆使した新たなアート表現が人気を博すといった動きもあり、国境を超えて影響を及ぼすことのできる視覚的なアーティファクトは、これからも様々な応用をされていくでしょう。
- 合成音声・動画の生成
Altexsoftの記事およびこちらのデータサイエンス記事によると、ジェネレーティブAIは人々の声を変換・合成したり、ある音楽をクラシックからジャズスタイルに変換するというふうに音楽のスタイルやジャンルを合成したりすることができます。
例えばAmazonは、インプットした短いメロディーから完全なオリジナル曲をアウトプットできるサービスDeepComposerを提供しています。
また、ある動画やビデオゲームの特定のビデオフレームを取得し、連続するフレームがどのように見えるかを予測して新たに動画を生成することもできます。
これらの技術、そして先述した画像生成技術のコラボレーションに特に期待を寄せているのが映画業界やゲーム業界といったエンタメ業界です。
例えば顔合成・声の複製機能を併用することで、吹き替え映画における俳優の声と口の動きをあらゆる言語で一致させることができます。
さらにAIが毎秒新たにフレームを生成しノイズを除去・色を追加することで、古い画像・映画を4K以上にアップスケーリングすることも可能です。
以下は1991年に発表された名画『ホーム・アローン』を高画質化したものであり、二つ目の動画は白黒映画をカラー版に蘇らせたものです。
そして、ジェネレーティブAIの技術はゲーム業界と非常に親和性が高く、当該AIがゲーム業界をいかに変えうるかを考察した記事も発表されています。
例えばNVIDIAは画像を再構成するニューラルグラフィックス技術であるDLSSを発表し、ゲームの画面をリアルに再現しました。
いかにAIがリアルな成果物を生成できるといっても人間の手が六本指だったりと、AIが作れる画像にはまだ限界や作り物感があります。しかしゲーム上のグラフィックとしてなら、その性能を遺憾なく発揮できるかもしれません。
このようにあらゆる側面に可能性を秘めたジェネレーティブAIは、創造性や生産性に多大な変革をもたらすと予測できます。
ジェネレーティブAIが抱えるリスク
上記のように多岐に渡りその活用が期待されているジェネレーティブAIですが、様々なリスクも抱えており、その使用が危惧されています。
今回は特に話題性のある以下の3つの論点を紹介していきたいと思います。
- 創造的な仕事をしている人間が仕事を奪われる可能性
Midjourney、Stable Diffusion、DALL-Eなどの画像生成ツールにうまくキーワードを入力しさえすれば、プロフェッショナルのクリエイターと同等、あるいはそれ以上に優れたアウトプットが作成される可能性があります。
現に、AI によって作成されたアートワークが、米国コロラド州のアートコンペティションで 1 位を獲得するという事件が起き、猛烈な批判を巻き起こしました。
Jason Allen氏によって提出された受賞作品は、MidjourneyとAI ギガピクセルを組み合わせて作成されたものです。彼は300ドルの賞金を獲得し、“Art is dead, dude. It’s over. A.I. won. Humans lost.(アートは死んだんだ。終わったんだ。AIが勝ち、人間は負けた)”とコメントしました。
本件を受けてTwitter上では以下のような怒りのツイートが多く散見され、Impakterは『多くの人々は、AI によって生成されたアートは人間のアーティストの作品を脅かすものであるとして、異なる分類をすべきだと考えている。』との見解を示しました。
また、こちらの画像は、セコイアが作成したジェネレーティブAIの基本モデルと、関連するアプリケーションの進歩を予測したチャートです。
2030年時点の予測は、プロフェッショナルのライターや芸術家、デザイナーや写真家、フルタイムで働くコード開発者よりも、AIの方がより良いアウトプットを提示しうることを示唆しています。
人間の創造性をAIは完璧に模倣しうるのかまだ疑問点も多くありますが、AIが人間の仕事を削減・代替する可能性があることは十分に予測できます。
- リアルな画像・動画の生成による倫理的・政治的・司法的問題
VentureBeatは、(ジェネレーティブAIの使用による)最大の危険は、偽のニュース記事を作成し指導者や市民の政治的決定や司法制度に影響を与えることだと指摘しています。
この懸念はすでに、現実のものとなっています。
現在ロシア・ウクライナ間で戦争状態が続いていますが、これに関して、ゼレンスキー大統領が国民に降伏を呼びかけるというショッキングな内容の動画が拡散される事件が発生しました。
ディープフェイクで作成されたこの動画は肉眼でも偽物だと視認することができますが、本動画は大きな波紋を呼び、多くの人々に怒りと不安を与えました。
日本を含む各国の公共放送も、この事件を取り上げています。
他にもディープフェイクを用いたポルノ画像・動画の作成もまた問題となっており、問題は名誉毀損などの人権問題にまで及びます。
極めてリアルに近しいデータを生成できるというジェネレーティブAIの特性が、政治・司法的判断、人権といった、私たちの社会生活基盤となるシステムを脅かす恐れもあるのです。
- 著作権問題
こちらは私自身がStable Diffusion Demoを用いて『ゴッホ 猫』というキーワードで生成した画像ですが、あたかもゴッホ自身が描いたかのようなタッチのイラストが表示されています。
Walled Cultureは先日、『なぜジェネレーティブAIはアートの世界を席巻し、著作権を無意味化するのか』という記事を発表しました。
当該記事では『近い将来、誰でもどんなアーティストのスタイルで画像を作れるようになるだろう。』と述べられています。これは何を意味するかというと、ジェネレーティブAIはあるアーティストの創作スタイルを利用し、以下のような全く新しい画像を作ることができるのです。
また、同記事では、『(あるアーティストのスタイルをインプットして、AIによって作られた)画像はアーティスト自身が作ったものではないので、著作権を主張することはできない。』
として、AIで生成されたデジタル画像は著作権とは無関係になるといった見解を打ち出しています。
しかし、これはアーティストにとって悪いニュースではないというのです。
なぜなら、『あるアーティストのスタイルで無限に画像を生成できるということは、そのアーティストのオリジナルは希少性が高く、かえって価値を増すことになる』としており、アートワークのオリジナル性を担保する非代替性トークン(NFT)の重要性が増すことを示唆しています。
しかし、これとは反対の見方もされています。CNBCの記事は、
『生成 AI は膨大な量の画像で訓練されており、元の画像の作成者が元の作成者のスタイルで生成された画像に対して著作権を主張できるかどうかについては、現場や法廷でまだ議論されている。』
と述べています。
実際に、世界最大級のデジタルコンテンツカンパニーであるGetty Imagesは、Stable Diffusion などの AI アートツールを使用して生成されたイラストのアップロードと販売を禁止しました。
同社のCEO であるCraig Peters氏は「これら(ジェネレーティブAI)のモデルから出力されたアウトプットの著作権に対して深い懸念があり、画像、画像メタデータ、および画像に含まれる個人に関して未解決の権利問題が存在する」とコメントしました。
またAI のアートワークやイラストを販売するとGetty Imagesのユーザーが法的リスクにさらされる可能性があるとも彼は考えており、結果今回の決断に至ったとのことです。
Getty Images の最大のライバルの 1 つである ShutterstockもまたAI コンテンツの検索を一部制限したほか、画像コンテンツに関わる他サイト・サービスも同様の決定を下しました。
自身のスタイルを模倣された一部のアーティストからは、AI 画像ジェネレーターを規制する新しい法律を求める動きも出ています。これはアーティストのスタイルの模倣をむしろ公式で推奨するStable Diffusionのガイドと相反する動きであり、今後クリエイターがどのように保護されるかは定かではありません。
以上のように、画期的な発明とされるジェネレーティブAIは、可能性とリスクを多分に含んでいます。
私たちはこの技術をどう受け止め、どう活用していけるのか?
次回記事では、GAFAMといった大企業や、評価額15億ドルのユニコーンといった最新スタートアップの動向を追っていきます。
是非、そちらもご覧ください!
文/八並映里香
写真・クリエイティブ/池田龍之介