見出し画像

【ざっくり解説】画像生成AIの進化

先日札幌に出張をした際に、以前から気になっていた「画像生成AI」についての書籍を読みました。
昨今ChatGPTやBingなど次世代AIサービスが話題でしたので、改めて勉強し直したのでまとめます。

電子書籍版

本記事は、キホンの「キ」くらいの情報ですので、興味を持たれた方は、以下の書籍を読まれることをお勧めします。

参考文献:図解ポケット 画像生成AIがよくわかる本
著者:田中秀弥 監修:村松雄太
出版社:秀和システム

【画像生成AIの概要】

画像生成AIとは、機械学習技術を利用して、自動的に写真やイラストなどの画像を生成する技術です。
例えば、「犬の画像を生成してください」という指示に対して、AIが犬の外見の知識をもとに、実際に存在しない新しい犬の画像を生成します。

この技術は、GAN(Generative Adversarial Network)という枠組みを活用して実現されています。
GANは、生成器(Generator)と識別器(Discriminator)の2つのネットワークを使い、生成器が画像を生成し、識別器がそれが本物の画像なのか、生成されたものなのかを判断することで、最終的にリアルな画像を生成します。

この技術は、様々な分野で活用されています。
例えば、映像表現技術や広告のクリエイティブ、3Dモデルの自動生成など、多岐にわたります。 しかし、時には生成された画像の品質に問題が生じることもあります。

また、著作権の問題や、社会的に望ましくない画像の生成など、様々な問題点も指摘されています。 今後、画像生成AIの技術が発展すれば、より高品質なリアルな画像が生成されることが期待されます。しかし、社会的な影響についての議論も進める必要があります。

【画像生成AIの歴史】

1970年代:画像AIの基礎となるプログラムが開発される
1980年代:シンプルな形状の画像生成が可能になる
1990年代:アルゴリズムが登場(分類・処理能力の飛躍)
2000年代:条件付きGANの登場(本格的な画像生成AI研究開始)
2010年代:Googleが「Deep Dream」を発表
2020年代:Web3.0・ChatGPT登場 画像生成AIの飛躍

簡単にまとめるとこんな感じですが、一般的には、
第一次AIブーム:「推論」と「探索」の時代(1950年~1960年)
第二次AIブーム:「知識」の時代(1980年代)
第三次AIブーム:「機械学習」の時代(2000年代)
と言われています。

【画像生成AIの使用方法】

初めて画像生成AIを体験する方には、OpenAIが提供している「DALL・E2」がおすすめです。
理由は、
①商用利用OK
②画像生成処理をする画面がシンプルで使いやすい
③画像生成のためのクレジットが毎月割り当てられる

以上の3つが挙げられます。

アカウント作成は、
①メールアドレス
②マイクロソフトアカウント
③Googleアカウント
のいずれかがあれば簡単に作成可能です。

【画像生成AIの問題点】

画像生成AIを活用するうえで、大きく2点の問題があると考えています。

①日本語と英語の違い

日本語は「余白が多い言語」と言われています。日本独特の文化でもある「察する」ということを前提にした表現が多く使われています。
一方、英語には一切余白の表現がありません。伝えたいことを100%言語化して伝えなけば、相手が察してくれることはなく、伝わりません。

この言語の特性の違いから発生しているのが「画像生成AIに対して正しく指示ができない」という問題です。

まだまだ多くの画像生成AIサービスが「英語のみ」の対応となっています。
英語が堪能な人は別にして、多くの日本人は日本語をネット上で翻訳し、翻訳した指示をAIに送っています。

そうすると、日本語から英語に翻訳される際に「意図」や「ニュアンス」が削ぎ落されてしまい、上手く指示が伝わらなくなってしまいます。

日本語対応のサービスも徐々に開発されているので、これからの発展をぜひ期待したいところです。

②著作権侵害の危険性

生成AIに関した「著作権問題」は多くの報道機関で連日報道されていますが、2023年5月30日に内閣府が発表した「AIと著作権の関係等について」という資料で、学習及び生成物と既存作品の著作権の関係に対する見解が明らかにされました。

文化庁・資料

「AI開発と学習段階」と「生成・利用段階」における著作権法の適応条文が異なるため、分けて考える必要があるというような基本的な考えかたが記載されています。

【まとめ】

画像生成AIは、誰もが簡単に高品質で汎用性の高い画像を瞬時に作成できるという利便性がありますが、一方で著作権侵害等の問題も孕んでいます。
私たちがビジネスで活用する上では、正確な知識とリテラシーを持って使用しないと、時にトラブルに巻き込まれてしまいます。

より具体的な知識は専門書から学ぶのをお勧めします。
秀和システムさんの「図解ポケット」シリーズは画像や図版なども交えながら、体系的に理解することができるので助かりました。
また、この手の読み物は聞きなれない単語が頻出することで読みにくくなりますが、書籍内に用語集がついていることも嬉しいポイントです。

以上です。
皆様のビジネスに役立ちましたら幸甚です。
「スキ」「フォロー」を頂けましたらとても励みになります。


いいなと思ったら応援しよう!

この記事が参加している募集