AIは野球を知らない(生成AIによるストックフォト汚染)
縫い目が過剰な野球のボールにギョッとする
Adobe Stockで高校野球関連の写真素材を探そうとしてギョッとしました。縫い目が明らかに変な気持ち悪いボールが転がっていたんです。
こんな変なボールが実在するわけないので、画像生成AIで作られた画像に違いないと確信しました。Adobeが提供する素材サービスのAdobe Stockには、AIで生成された画像素材も登録されています。調べてみるとやはり、このおかしなボールはAI生成画像でした。
AI生成画像を使いたくない場合には、検索結果からAI生成画像を除外するよう設定できます。意図してAI生成画像が必要なとき以外は、除外して表示するようフィルタリングしておくのがよいでしょう。
そのときは、AI生成画像を除外して探すことで、使いたい素材を見つけることができました。しかし、あの縫い目過多のボールのことがずっと心の片隅に残っていて、AIは野球に関するどんな画像を生成しているのか興味が湧いてきました。
ちなみに以下は野球のボールの作り方の解説動画です。2枚の革を縫い合わせて作られている構造がよくわかります。画像生成AIはこういった理屈を学んで知識をベースに画像を作ることはできないんですよね。
画像生成AIは野球に関する写真やイラストなどを生成するのが苦手
画像生成AIは、野球に関する写真やイラストなどを生成するのが苦手なんだろうと推測しました。
画像生成AIはそれっぽい画像を作るのは得意ですが、野球の知識はなにも持っていません。バットを持つとき右手が上か下か、投球の時にどっちの足を踏み出すか、などの決まり事を理解してはいないのです。
Adobe Stockで「AI生成画像のみ」で野球に関する画像を検索すると、どう考えても「野球のこと知らんやろ」と突っ込みたくなる画像が次々と出てきます。
以下、Adobe Stockで見つけた画像をいろいろ紹介します。Adobe Creative Cloudユーザーは、Adobe ExpressでAdobe Stockの素材を使えるので、Adobe Expressで文字を追加して書き出した画像を掲載しました。
↑ 右打ちっぽいけどバットの持ち方は左打ちな長髪高校球児
↑ 一見それっぽい画像だけど、やっぱりバットの持ち方が逆。
↑どこからツッコんだらいいのか謎の多い球場
↑ 質感はいいけどボールの縫い目もバットの形状も微妙。
↑ シンプルに妙な6本指グローブ。
↑ おもいっきりキャッチャーに向かってバット振ってますし、後ろに選手がたくさんいて球場の構造が謎です。
↑ 迫力はあるけどオールを漕いでるみたいな手の動き。
↑ こっちも迫力はすごいけど、動きは無茶苦茶。上半身と下半身がありえない繋がり方しています。
↑投球フォーム、投球の方向、球場の構造、後ろの人たちといろんな違和感が集合しています。
画像生成AIの性能を向上させるために、最後は人間によるフィードバックが必要となってきます。野球に関する画像が正しく生成される可能性を高めるには、野球に特化して人間がAIを鍛えてあげる必要があるはずです。野球に関する画像のクオリティを上げることは優先順位がまだ低く、そこまでチューニングしている画像生成AIはないということなんだと思います。
わたしの感覚では、Adobe Stockに登録されている野球に関するAI生成画像の95%は、利用したくないなと思う違和感ありありのインチキ野球写真&イラストでした。
ストックフォトサービスがAI画像で汚染されていく
こういった明らかにおかしな画像でストックフォトサービス/画像素材サービスが汚染されていることには、非常に問題意識を感じます。
今後、AIが作ったインチキ野球画像が大量に出回り、それらをAIが機械学習のデータとして使うようになると、「汚染」がどんどん拡大していくはずです。未来人が野球という過去のスポーツを取り上げるときに、AI生成の間違った野球写真を紹介するかもしれません。
ただ、わたしは「だから画像生成AIはダメなんだ」と言いたいわけではありません。画像生成AIに関する問題のほとんどは人間の問題だとわたしは考えています。ストックフォトサービス/画像素材サービスの「汚染」も、人間のせいです。
AIは人間が使う道具です。へんな野球ボールをAIが生成したことが問題なのではなく、それをOKと判断してストックフォトサービス/画像素材サービスに掲載した人間側に問題があるのです。それを掲載OKと認めたサービス(の中の人間)側にも、もちろん責任の一端はあるでしょう。
最新の画像生成AIでも野球の画像は苦手か?
最後に、最新の画像生成AIでは野球の画像のクオリティが上がっているのかテストしてみました。「FLUX.1」が利用できるX(Twitter)の「Grok-2」と、Googleの「ImageFX」を使ってボール、バッティング、ピッチングの画像を作ってもらいました。
野球ボール
↑ XのGrok-2で作った野球ボール画像。なかなかいい線いっていますが、一部縫い目が途切れたり乱れたりしています。縫い目の位置もまちまちで統一されていませんし、本物のボールとはちょっと違うものばかりに見えます。
↑ こっちはGoogleのImageFXで生成した野球ボール画像。一見問題ないように見えますが、余計な縫い目が入っている球もあります。また、じっくりひとつずつ見ると、縫い目の位置が完璧というボールはそれほど多くないようです。
バッティング
↑ Grok-2で作ったバッティング画像。バットを持つ手が微妙ですし、完全にバッターボックスからはみ出しています。
↑ こっちの画像はバットを持つ手は問題ないですが、左足がバッターボックスからはみ出しすぎなのが惜しいところ。
Grok-2の作る野球画像は、メジャーリーグっぽくないものばかりですね。
↑ そして、ImageFXで作ったバッティング画像。バットの持ち方は1/2の確率で正解です。バッティングのシーンとしてふさわしいのは左下だけかな。
ImageFXの作る画像はメジャーリーグっぽいものが多く、人物写真としてのクオリティはやはり高いと感じます。
ピッチング
↑ Grok-2で作ったピッチング画像。ぱっと見いい感じですが、腕に違和感があるような…。ピッチャープレートから足が離れてしまっています。
↑ 3塁への牽制球、しかもフェイク(ボール持ってない)
↑ ImageFXで作ったピッチング画像。投げる手と同じ足を踏み出すという、ミスのお手本のような間違いをしています。