雨垂日記22~いずれ何かの役に立つ?~

こんばんは。ゴクツブシです。
最近は暑いと寒いの境界線を反復横跳びするような毎日ですね。
私は穀潰しですが、秋の花粉症も酷く、いまだにエアコンが手放せません。
花粉の関係で3シーズンはエアコン使いまくるので、電気代やばいっすわ。


Day22 過去から未来へ

先日、生成AIの無断学習・および学習結果の利用に対し声優の有志が声明を出した、なんて話題がありました。
実はこのゴクツブシ、大学院時代は生成AIの利活用に関する研究に取り組み、学会で奨励賞を貰ったことがあります。数少ない人生の自慢です。
ですが、私はそちらの道を選ばず、現在はゲーム業界の端っこで管を巻いています。

実は私が生成AIの道を選ばなかった理由はまさに、この学習周りの不透明さ(グレーさ)でした。
私が大学院を目指したのは2018年のことです。
研究テーマに関してはこの頃には概ねできており、手法を吟味しながら研究を進める段階でした。
結論から言うと、私は学習に使う学習データを全て一人で自作(4000枚の画像)しました。

セマンティックセグメンテーション画像でしたので、アノテーションが大変でした。この辺は割と今でも正気を疑われると思います。
ですが、重要なのは自作した事実ではありません。「なぜそうしたか」が重要なのです。

大量の画像を必要とすることは既往研究から分かっていたので、如何にしてデータを集めるかとした際、インターネットで集めるという案は割とすぐに却下しました。
まず第一にデータの信憑性に疑義が残るためです。
インターネットは誰でも利用できる反面、その情報の信憑性は著しく低いです。特に画像は引用参考文献がまず無く、物によっては正否を判断できません。
第二に著作権の問題がありました。
私が所属していた研究科では『デザイン系』と呼ばれる教授も多く、インターネットの画像を使うときはかなり著作権を気にされました。
私は最初、成否の判断ができる物ならインターネットの画像が使えた方が便利だろうと考えていましたが、意見を交わすうちに使わない方が賢明であると考えを改めました。

その後実際に研究を進めていく中で、最新の生成AIに関するニュースをみたり、既往研究を深く追求していくと、他業種に持ち込まれた時ハレーションを起こすと確信できてしまいました。
「人類に生成AIはまだ早すぎる」というのが大学院時代の私の結論でした。

そして、私がいた分野はどちらかというと『他業種』側でした。
だからこそ、すっぱりと生成AIに関する研究から手を引き、ゲーム業界を目指せました。

ゆえに、近年の生成AIをめぐる議論を見る度に、正直こう思うわけですよ。
「有識者はなにをやっていたのか。2019年には一介の院生程度でもこの事態は予測できていたぞ」、と。

今の日本の対応や姿勢をみると、やはり口を極めて罵りたくなります。
なぜ、問題が顕在化してからでないと議論できないのか。
まぁ、この辺はゲーム業界も同じですけどね。どこの業界も一緒です。

願わくば、早期に他者の権利を侵害するであろう利用を規制して欲しいものです。


TO BE NEXT

この記事が気に入ったらサポートをしてみませんか?