見出し画像

AIの生成結果はママのおにぎり位手作業


AIトレーニングの手作業とその奥深さ

最近AIをトレーニングしています。
AIのトレーニングにもいろいろあると思うのですが
私がやっているのは日本語でのAIの出力例をチェックして
文法や内容や文化的背景に誤りがないかチェックするというもの。

今までは私もユーザの立場だったので
魔法みたいに生成結果が出てくることにうっとりしていたのですが
実は魔法でもなんでもなくて
誰かがめちゃくちゃ泥臭く手作業で文章を直したり
テストをしたものだということが分かり
それ以降AIの生成結果を見るとお母さんのおにぎりを見ているような
気持ちにすらなるようになりました。

今回はその内容をすこーしだけご紹介します。

AIトレーニングの例

1.事実と異なる情報を修正する

例えばチェック対象のAIの生成結果が以下だとします

日本の新宿駅前にはハチ公がいます。

これは日本人であれば間違いだとすぐ気づきますね。
ただ、AIはそれを知らないので教えてあげなくてはいけません。

例えばこんな風にです

日本の  渋谷  新宿 駅前にはハチ公がいます。

ね?すごく手作業ですよね?

2.文の不自然さを修正する

こんなチェック対象の生成結果があるとします

そのお菓子は自然的な甘味です。

うん。なんだか日本語覚えたての海外の方みたいな話し方ですよね。
間違っちゃいない。間違っちゃいないけどこの文章をそのまま
ブログやビジネス資料に使うことはできないですね。
そこでAIに以下のように教えてあげます。

そのお菓子は自然的な甘みがします
そのお菓子は自然な甘さです

うん、これでコピぺして利用しても大丈夫な文章になりましたね。

AIトレーニング自体を自動化できないのか?

画像パターンを覚えこませるとか
データレイク等に貯めたデータを覚えこませるとか
そういう元々がIT化されているものについては
自動で大量のトレーニングをすることが可能です。
ただ、現在のところ
ローカルの言語の不自然さや文化的背景等を取り込むことは
人間によるトレーニングしか方法はなさそうです。
これを
RLHF(人間のフィードバックによる強化学習)
と呼びます。

AIは人間になれるのか?

AIの作成する文章は非常によくできています。
商品紹介文やマニュアルなど体系立てて何かを説明するのであれば
人間よりもAIの方が勝っていると思います。
ですが例えば「完璧に日本人の感覚を理解したAI」を作ろうとすると
それこそ赤ちゃんの時のアンパンマンから始まって
日本での学生が体験する事を全部覚えこませたり
遠慮や謙遜、本音と建て前等
「ニュアンス」みたいなものを理解させないといけません。
そもそも人間が感じ取るニュアンスとか勘みたいなもの自体が
何者かって解明されているのでしょうかね?

SF映画などでロボットにお世話される人間が描かれることがありますが
大体ネガティブなイメージで描かれていて
こんな世界から抜け出したい!というようなことを
登場人物が言うことが多い気がします。

それはロボットが人間の曖昧さや文化的背景や感情を
完璧には理解したり再現できないからだと私は考えます。
それが「人間としての温かみ」と呼ばれるものでしょう。
(そう思うと人間は自分の思いを同じレベルで
受け止めてもらいたいという欲求があるということになりますね。
耳障りの良いことだけをいうAIならいくらでも作れますが
それじゃだめで自分の発言で誰かに影響を与えたいのですね。)
どれだけAIが発達しても人間はやはり人間と関わりたいと思い続けると私は予想します。
AIと人間は得意分野や性質が全く異なるので人間がAIを恐れる必要はなくてうまく利用して共存していくものだと考えます。
あなたはどう思いますか?


いいなと思ったら応援しよう!