【BTS_V】뷔がkimになった日【自動翻訳】
自動翻訳が上手く働かない問題
最近、Xのタイムラインにある話題が流れてきました。
それはFaceBookで、BIGHIT公式のポストに書かれたハッシュタグ「뷔」が、正しく翻訳されず、「Kim」になっている、というものでした。
テテの芸名表記は英語でもハングルでも一文字なので、翻訳されないことも多いですが、このパターンは初めて見ました。
一部界隈の反応
この話題に関して発言しているツイートを読んでいたところ、憤慨した意見がいくつかあり、目を引きました。
自分が理解した範囲では、
「ポストの翻訳結果を確認せず、アーティストにとって重要な名前が正しく訳出されていない状況を放置している会社」
に対して義憤を覚えている、という意見がメインのようでした。
ああ、その考え方はなかったわ!( ゚Д゚)
また新しい扉が開くのを感じました……!
私の反応
私は最初この話を見た時、「すごい!」って興奮しましたw
ちょっと長くなりますが、理由を聞いてください。
どこに興奮する要素があったのか
そもそもテテの名前(뷔)のハッシュタグは翻訳されないことも多いです。
それは何故かと考えた場合、一番可能性が高いのは「ハングル1文字しかないから」だと思います。
ハングルは、ひらがな・カタカナと同じ、表音文字です。
日本語で「#ひ」って書いてあった場合、それが火なのか日なのかそれ以外なのか判断するには、文脈を読んで判断するしかありません。
しかしそれは難しいので、そういう場合は翻訳しない、という判断をする自動翻訳は多いです。
私の好きな対話型検索AI・Perplexityだと、「これは固有名詞だと思われるので翻訳せず残しました」って言ってくることもあります。
冒頭でも書いたようにこのケースは多いため、私はそれに慣れていました。
でも今回Kimになったわけですよね。正解に近づいてます。もっと学習が進んだら、kimtaehyungが出てくるかもしれません……!
私はこれを、従来の「難しいから置いとく」って判断から一歩踏み出した、と受け取りました。やればできる子がやる気になった!( ゚Д゚)
検索とテテ
自動翻訳と似ているシステムに、検索がありますが、文脈などで縛りが多い翻訳と違い、こちらはもっとダイレクトにやる気を見せているように思います。情報の結びつけ学習ぶりがハンパない。
沼落ちした頃、私は「V」で検索してテテが出てくることに驚き、記事まで書きました。
アルファベット1文字入れただけで、「BTSのVをご所望ですね」って反応するんですよ。アミヨロブンはもうその検索に慣れてるかもしれないけど、これってものすごいことだと思うの。
実際どういう判断でそうなってるのかは検索アルゴリズムの闇の中ですが、私は世界中のARMYが検索しまくって躾けた結果を見たと思ったんですね。
すごい物量と愛だと感動しましたし、「テテ」で検索したらVが出てくるところにも、イルアミの愛と蓄積を感じて盛り上がりました!
(思わず、検索のパーソナライズを切って確認してしまったw)
翻訳はすぐ直せるか
表題の件に関しては誤解が多いようだったので、補足させてください。
って、別に私はその筋の技術者ではないので、疑問を持った方はご自身で検索していただければと思います。
検索や翻訳の仕組み
現代の検索や翻訳システムは、技術者が設計したアルゴリズム(例:検索エンジンの基礎仕様)とAI学習を組み合わせて使用しています。
アルゴリズムの動作は予測しやすいですが、AIの判断プロセスは非常に複雑で予測が難しく、時に謎めいています。発達した科学は魔術と見分けがつかない、という言葉を思い出しますね。
「뷔」が「Kim」と訳出された件に関しても、翻訳システムが大量のデータを基に学習し、文脈を理解しようとした結果です。
ただ、この内部プロセスは「ブラックボックス」と呼ばれ、開発者でさえ完全には把握できないため、何故そういう学習をしたのかはわかりません。
逆に言うと、翻訳システムを操って推しに嫌がらせをすることもできません。できたらその人はテテの名前どころか歴史を変えられますので、早く名乗り出てください。
何故翻訳結果を直せないのか
翻訳エンジンはAIを利用した複雑なシステムで、多くの要素を考慮して翻訳を行います。単純な誤訳に見えても、それは結果を導き出したシステム全体の判断結果なのです。
私の脳細胞やニューロンを一か所弄ったからって、私の中からテテの記憶だけを消すことはできないですよね。下手をしたら、脳そのものが死にます。
それと同じで、ここを直せと言って直るものではないんです。
通常、改善はシステム全体の再学習や大規模な更新を通じて行われますので時間がかかります。
ユーザーとしては、システム側に評価を送ってフィードバックし、システムの進化を待つしかありません。
余談ですが、韓国語記事の方が自動翻訳が変になりやすいのは、翻訳エンジンが英語ベースだからだと思われます。
韓国語→英語→日本語って一回英語経由してるから、訳が歪みやすいのです。英語ページや英語に近い言語は結構きれいに翻訳されるなと思いませんか?
待ち受ける課題
私はAIとかが好きなのでウキウキしてますが、当然そこには課題があります。タイムラインで拝見したご意見を参考に、どんなものがあるか考えてみましょう。
文脈を理解した訳出が望まれる
今回の「Kim」は過渡期感が満載で、訳として見たら明らかに誤りです。「뷔」を「Kim Taehyung」として訳出することは必ずしも正解ではないということまで含めて、学習してくれるといいんですけどね。
BIGHIT公式のツイートだということを読み取って「V」にするだけの察知力が欲しい。まだまだ文脈の理解が不足していますね。頑張れ!
これを避けたい場合、一番簡単なのはしばらくハッシュタグを「#V」にしておく、でしょうか。
ただ過去のポストを全部編集し直すとかは現実的じゃないので、効果としては大きくないため、直るまで静観もありだと思います。
名前の翻訳不統一は不利益を与えるか
今回の場合、起きた現象は
「FaceBookで自動翻訳を使った場合のテテの名前のハッシュタグの表記」
と影響範囲が狭いため、そこまで不利益は生まないんじゃないかと思った私は、自動翻訳の誤訳に慣れきっていますね( ゚Д゚)
私イルアミだから、「テテ」呼びに馴染みすぎてて「V」に表記統一しようと思ったことがない、というのもいかんかもしれません。
「뷔」が自動翻訳で一時的に「Kim」になっても原文は変わらないので、検索ヒットするのはそっちですし、自動翻訳の誤訳を許さない警察を出動させた場合、グクペンは「政局」に、SUGAペンは「菅首相」に憤慨しなければなりません。ジミン党もいっとく?
アーティストではないのですが、PdoggPDは自動翻訳でしょっちゅう「被毒」になってて驚きます。字面がPoisonedすぎるのよ……。
多少の不利益があったとしても、それは自動翻訳の巨大なメリットを享受する代わりに受け取るデメリットであり、比較したらメリットが大きすぎるので皆が無視してるとこじゃないでしょうか。
AIの学習モデルは頻繁に更新されるんで、永久に「Kim」なわけじゃない、という点に期待しつつ評価FBしましょう。グローバルアイドルって難しいなあ。
事務所はテテのために何かすべきか
あ、これ私の発想になかったやつです。翻訳システムと事務所が結びつかなかったので。
事務所は誤訳を直すべき説
翻訳品質はシステム開発の責任だから、FaceBookに頑張ってもらいたいですね! ユーザーは頑張って評価フィードバックしよう派です。
事務所はFaceBookに修正依頼すべき説
修正依頼されても、ピンポイントで直せないから……( ;∀;)
万が一修正できたとしても、それがバレたら他の企業も絶対言ってくるから、私が開発者なら受け入れないです。
事務所は投稿の訳出結果を確認すべき説
必要性と人的リソースの関係から、厳しいですね。重要なお知らせだけ英語対応してもらえればいいかな……。
他にも色々あったのですが、とりあえず皆「テテのために何かしてほしいし、してあげたい」んだなあということが伝わってきました。
じゃあそのエネルギーで、スミン・ミュス大会いきましょうか!
未来に期待
翻訳や検索のアルゴリズムが今後どう進化するかは想像するしかありませんが、今回の「Kim」事件には新しい可能性を感じてワクワクしました。技術の進化って面白いですね!
それにしても、もし画像検索も自動翻訳もない時代にバンタンにハマっていたらと考えると震えます。死ぬ気で韓国語習得するしかないわ……。
AI学習には謎めいた挙動も多いですし、まだまだ発展途上ではありますが、その恩恵は図り知れません。
今この瞬間にバンタン落ちできていて本当によかったと、世界に感謝せずにはいられません。世界の技術者さん、これからも技術革新よろしくお願いいたします!