100言語で「立ち入り禁止」
翻訳を重ねると文章がどんどん劣化していきます。今回は、シンプルな「立ち入り禁止」の文言をリレー形式で伝言ゲームのようにひたすら100以上の言語で翻訳していきました。さて、どんな文章になったでしょうか?
まずは原文の日本語
こんな文章をつくってみました。
この先、関係者以外立ち入り禁止
無断で入ってはいけません
もし立ち入りを見つけたら、罰金100億円!
罰金の金額はさすがに高すぎですが、まぁよく見かけるような注意文ではないでしょうか?シンプルな文章ですが、翻訳を重ねるとこの文章もどんどん変化していきます。その変遷を見ていきましょう。
2言語目で早くも怪しげな文書に
日本語から、アフリカーンス語に翻訳。さっそく、なにやらおかしな文章になってしまいました。
政党を除く範囲外については、
これは、許可なしに行くべきではありません
あなたが入り口、細かい100億円を見つけたら!
なぜ「政党」?そして、「細かい100億円」って何?
すでにもう、文章がおかしくなってきてますね。続いて、どんどん翻訳していきましょう。
5言語目でもうよく分からないことに
日本語からアフリカーンス語に翻訳したあと、続けて伝言ゲームのようにアルバニア語、アムハラ語、アラビア語と翻訳を重ねました。その結果がこちら。
唯一の政党への損傷
これが出て行くことはありません
ログインする場合は、罰金10000000000
たった5つの言語に翻訳しただけで、もうこんなに文章が変わってしまうんですね。「入ってはダメ」という文章だったはずなのに、なぜか「出て行くことはありません」に変わってる……。そして、「ログイン」はどこから来たのか。罰金の金額は、全部数字になってますが、100億円で合ってますね。
さて、続いて一気に翻訳を重ねましょう。
15言語目、とてもシンプルに
というわけで、15の言語に翻訳してみました。言語の内訳は下記のとおり。
日本語 → アフリカーンス語 → アルバニア語 → アムハラ語 → アラビア語 → アルメニア語 → アゼルバイジャン語 → バスク語 → ベラルーシ語 → ベンガル語 → ボスニア語 → ブルガリア語 → カタルーニャ語 → セブ語 → 中国語(簡体)
そして、今回の文章はこちら。
唯一の敗北
ないから
あなたの美しい百億
リレー形式で翻訳を重ねる時の特徴として、文章がどんどんシンプルになっていくというのがあります。翻訳しきれずに、文章が欠落することがあるのですね。逆に、付け足されることは無いので、結果的にどんどん文章が短くなっていきます。
「あなたの美しい百億」ってなんなんでしょうね?なにやら、ポエムみたいになってきました。
24言語目で衝撃の変化が!
24言語目のエストニア語で、驚きの変化がありました。
唯一の敗北
遠くないから
あなたの美しい60億
なんと、今まで100億だったのが、ここに来てなぜか60億に!なぜ、40億も減ったのでしょうか。謎過ぎます。
衝撃が止まらない、28言語目
これ、マジですか。
28言語目のガリシア語で、またまた数字に変化が。
唯一の損失
黒
あなた美しい600万
60億から、600万に減ってる!そして、二行目がたった一文字「黒」になってるし。
とうとう百万に減額
38言語目のミャオ語で、とうとうこうなりました。
若しくは
黒
この美しい百万
100億円が、100万に……。
ちなみに、ミャオ語というのは、中国南部や、ベトナム、ラオスなどに住むモン族と呼ばれる人たちの言語です。ラオスでの内戦の結果、アメリカに難民として渡った人がたくさんいて、実はミネソタ州では英語とスペイン語に次いで3番目に多く話されている言語なんだって。
という、言語ネタもちょこっと挟みつつ。翻訳を続けましょう。
数字と色が変わってしまう
46言語目、カンナダ語。ここで、数字だけでなく色にも変化が。
若しくは
白
この素敵万人
そもそも、なんで二行目に「黒」という文字が出てきたのかが不明ですが、さらにこのカンナダ語で色が反転し、「黒」から「白」へ。そしてさらに、「百万」が「万人」に。
そして、この後カザフ語でなぜか「百万」が復活したあと、クメール語でとうとう数字が消失します。
その後、62言語目のマオリ語で色が消失。
64言語目のモンゴルごで1行目が「と」のみに。
79言語目のソト語で全文が5文字に削られ、さらに80言語目のショナ語で4文字に。
そして、最終の104言語目、ズールー語ではこうなりました。
と
と
もっと
もはや、立ち入り禁止も、罰金も、何も残ってませんね。
今回、機械翻訳に使用したGoogleスプレッドシートを公開しますので、文章の変遷はそちらで見てみてください。
このスプレッドシートには、機械翻訳の関数を入れているので、最初のセルに文章を入れると自動的に100以上の言語にリレー形式で翻訳するようにプログラムされています。このシートは、自作しました。
翻訳に使用している言語は以下の通り。
日本語 → アフリカーンス語 → アルバニア語 → アムハラ語 → アラビア語 → アルメニア語 → アゼルバイジャン語 → バスク語 → ベラルーシ語 → ベンガル語 → ボスニア語 → ブルガリア語 → カタルーニャ語 → セブ語 → 中国語(簡体) → 中国語(繁体) → コルシカ語 → クロアチア語 → チェコ語 → デンマーク語 → オランダ語 → 英語 → エスペラント語 → エストニア語 → フィンランド語 → フランス語 → フリジア語 → ガリシア語 → グルジア語 → ドイツ語 → ギリシャ語 → グジャラト語 → クレオール語(ハイチ) → ハウサ語 → ハワイ語 → ヘブライ語 → ヒンディー語 → ミャオ語 → ハンガリー語 → アイスランド語 → イボ語 → インドネシア語 → アイルランド語 → イタリア語 → ジャワ語 → カンナダ語 → カザフ語 → クメール語 → 韓国語 → クルド語 → キルギス語 → ラオ語 → ラテン語 → ラトビア語 → リトアニア語 → ルクセンブルク語 → マケドニア語 → マラガシ語 → マレー語 → マラヤーラム語 → マルタ語 → マオリ語 → マラーティー語 → モンゴル語 → ミャンマー語(ビルマ語) → ネパール語 → ノルウェー語 → ニャンジャ語(チェワ語) → パシュト語 → ペルシャ語 → ポーランド語 → ポルトガル語(ポルトガル、ブラジル) → パンジャブ語 → ルーマニア語 → ロシア語 → サモア語 → スコットランド ゲール語 → セルビア語 → ソト語 → ショナ語 → シンド語 → シンハラ語 → スロバキア語 → スロベニア語 → ソマリ語 → スペイン語 → スンダ語 → スワヒリ語 → スウェーデン語 → タガログ語(フィリピン語) → タジク語 → タミル語 → テルグ語 → タイ語 → トルコ語 → ウクライナ語 → ウルドゥー語 → ウズベク語 → ベトナム語 → ウェールズ語 → コーサ語 → イディッシュ語 → ヨルバ語 → ズールー語
電子書籍にしてKindleで販売もしています
で、この自動翻訳のプログラムを使って、昔話の「桃太郎」や「竹取物語」をひたすら翻訳して、それを電子書籍化したものをKindleで販売しています。よかったらそちらも読んでみてください。
「桃太郎」を100以上の言語で翻訳してみた
「竹取物語」を100以上の言語で翻訳してみた
で、この機械翻訳を使いながら電子書籍化してKindleで販売するっていう一連の流れがとても楽しかったので、「大人もできるかな」というワークショップイベントを開催して、友達と一緒につくってみたり。楽しかったです。
「私もやってみたい!」って方がもしたくさんいらっしゃったら、またワークショップをやるかも。定期的に、クリエイティビティとテクノロジーを組み合わせて、みんなでなにかつくって遊んでみるっていう「大人もできるかな」っていうワークショップイベントを開催しています。
過去には、こういったパソコンを使ってつくるものや、音声入力や文字認識で遊んでみたり、都電を貸し切りにして写真展を開催したり、品川で早朝富士登山をしてみたりなど、いろいろやってます。前回は「アイデアを形にする」っていうテーマで、ゲスト登壇者さんがいらっしゃったり、文具メーカーさんが協賛してくれたりも。
次回は、アンバサダーをテーマにした飲み会。好評につき第二回の開催。
一緒に遊びたい方、ぜひ!
「日曜アーティスト」を名乗って、くだらないことに本気で取り組みつつ、趣味の創作活動をしています。みんなで遊ぶと楽しいですよね。