調査員物語#34: 「インターネットの言語地図」 <ー 日本語だけだと損をします
今回は「インターネットの言語地図」について取り上げます。
今回もドライに行きましょう。
さて、みなさんインターネットを日々お使いだと思います。 ついでに、ChatgGPTなどもお使いだと思います。
以前、日本語と英語では同じ質問をしても回答の厚みが違うという説明をさせて頂きました(メインはGoogle BardとChatGPTの比較の話となっていますが、最後に英語と日本の比較の話をしています): ↓
今回は、それがどうしてかの深堀をしたいと思います。
単純に、データ量がもろに出ています。
現在のAIは、インターネットからデータを取っていますが、その大本のインターネットのデータに違いがありすぎるからです。
どのぐらい違うか?
w3techsさんの「インタネット業界で使われている言語調査」によると:
2023年5月レベルで
英語: 55%
日本語: 3.7%
検索キー: w3techs internet web site language
(Languages used on the Internet - Wikipediaをそのままクリックで下の方にデータがああり)
となっています。 従い、ChatGPTやGoogle Bardの参照する(していた)データ自体が英語は日本語のほぼ15倍もあります。
これじゃ、日本語の回答も英語に比べ薄くもなります。
日本語が3.7%のシェアでも実は世界ランキング6位で決して低くはないのですが、やはり情報量の15倍も多い英語には勝てません。
結果、やはり英語が分からないとインターネット経由で情報を仕入れ判断するときに日本語だけだと相当不利になります。
苦肉の策としては、検索時に 日本語ー> 英語、英語ー>日本語の翻訳を使う手もありますが、これだと時間が掛かり面倒くさいと思います。
結果、とりあえず英語は知っておいた方が良いのではないのでしょうか?
學校でも、英語の授業にやる気がでないのは、このような損をすることを示していないからと思われます。
一般の生活に関係ないと思いきや、ファイナンスのニュースは米国を中心に回っていますので、日本の株価にも影響を及ぼす米国の金利動向などをいち早くしるには米国の生ニュースを読むのが一番早いアクションがとれるとおもうのですが...どうなんでしょう?