
140言語で年賀状を書いたらハガキからはみ出した言語ランキング【面積言語学】
先日、140種類の言語で年賀状を出しました。
というのも、Podcast「超旅ラジオ」の会員向けに、「応募者全員にそれぞれ違う言語で年賀状を送る」という募集をかけてみたのです。
すると140人から応募がありました。多くて50人くらいだろうと予想していたのですが、完全に読み間違えました。徹夜でPCに向かい、140言語の年賀状をしたためました。

こんにちは。年賀状で年末が終わった岡田悠と申します。
140言語でつくるのはめちゃくちゃ大変だったのですが、苦労の甲斐あって、無事届いたという報告が続々とあがってきました。
年賀状届いてた!我が家はネパール語でした♩嬉しいな〜🥰
— りん🖥 (@xxrinkorinxx) January 3, 2024
#超旅ラジオ pic.twitter.com/mqaGpVJAcz
左下に言語名が書いてあり、上の方はネパール語です。このように、一通一通、全員に違う言語で送りました。
超旅ラジオの年賀状届いた! pic.twitter.com/VaBCL3LU1n
— 笹生🍙 (@sasaohato) January 4, 2024
リンガラ語で届いた方。
#超旅ラジオ
— りむど (@rimurimudy_9) January 3, 2024
年賀状が届きました。
ジンバブエあたりの言葉のようです。 pic.twitter.com/DpAdWsHSBw
ショナ語で届いた方。
人生で一番大変な年賀状でしたが、140種類の言語を入力している途中に、気づいたことがありました。
それは、「同じ内容を書こうとしても、言語によって必要な面積が全然違う」ということです。
例えば、こちらは日本語バージョンの年賀状です。

赤枠で囲っている挨拶と本文の二箇所を、各言語に機械翻訳していきます(※機械翻訳なので、翻訳は正確ではない場合があります)。
すると、特に本文において赤枠をはみ出してしまう言語がたくさんあるのです。
例えば、「オロモ語」というエチオピアやケニアなどで使われている言語。こちらの言語で同じ内容を書くと、こうなります。

本文が赤枠から2行はみ出しちゃった。完全に署名の上に被っています。
日本語バージョンとオロモ語バージョンと比較するとこんな感じです。赤枠の大きさ、フォントの大きさや文字間スペースはどちらも同じ設定です。

オロモ語は本文が赤枠をはみ出しハガキの端まで到達しており、より広い面積をとっていることがわかります。
では、なぜこのような違いが生まれるのでしょうか。この差分を追求する学問を「面積言語学」と呼ぶことにします。今思いついた言葉なので、決して真に受けないでください。
僕の仮説は3つです。エクスキューズを重ねますが、僕は言語学の専門でもなんでもないため、以降はほとんど勘で書いています。
理由1. 言語によって同じ文字数で伝えられる情報量が異なるため
言語によって、同じ文字数で伝えられる情報量は異なります。例えば日本語は、比較的少ない文字数で情報を伝えられることで知られています。
実際、Twitterでは日本語の字数制限は140文字ですが、英語は倍の280文字となっています。これは同じ情報を伝えるにしても、英語では日本語よりも文字数が多く必要となる為です。
・鉛筆(2文字)
・pencil(6文字)
みたいな。なお以下のマッハ・キショ松さんの記事によると、「日本語400字の情報量 = 英語1000字の情報量」とのことです。倍以上じゃん。
理由2.コンピュータで表現される文字の大きさが異なるため
コンピュータの文字には、全角と半角があります。日本語はたしかに文字数は少ないですが、基本的には全角なので、「面積」で考えるとそこそこ大きくなったりします。
このnote上でも、
あ
aa
はそれぞれ1文字と2文字ですが、必要な面積(というか一行なので幅)は同じですね。
ちなみにコンピュータは元々は半角だけでしたが、漢字という無限にある文字に対応するために、全角が生まれたという歴史的経緯があるようです。
そしてここからがポイントなのですが、同じ半角でも、文字によって幅が異なる場合があります。
フォントにはどの文字も等幅で表す「等幅フォント」と、文字によって幅を変える「プロポーショナルフォント」があるからです。
たとえば「a」と「ඒ(シンハラ語の母音字)」をそれぞれ10文字ずつ書いてみると、
aaaaaaaaaa
ඒඒඒඒඒඒඒඒඒඒ
このように同じ半角でも、必要な幅が異なります。
今回の年賀状で使用したのが後者のプロポーショナルフォントであったため、半角でも広い面積が必要な言語がありました。この辺りが面積言語学の奥深さかもしれません。何度も言いますが冗談半分で聞いてください。
理由3.たまたま
たまたま今回の文章を翻訳したら、長い単語があてがわれたりだとか、改行のタイミングが悪かったりだとか、偶然要素もたくさんあると思います。面積言語学はそれくらい適当です。
ランキングを見ていこう
さて、そういうのも全部含めて、「今回つくった年賀状で一番はみ出しちゃったランキング」を発表していきます。
エントリーした言語はこちら。
アイスランド語,アイマラ語,アイルランド語,アカン語,アゼルバイジャン語,アッサム語,アフリカーンス語,アムハラ語,アラビア語,アルバニア語,アルメニア語,イタリア語,イディッシュ語,イボ語,イロカノ語,インドネシア語,ウイグル語,ウェールズ語,ウクライナ語,ウズベク語,ウルドゥー語,エウェ語,エストニア語,エスペラント語,オディア語,オランダ語,オロモ語,カザフ語,カタロニア語,ガリシア語,ガンダ語,カンナダ語,キニアルワンダ語,ギリシャ語,キルギス語,グアラニー語,グジャラート語,クメール語,クリオ語,クルド語,クロアチア語,ケチュア語,ゴア・コンカニ語,コサ語,コルシカ語,サモア語,サンスクリット語,ジャワ語,ジョージア語,ショナ語,シンド語,シンハラ語,スウェーデン語,ズールー語,スコットランド・ゲール語,スペイン語,スロバキア語,スロベニア語,スワヒリ語,スンダ語,セブアノ語,セルビア語,ソマリ語,タイ語,タガログ語,タジク語,タタール語,タミル語,チェコ語,ツォンガ語,ティグリニア語,ディベヒ語,テルグ語,デンマーク語,ドイツ語,ドーグリー語,トルクメン語,トルコ語,ニャンジャ語,ネパール語,ノルウェー語,ハイチ・クレオール語,ハウサ語,パシュトゥー語,バスク語,ハワイ語,ハンガリー語,パンジャブ語,バンバラ語,ヒンディー語,フィンランド語,フランス語,ブルガリア語,ベトナム語,ヘブライ語,ベラルーシ語,ペルシア語,ベンガル語,ボージュプリー語,ポーランド語,ボスニア語,ポルトガル語,マイティリー語,マオリ語,マケドニア語,マダガスカル語,マニプリ語,マラーティー語,マラヤーラム語,マルタ語,マレー語,ミゾ語,ミャンマー語,モンゴル語,モン語,ヨルバ語,ラオ語,ラテン語,ラトビア語,リトアニア語,リンガラ語,ルーマニア語,ルクセンブルク語,ロシア語,英語,韓国語,西フリジア語,中央クルド語,中国語(簡体),中国語(繁体),南部ソト語,北部ソト語,日本語
多いな。
では、第5位から発表します!140言語の中で、5番目に広い面積が必要だった言語は……
5位:オロモ語
5位は、先ほど例に出したオロモ語です!!!おめでとうございます!!

スペース込みの文字数は296文字。日本語の年賀状が106文字だったので、日本語の3倍近くの文字数があります。
オロモ語の年賀状では、"dhaggeeffachuu"みたいなとても長い単語が登場しています。これを日本語にすると「聞く」の2文字です。
Wikipediaによると、オロモ語は20世紀初頭まで、文字で表記されることは少なかったようです。現在は「クベー」と呼ばれるラテン文字(アルファベットにも用いられる文字)を修正した文字が使われ、「放出音」という独特の発音を表記する必要性などから、
クベー式アルファベットでは、ひとつの「文字」はひとつの記号またはふたつの記号 (ch, dh, ny, ph, sh) からなる。
とありました。そんな「後付け」の表記法もあって、文字数が多くなるのかもしれません。
続いては4位にいきましょう。
4位:イロカノ語
4番目に広い面積が必要だった言語は「イロカノ語」です!フィリピンでタガログ語とセブ語に次ぐ話者数を有する言語です。

本文が赤枠をはみ出し、署名をも乗り越えて、ハガキの端にまで到達しています。文字数は301文字とオロモ語より少し多いくらいですが、今回たまたま改行のタイミングの悪さ(良さ?)により、こうなったみたいです。
イロカノ語は昔は「カウィ文字」という古ジャワ文字で表記されていましたが、スペインによる植民地化で、ラテン文字による表記に変わったようです。「後からラテン文字があてがわれた」という意味では先ほどのオロモ語と同様ですね。
"panagdengngeg"など子音が連続している単語が印象的でした。
いよいよベスト3です。3位は……
3位:ギリシャ語
3位はギリシャ語!初めて欧州圏の言語が登場しました。

ハガキの端まではみ出している面積っぷりは4位のイロカノ語と同様ですが、よりギッチリと赤枠を埋め尽くしているため、こちらを3位としました。
ギリシャ語の文字数は290字と、5位や4位よりも少ないのですが、使用しているフォントにおける「ギリシャ文字の幅の大きさ」が要因となって上位に食い込んだようです。ここで初めて文字の大きさがキーになってきましたね。
ギリシャ文字はラテン文字の元となった文字であり、その意味で非常にオリジナルな文字、とも言えます。そのオリジナリティの高さが面積の広さにつながったのでしょうか。
続いては2位。
2位:ソマリ語
2位はソマリ語です!!!アフリカ東部の「アフリカの角」と呼ばれるソマリアやソマリランドなどで使われている、ソマリ族の言語です。

本文がハガキを突き抜けちゃった。
文字数は307文字とこれまでで最多で、"idaacadayadu" "qaadashada"など母音が連続する単語が多く含まれています。
Wikipediaによると、
元々ソマリ語にも独自の表記法があったが、それは長い間に失われ、近年では他言語の表記法が借用されている。もっとも広く使われているのがラテンアルファベットを使う方法
とのことで、やはり5位のオロモ語や3位のイロカノ語同様に、元々異なる表記法だったところにラテン文字を当てはめた表記法となっています。後からラテン文字にすると、面積が増える。面積言語学の法則が見えてきたかもしれません。
さて、いよいよ1位の発表です。
今回の年賀状で最も面積が必要だったのは……
1位:ジョージア語
ジョージア語です!!!おめでとうございます!!!!
シュクメルリやジョージアワインなどでお馴染みの国、ジョージアで使われている言語です。

もはやはみ出しすぎてわかりづらいのですが、ハガキの下端にかすかに文字が続いてるのが見えますでしょうか。ほぼ一行丸々ハガキからはみ出すくらいの面積っぷり、堂々の1位です。
このジョージア語ですが、文字数はなんとベスト5の中で最小の259文字。それでも「ლ」みたいな横に丸っこい文字が連続しているからか、ダントツの1位に輝きました。
この独特な文字「グルジア文字」の起源については、まだ謎が多いようです。デイリーポータルZのSatoruさんの記事でも、グルジア文字について専門家の方がコメントをしていますが、明確なことはわからず「想像が膨らむ」という結論になっていました。
ちなみに同記事において、シンハラ文字やミャンマー文字について、「グルジア文字に似ている」とした上で、以下のような興味深いコメントが記されています。
当時の文字は、ヤシ(シュロ)の葉に鉄の棒で書くことが多いので、丸い文字である必要がありました。なぜなら、まっすぐな文字だと、葉っぱが切れてしまうためです。だからシンハラ文字の基になった南インドの文字は丸く、それを導入したミャンマー文字も丸いのです。
シンハラ語もミャンマー語も、惜しくも今回のランキングには入りませんでしたが、確かにどちらもベスト5に肉薄する面積でした。
葉っぱに最適化された文字だからこそ、四角形のハガキに収めようとすると広い面積が必要になる。奇しくもハガキを漢字にすると「葉書」ですが、同じ葉でも収めやすい文字が異なります。
面積言語学を突き詰めていくと、最後は「葉」に行き着くのかもしれません。
以上の結果から、ベスト5は以下のいずれかのパターンに分類されることがわかりました。
元々文字で表記されなかったり、異なる文字で表記されていた言語に、ラテン文字を当てはめたことで、結果的に文字数が多くなっている言語
→オロモ語・イロカノ語・ソマリ語文字数もそれなりにありながら、かつ(プロポーショナルフォントにおいては)ラテン文字より横幅の大きいような、独自性の高い文字を使用している言語
→ギリシャ語・ジョージア語
ただし冒頭でも述べたように「たまたま」の要素も強いと考えられるので、また機会があれば、年賀状以外の文面でも試してみたいと思います。
以下は会員向けのおまけです。なお会員限定ラジオでも面積言語学について詳しく話しています。
おまけ
・逆に最も小さい面積で済んだ言語は?
・140種類で唯一出力できなかった言語は?
・見た目が一番インパクトのあった言語は?
・実は一番大変だった作業は?
ここから先は
この記事が気に入ったらチップで応援してみませんか?