アラビア文字と他文字との互換性について
6月15日のウイグル語の日に関連して、東ヨーロッパ及び中央アジアにおけるアラビア文字とラテン文字・キリル文字の互換性について取り上げます。
一部例外を除いて原則的に綴りの置き換えが簡単になっています。
(※R4-07-25……ユニコード14.0に採用されたボスニア語アラビア字母の解説とトップ画像を追加。)
キリル文字表記とほぼ共通のアラビア文字
旧ソ連諸国及び中国・新疆ウイグル自治区でのアラビア文字は原則的にキリル文字表記が完全に対応しているものが中心となっております。
【ب】Б―B
【د】Д―D
【ز】З―Z
【ل】Л―L
【م】М―M
【ن】Н―N
【پ】П―P
【ر】Р―R
【س】С―S
【ت】Т―T
【ف】Ф―F - ウイグル語本来の字形は《ڧ》。
【تس】Ц―TS(ウイグル/タタール/ウズベク)、C(ボスニア) ; ТС―TS(ウズベク/タジク)
【چ】Ч―CH(ウイグル/ウズベク)、Ç(タタール/カザフ/キルギス)、Č(ボスニア)、C(タジク)
【ش】Ш―SH(ウイグル/ウズベク)、Ş(タタール/カザフ/キルギス/タジク)、Š(ボスニア)
ウイグル系拡張アラビア文字
ウイグル語の拡張アラビア文字は母音字の書き分けができるようになっていて、geonames.deの方式ではタタール語やウズベク語にも導入されています。ルーツは1920年代に考案されたタタール語のヤンガ・イムリャー文字と思われます。
ウイグル系拡張アラビア文字特有のハムザ付きヤー《ئ》は本来ウイグル語では独立形と語末形《ـئ》が用いられないのですが、タイ語のオー・アーン《อ》やラオ語のオー・オー《ອ》のように語頭及び語中の担母音記号として用いられることからユニコードでは独立した字母として扱われます。▽ハムザ付きヤーはクルド語ソラニー文字では短いイ[ɨ]又はウ[ɯ]音を含み、ソラニー文字における各子音字は短いイ音と単子音の2つの音を持っています。
ウイグル語の現行キリル文字ではЩ《شچ》[シチ], Ъ《ـئـ》[音節の区切り]とЬ《ـيـ》[ィ]―語中に限り〈-ЬЕ-〉の《ـيېـ》のように軟母音の前で表示―が廃止され、現行正書法では硬音符はアポストロフ《ʼ》に置き換えられています。
英語版ウィキペディア内の現代ウイグル語各種文字表では、外来語・方言表記・固有名詞に使用される Ё《يو》[ヨ], Ц《تس》[ツ], Ы《ئى ؛ ىـ ، ـىـ ، ـى》[ウ], Э《ٸې ؛ ٸېـ ، ـٸېـ》[エ] の4字が字母表に含まれていないのですが、ウイグル語表記上で重要な字母となっています。
【ئا/ا】А―A(ウイグル/タタール) ; О―O(ウズベク) - アリフ。
【ئە/ە】А―A(ウズベク) ; Ә―E(ウイグル/クルド)、Ä(タタール) - アェー。ハー《ه》の語末形を語頭形・語中形から分化したもので、左側の字母に連結されない。
【ۋ】В―W(ウイグル/タタール)、V(ウイグル/タタール) - ウェー。ピンイン式ウイグル・ラテン文字や1990年代タタール・ラテン文字では借用語や固有語によって《W》と《V》とで使い分けがなされる。
【ڤ】В―V(クルド) - ヴェー。ジャウィ文字では《P》に当たる。
【ﮒ】Г―G - ガーフ。タタール語正書法では前舌子音字で〖ГӘ―GÄ[ギャ/ゲ]《گە》, ГЕ―GE[ゲ]《گې》, ГИ―Gİ[ギ]《گى》, ГӨ―GÖ[ギョ]《گۆ》, ГҮ―GÜ[ギュ]《گۈ》, -ГЬ―-G[ギ]《ـگ》〗に用いる。
【ع】ГЪ―Ğ(タタール) ; Әʼ―ʼ(クルド) - タタール語正書法では後舌子音字で、主にアラビア文字由来の借用語に見られ、〖ГА―ĞA[ガ]《عا》, ГО―ĞO[ゴ]《عو》, ГУ―ĞU[グ]《عۇ》, ГЫ―ĞI[グ]《عى》, -ГЪ―-Ğ[グ]《ـع》〗に用いる。
【غ】ГЪ―Ğ(タタール) ; Ғ―GH(ウイグル)、Gʻ(ウズベク) ; Гʼ―Ẍ(クルド) - タタール語正書法では後舌子音字で、〖ГА―ĞA[ガ]《غا》, ГО―ĞO[ゴ]《غو》, ГУ―ĞU[グ]《غۇ》, ГЫ―ĞI[グ]《غى》, -ГЪ―-Ğ[グ]《ـغ》〗に用いる。
【يې】Е―YË(ウイグル) - アラビア語ヤーとエーの連字。
【ې/ـېـ】Е―Ë(ウイグル)、Е―E(ウズベク) - 語中・語末のエー。
【ئێ/ێ】Е―Ê(クルド) - スモールV付きイェー。語頭《ئێـ》と語中《ـێـ》は点有り。
【يو】Ё―YO(ウイグル)
【ژ】Ж―ZH(ウイグル)、J(タタール) - ジェー。
【ج】Ж―J(ウズベク) ; Җ―J(ウイグル)、C(タタール) ; Щ―C(クルド)
【ئى/ى】И―I・i(ウイグル/ウズベク)、İ・i(タタール) ; Ы―I・ı(タタール)、I・i(ウイグル) - アリフ・マクスーラ。語頭《ىـ》と語中《ـىـ》は点無し。ウズベク語では《Ы》が使用されないため、キリル文字表記では《И》に当てられる。
【ئی/ی】И―Î・î(クルド) - ペルシア語イェー。語頭《ئیـ》と語中《ـیـ》は点が必要となる。
【ي】Й―Y(ウイグル) - アラビア語ヤー。
【ی】Й―Y(クルド) - ペルシア語イェー。語頭《یـ》と語中《ـیـ》は点有り。
【ك】К―K(ウイグル/タタール/ウズベク) - カーフ。タタール語正書法では前舌子音字で〖КӘ―KÄ[キャ/ケ]《كە》, КЕ―KE[ケ]《كې》, КИ―Kİ[キ]《كى》, КӨ―KÖ[キョ]《كۆ》, КҮ―KÜ[キュ]《كۈ》, -КЬ―-K[キ]《ـك》〗に用いる。
【ک】К―K(クルド) - ケーヘー。
【ق】КЪ―Q(タタール) ; Қ―Q(ウイグル/ウズベク) - タタール語正書法では後舌子音字で〖КА―QA[カ]《قا》, КО―QO[コ]《قو》, КУ―QU[ク]《قۇ》, КЫ―QI[ク]《قى》, -КЪ―-Q[ク]《ـق》〗に用いる。
【ڵ】Лʼ―L(クルド) - 上スモールV付きラーム。ラテン文字表記は《ل》と共に《L》で示される。
【ڭ】НГ―NG(ウズベク) ; Ң―NG(ウイグル)、Ñ(タタール)
【ئو/و】О―O(ウイグル/タタール) ; Ў―Oʻ(ウズベク) - ワーウ。
【ڕ】Рʼ―R(クルド) - 下スモールV付きラー - 異体字は《ڒ》。ラテン文字表記は《ر》と共に《R》で示され、ソラニー文字では外来語のラ行音[r]は《ڕ》で表記されることが多い。
【ئۇ/ۇ】У―U(ウイグル/タタール/ウズベク) - ウー。
【ڧ】Ф―F(ウイグル) - 1点付きクヮーフ。アラビア文字共通の《ف》で代用され、語頭・語中形は同一字形。
【خ】Х―X(ウイグル/タタール/ウズベク/クルド) - ウイグル語・ウズベク語ではキリル文字・ラテン文字共に日本語のハ行音に当てられる。
【ئ】Ь―ʼ(タタール)、I(クルド) ; «ʼ»または表記無し―«ʼ»または表記無し(ウイグル) - ウイグル系アラビア文字では母音を示す記号で、アポストロフが硬音符《Ъ・ъ》の代わりに用いられる。クルド語ソラニー文字では短母音[ɨ~ɯ]を含む。
【ې/ئې】Э―Ë(ウイグル)、E(ウズベク/タタール)
【يۇ】Ю―YU(ウイグル/ウズベク)
【يا】Я―YA(ウイグル)、Ё―YO(ウズベク)
【يە】Я―-YE(ウイグル)、YA(ウズベク) ; ЙӘ―YE(ウイグル) - アラビア語ヤーとアェーの連字。ウイグル語ではオーストラリア《🇦🇺》の〈ئاۋستىرالىيە〉[アウストラリヤ]に対応するキリル文字表記は〈Австралия〉となり、アラビア文字本来対応するキリル字母の〈-ЙӘ〉から変化する場合がある。
【ھ】Һ―H(ウイグル/タタール) ; Ҳ―H(ウズベク) - ヘー・ドーチャッシュミー。語頭《ھـ》/語中《ـھـ》/語末《ـھ》。タタール語で日本語のハ行音に当てられる。
【ح】Һʼ―Ḧ(クルド)
カザフ語アラビア文字
ウイグル系文字と異なり、母音表記は母音字単独で用いられます。
前舌母音化を示すハイハムザ《ٴ》は、近年ハムザ《ء》による代用表記も見られます。
カザフ語版ウィキペディアにおける文字体系切り替え機能では、チャ行音を表すキリル文字チェー《Ч》が本来の字母であるアラビア文字チェー《چ》ではなくターとシーンの連字〈تش〉になるなど、本来の綴りと異なる表記が見られます。
【ٴ/ء】前舌母音化 - ハイハムザ。タージ・マハルを表す〈ٴتاج ماحال / Тәж Махал / Täj Mahal〉のように前舌母音を含む単語の前に配置。外来語の場合は使用されない場合もある。ユニコードに含まれるハイハムザ付き母音字は略語表記に用いられる。
【ا】А―A
【ٵ/ٴا/ءا】Ә―Ä
【ە】Э, Е―E - 英語の短いA[æ ア]音由来のものは、語中であってもキリル文字表記では《Э》と表記される。
【ى】Ы―Y - アリフ・マクスーラ。
【ٸ/ٴىـ/ءىـ】І・і―I・ı
【ىي】И―İ・i - 母音のイ。
【ي】И, Й, Ь―İ・i - ヤ行音に用いる。キリル文字表記における語末の軟音符《Ь》はアラビア文字では表記されない。
【و】О―O
【ٶ/ٴو/ءو】Ө―Ö
【ۇ】Ұ―Ū
【ٷ/ٴۇ/ءۇ】Ү―Ü
【ۋ】У―U - ワ行音にも用いる。
【ۆ】В―V - 日本語・韓国語由来のワ行音はこの字母を用いる。
【ﮒ】Г―G
【ع】Ғ―Ğ - アイン。
【دج】ДЖ―DJ - 英語などの外来語表記に用いる。
【يو】Ё, ЙО, ЬО―İO
【ج】Ж―J
【ىييا】ИЯ―İA
【يە】ЙЕ, ЬЕ―İE
【ك】К―K
【كح】КХ―KH - 韓国語・ヒンディー語由来の借用語・固有名詞に用いる。
【ق】Қ―Q
【لا】ЛА―LA
【ل】ЛЬ―Lʼ - カザフ語アラビア文字では英語からの借用語由来の〈ЛЬ〉に対して軟音符に該当する表記は存在しない。
【ڭ】Ң―Ñ - '21年式ラテン文字正書法は当初《Ŋ・ŋ》が採用される予定だった。
【وۋ】ОУ―OU - 英語由来の借用語・固有名詞に用いる。
【پح】ПХ―PH - 韓国語・ヒンディー語由来の借用語・固有名詞に用いる。
【تح】ТХ―TH - 韓国語・ヒンディー語由来の借用語・固有名詞に用いる。
【ح】Х―H - ハー。日本語のハ行音はこの字母で示す。
【ھ】Һ―H - ヘー・ドーチャッシュミー。'21年式ラテン文字正書法は前述のハーと共に《H》で表記される。
【تسز】ЦЗ―TSZ - ロシア語経由の中国語由来の借用語・固有名詞に用いる。
【تش】Ч―Ç - アラビア語と共通の綴りで、英語由来の借用語・固有名詞で《چ》の代わりに用いられる。
【تشج】ЧЖ―ÇJ - ロシア語経由の中国語由来の借用語・固有名詞に用いる。
【تشح】ЧХ―ÇH - 韓国語・ヒンディー語由来の借用語・固有名詞に用いる。
【شش】Щ―ŞÇ - 外来語表記に用いる。ラテン文字表記と綴りが異なる。
【يۋ】Ю, ЬЮ―İU
【يا】Я, ЬЯ―İA
キルギス語アラビア文字
これも母音表記は母音字のみ用いられます。
【ا】А―A
【ۋ】В―V, W
【ع】Г―Ğ(タタール) - キルギス語正書法では後舌子音字で〖ГА―ĞA[ガ]《عا》, ГО―ĞO[ゴ]《عو》, ГУ―ĞU[グ]《عۇ》, ГЫ―ĞI[グ]《عى》, -Г―-Ğ[グ]《ـع》〗に用いる。
【ﮒ】Г―G - ガーフ。キルギス語正書法では前舌子音字で〖ГЕ―GE[ゲ]《گە》, ГИ―Gİ[ギ]《گئ》, ГӨ―GÖ[ギョ]《گۅ》, ГҮ―GÜ[ギュ]《گۉ》, -ГЬ―-G[ギ]《ـگ》〗に用いる。
【دج】ДЖ―DJ - ロシア語経由の英語などの外来語表記に用いる。
【دز】ДЗ―DZ - 日本語などの外来語表記に用いる。
【ە】Э, Е―E
【يو】Ё―YO
【ج】Ж―J
【ئ】И―İ・i
【ي】Й―Y
【ك】К―K - カーフ。キルギス語正書法では前舌子音字で〖КЕ―KE[ケ]《كە》, КИ―Kİ[キ]《كئ》, КӨ―KÖ[キョ]《كۅ》, КҮ―KÜ[キュ]《كۉ》, -КЬ―-K[キ]《ـك》〗に用いる。
【ق】К―Q - キルギス語正書法では後舌子音字で〖КА―QA[カ]《قا》, КО―QO[コ]《قو》, КУ―QU[ク]《قۇ》, КЫ―QI[ク]《قى》, -К―-Q[ク]《ـق》〗に用いる。
【ڭ】Ң―Ŋ・ŋ
【و】О―O
【ۅ】Ө―Ö
【ۇ】У―U
【ٷ】Ү―Ü
【ح】Х―X
【يۇ】Ю―YU
【يا】Я―YA
ボスニア語アラビア文字
ボスニア語アラビア文字はアレビッツァと呼称され、セルビア語と共通のキリル文字と完全に互換性のあるものとなっています。
'21年9月にユニコード14.0で全字母が採用されたのですが、代替表記がネット上で広まっています。
Catrinityフォントでは'22年にボスニア語アラビア文字全種類が表記可能となりました。
ボスニア語アラビア文字は方式によって一部子音字が異なっています。
【آ/ا】А―A - 語頭・独立形は必ずアリフ・マッダで示す。
【و】В―V - 母音を示すときは必ず補助記号が付加される。
【غ】Г―G - ガ行音[ɡ]系の外来語・固有名詞を示す字母としてはアラビア文語フスハーと共通。
【ݗ】Ђ―Đ・đ - 上2点付きハー。
【ڠ】Ђ―Đ・đ - マレー語ンガー。本来、ジャウィ文字では《NG》に当たる字母を《ݗ》の代用として転用したもの。
【ئە/ە】Е―E - アェー。ウイグル系アラビア文字と同じく、語頭は必ずハムザ付きヤー《ئ》が付く。
【ژ】Ж―Ž - ジェー。
【اٖى/ـٖى】И―I - 母音記号下アリフがイ[i]音を表し、その次に必ずアリフ・マクスーラ《ى》が付く。カシミール語ウルドゥー文字ではボスニア語と異なり《ایٖـ/ـیٖـ》とペルシア語イェー《ی》に下付きアリフを付加してイー[iː]音を示す。
【وٖ】И―I - 下アリフ付きワーウ。英語のアンパサンド《&》やシンド語のエーン《۽》に当たる助詞記号イ[i]「~と…」。ユニコードではワーウと母音記号下アリフの合成。
【ۀ】ИЈЕ―IJE - ハムザ付きアェー。上部のハムザ《ء》はペルシア語イェー《ی》由来。
【ي】Ј―J - アラビア語ヤー。
【ق】К―K - ボスニア語アラビア文字ではカーフ《ك》は使用されない。
【ڵ】Љ―LJ - スモールV付きラーム。
【ࢉ】Њ―NJ - 逆スモールV付きヌーン・グンナー。ユニコード14.0に採用された字母で、ユニコード採用以前は独立形《ںٛ》と語末形《ـںٛ》はヌーン・グンナー《ں》、語頭形《ٮٛـ》と語中形《ـٮٛـ》は点無しバー《ٮ》にそれぞれ母音記号の逆スモールVを付加する異例の表記となっている。
【ݩ】Њ―NJ - スモールV付きヌーン。
【ۉ】О―O - キルギス語ユー。
【ڃ】Ћ―Ć - シンド語ニェー。本来、シンド語ではNYA《ञ/Ñ》[ɲ ニャ]に当たる字母。
【ࢊ】Ћ―Ć - 下逆スモールV付きハー。ユニコード14.0に採用された字母。
【ۆ】У―U - オェー。
【ح】Х―H - 本来のアラビア文字では強いハ行音[ħ]。
【ڄ】Ц―C - シンド語ヂェー。本来、シンド語では《ॼ》に当たる字母。
【چ】Ч―Č - TSHE《Ћ》も含有される場合もある。
【ج】Џ―DŽ - DJE《Ђ》も含有される場合もある。
ペルシア文字
タジク語やアゼルバイジャン語ではペルシア文字を用いる。
アラビア語・ペルシア語由来のものを中心とした外来語・固有名詞表記に限り、Зは《ذ/ض/ظ》, Сは《ث/ص》, Тは《ط》で表記される。
【اَ/ا】А―A(タジク) - 母音記号ザバルは省略される場合がある。
【اه/ـه/اَه/ـَه】А―A(タジク) - 語末の表記。本来のペルシア語ではエ[e]音。母音字としてのヘー《ه》はペルシア語同様、アラビア文字と共通字形のため、次に字母が来るときはU+200B ゼロ幅空白[ᴢᴡꜱᴘ]で〈اهی〉/ай/[アーイ]のように示される (U+200C ゼロ幅非接合子[ᴢᴡɴᴊ]を使用して〈اهی〉で示されることも)。
【و】В―V(タジク/アゼルバイジャン)
【ﮒ】Г―G(タジク) ; Ҝ―G(タジク) - ガーフ。アゼルバイジャン語正書法では前舌子音字で〖ГӘ―GƏ[ギャ/ヂャ]《گه》, ГЕ―GE[ゲ/ヂェ]《گئ》, ГИ―Gİ[ギ/ヂ]《گى》, ГӨ―GÖ[ギョ/ヂョ]《گؤ》, ГҮ―GÜ[ギュ/ヂュ]《گو》, -Г―-G[ギ/ヂ]《ـگ》〗に用いる。
【ق】Г―Q(アゼルバイジャン) ; Қ―Q(タジク) - クヮーフ。 アゼルバイジャン語正書法では後舌子音字で〖ГА―QA[ガ]《قا》, ГО―QO[ゴ]《قو》, ГУ―QU[グ]《قو》, ГЫ―QI[グ]《قى》, -Г―-Q[グ]《ـق》〗に用い、ラテン文字表記ではガ行音[ɡ]は原則的に《Q》で示される。
【ی/ـیـ】Е―E(タジク/アゼルバイジャン) - 語中・語末のペルシア語イェー。
【ئ/ائ】Е―E(アゼルバイジャン) - ペルシア語イェー。アゼルバイジャン語のキリル文字表記はボスニア語同様、常に《Е》。
【ی/ای】Э―E(タジク) ; Е―E(アゼルバイジャン) ; И―İ・i(アゼルバイジャン) ; Ы―I・ı(アゼルバイジャン) - ペルシア語イェー。
【یا】Ё―JO(タジク) ; ЈА―YA(アゼルバイジャン)
【ژ】Ж―Ƶ(タジク)、J(アゼルバイジャン)
【اِ/اِیـ/ـِیـ】И―I・i(タジク) - 母音記号ゼールは省略される場合がある。
【اِه/ـِه】И―I・i(タジク) - 語末の表記。
【ئِی/ـِى】Ӣ―Ī・ī(タジク) - 語末にアクセントがある場合のイ音を示す。
【ی】Й―J ; Ј―Y(アゼルバイジャン) - ペルシア語イェー。語頭《یـ》/語中《ـیـ》/語末《ـی》。アゼルバイジャン語キリル文字ではボスニア語同様、ロシア語の軟母音字が使用されない。
【ک】К―K -ケーヘー。カーフ《ك》で代用される場合がある。
【آ/ا】О―O(タジク) ; А―A(アゼルバイジャン) - 語頭は必ずアリフ・マッダで示す。
【اؤ/ؤ】Ɵ―Ö(アゼルバイジャン)
【اُ/اُو】У―U(タジク) - 母音記号ペーシュは省略される場合がある。
【او/و】У―U(アゼルバイジャン) ; О―O(アゼルバイジャン) ; Ү―Ü(アゼルバイジャン) ; Ӯ―Ū(タジク)
【خ】Х―X(タジク/アゼルバイジャン)
【ح】Ҳ―H(タジク) ; Һ―H(アゼルバイジャン) : タジク語では英語などの外来語・固有名詞にこの字母を用いる。
【ه】Ҳ―H(タジク) ; Һ―H(アゼルバイジャン)
【ج】Ҷ―Ç(タジク) ; Ҹ―C(アゼルバイジャン)
【ع】Ъ―ʼ(タジク) ; ʼ―ʼ(アゼルバイジャン) : タジク語キリル文字では硬音符が語頭に来る場合がまれにある。