南河内郡太子町から見たインドの多言語社会状況とAIへの期待。
多言語社会の中での言語選択とAIへの期待は過大だろうか?
激しい多言語変動社会のインドにおいて、ヒンディ語と英語の優位性はやむ負えない部分があるのか、とは思います。インド・アーリア系の言語の流れを汲み、古典サンスクリット語もその流れに含まれる、現代インドの言語状況として、多かれ少なから似た特徴を持つ、ヒンディー語、ウルトゥー語、ベンガル語、アッサム語、パンジャブ語、グジャラート語など、北インドで主に話される主要言語の使用者は、インド全土で使われている言語使用者の半分をゆうに超えていると見られます。習熟度の問題は別にして、この中には、複数の言語を使用している人々も含まれる、と仮定出来ます。ここでは、ヒンディー語系の言葉の方言については言及しません。
上記のヒンディー語と関係のある言語話者に取って、学校教育の中でヒンディー語を習得する事は、困難さの程度の違いはあれ、習得可能な範囲の事と思われます。
しかし、ヒンディー語と違う系統の言語を話す人々の多い、ドラヴィダ系の人々が住む南インドや、ビルマ・チベット系の人々が多い北東インドの子供達に取って、系統の違うヒンディー語を選択するケースはどうでしょうか。
IT化やビジネス・アカデミアのグローバル化の進む中で、英語の必要度はますます進む、と思われます。非ヒンディー系の言語話者の英語選好が増えている、と聞きました。実際、 ビルマ・チベット系言語の影響の強い北東インド出身者の英語理解力は全般的にレベルが高い様に思われます。ドラヴィダ系言語の強い南インドでも、同じ様な印象を持ちます。
世界的に大規模言語モデル(ラージ・ランゲージ・モデル;LLM)構築が進んでおり、 インドはこの動きに乗らないわけにはいかないと思います。 特に、教育格差を埋めるための手段としてLLMの手法を取り入れるべき、と理解します。
この分野での政府の積極的な取り組みは、
https://www.msn.com/en-in/news/India/bharatgen-geared-to-put-a-desi-spin-on-chatgpt/ar-AA1rFAU9?ocid=BingNewsSerp
をご覧下さい。表題と記事要約訳は以下の通りです。
「ヒンドゥスタン・タイムズ 20241004 ChatGPTにデシ・スピン(インドらしい工夫)を投入するバハラート・ジェン・プロジェクト
記事要約訳
ムンバイ発、2022年11月のChatGPT公開後、世界的に話題になった、機械学習とAIアルゴリズムに強い関心を持つIIT(インド工科大学)-ボンベイ校のガネッシュ・ラマクリシュナン(Ganesh Ramakrishnan)教授は、インドの文化的・言語的多様性を反映した生成AIを使用できる独自のソリューションの開発について考えています。」
記事全体の拙訳と私のコメントはこちらをご覧下さい。
https://note.com/yukihiko_yamada/n/n725d3e051d22
多数の言語サンプルの取り入れにより、深層学習が進み、シンギュラリティーの問題を乗り越えてしまう可能性があると言う見方が強い、と思われます。
しかし、その一方で、AIの無制限な利用は、個人秘密保持や、言語の新しいモデル構築の可能性はあるが、既存の言語にどの様な影響を与えるかは、余り分かってはいない状況と思われます。
ここでの問題点は、方言を含めた自分の属する言語、特に非ヒンディー語圏の多くの言語の存立を危機に落としめないか、と言う可能性がある、と言う点。 現代の英語や標準化されたヒンディー語の習得に力を注ぐあまり、地方の言語文化が廃れる事は無いだろうか、と危惧いたします。
アンダマン・ニコバル方面においては既に廃れて消滅してしまった言語もあると聞いております。
少し古い新聞記事の中に、失われた言語、失われる可能性のある言語に関し次の様な内容を含む記事がありました。
In 2018, a report by UNESCO stated that 42 languages in India were heading towards extinction. And these were spoken by less than 10,000 people.
2018年のユネスコ報告書によれば、インドでは42の言語が絶滅に向かっている、と言う事です。そして、これらの言語の話者数は一万人以下です。
https://www.outlookindia.com/national/the-endangered-and-extinct-languages-of-india-news-194995
ユネスコが発表した「Atlas of the World's Languages in Danger」の中で、 インドで絶滅の危機に瀕している言葉が多数あることが指摘されています。
https://en.wal.unesco.org/countries/india
この資料には、244言語の話者数に関する言語存続可能性に関する統計が出ています。
実際、どのくらいの数の言語・方言が絶滅の可能性があるかは、はっきりつかめていない、と言う意見もありました。 言語状況が複雑過ぎるため、現状把握が難しいのが現実だと思われます。
少し古いのですが、10年程前の「インド言語現状調査(People's Linguistic Survey of India)」は、全巻50冊。その頃、この調査をレポートした新聞によれば、インドには780の言語があり、66の書記体系があるそうです。北東部の州アルンナチャル・プラデシュだけで90の言語がある、と言います。この言語分類の中には、多数の方言も含まれます。これだけ言語・方言が多様に混在していますと、ヒンディー語優先政策は不人気であり、英語が共通公用語であるのも仕方がない、と思わざるを得ません。
方言や言語の喪失が、その文化に属する人々のアイデンティティーを失わせる、と言う議論も出て当然と思います。これなどまさに、グローバリズムとリージョナリズムの選択の間にある深刻な問題と思われます。
言語学的方法の進歩により、大量な言語資料の蓄積と分析は可能だと思いますが、現代の言語利用者に取っての、言語に関するアイデンティティの問題はまた別の重要性を孕んでいる、と思います。
日本も、教育やメディアの普及・影響により、地方の言葉や文化が絶滅する可能性は充分あると思います。
この記事が気に入ったらサポートをしてみませんか?