世界では毎年24の言語が消滅している。AIは絶滅危惧言語の新たな救世主となった

世界では毎年24の言語が消滅している。AIは絶滅危惧言語の新たな救世主となった

昨年、国連は2019年を「国際先住民族言語年」と宣言し、今、このお祭りがますます近づいてきています。実際、この取り組みは、消滅の危機に瀕している絶滅危惧言語についての認識を高めることを目的としています。 「言語を通じて、人々はコミュニティの歴史、習慣や伝統、記憶、独特の考え方、意味や表現を保存します。

彼らはまた、言語を使って自分たちの未来を構築します。言語は、人権保護、良好な統治、平和構築、調和、持続可能な開発の分野で重要な役割を果たします。これらは、国連の持続可能な開発目標 (SDGs) の中心でもあります。

国連の統計によると、世界には7,000以上の言語がありますが、非常に速いペースで消滅しており、平均して毎月2つの言語が消滅しています。 AI は、言語のアーカイブ化と学習における利点により、絶滅の危機に瀕した言語を救う戦いにおいてこれまで以上に重要になっています。

ジェイソン・ラヴェルはニュージーランドの先住民族の言語であるマオリ語を学んでいたが、練習を手伝ってくれる人がいなかったため、IBMの人工知能ワトソンと協力し、マオリ語と英語の両方でユーザーのメッセージを理解して応答できるFacebookメッセンジャーのチャットボットを作成した。たとえユーザーが「Reobot」などのスペルミスをしたとしても、Lovell のチャットボットは問題なく理解します。ラヴェル氏は近い将来に発音支援を導入したいと考えている。 Reobot は、マオリ語でコミュニケーションする機会を提供することで、学習者が自信とスキルをより早く身に付けられるよう支援します。

遠隔地のコミュニティに住む子供たちにオーストラリアのアボリジニ言語を教えるために、ARC言語ダイナミクス卓越センター(CoEDL)の研究者チームは、低コストで簡単に持ち運びできるロボット「Opie」を開発しました。オピーの目は、子供たちが物語やゲーム、レッスンを学ぶときに、子供たちとやりとりすることができます。さらに、このロボットは子供たちの言語スキルを記録し、教師が子供たちの学習の進捗状況を追跡するのに役立ちます。 CoEDL は Google と提携し、Google のオープンソース AI プラットフォーム TensorFlow を利用して、先住民言語の文字起こしと AI モデルの構築を行っています。この機械学習テクノロジーにより、CoEDL のリポジトリには 40,000 時間を超える録音が保存されており、言語学者の作業時間が何百万時間も節約されています。

言語データを維持し、それを先住民コミュニティに提供することは、多くの組織にとって課題です。先住民文化委員会 (FPCC) の使命は、ブリティッシュ コロンビア州の先住民の言語、芸術、文化、遺産の復興を支援することであり、地元のコミュニティと協力して言語データをアーカイブし、First Voices プラットフォームを通じて指導を行っています。 First Voices の最大のイノベーションは、ソーシャル メディア、電子メール、ワード プロセッシングなど、モバイル デバイス上のあらゆるアプリで 100 を超える現地言語を入力できるキーボード アプリです。

First Voices によって保存されるデータは、人工知能と機械学習を統合したオープンソースのクラウドネイティブ コンテンツ提供エンジンです。

未来学者のトーマス・フライは、世界言語アーカイブを生きた博物館、つまり絶滅した言語さえも学べる「言語のルーブル美術館」として構想している。「十分に収集されたビデオ、音声、文書がAI言語再現エンジンに取り込まれ、機能的な3次元アバターを生成し、その言語を学びたい人に教えることができるようになる」。AIエンジンはさらに進んで、言語のギャップを埋め、必要に応じて言語の書き言葉を作成し、言語間の翻訳を提供する。

フレイ氏は、ハワイ州ハワイ大学の絶滅危惧言語カタログ/絶滅危惧言語プロジェクト (ELCat/ELP) がハワイ人文化委員会で管理する絶滅危惧言語プロジェクトを、世界的な言語アーカイブを作成するための第一歩と見ています。絶滅危惧言語プロジェクトは、絶滅危惧言語に関するリソースと情報をまとめたものです。世界中の協力者のおかげで、このプロジェクトには現在 3,418 の言語に関するデータが蓄積されており、その多くは絶滅危惧言語としてリストされています。

<<:  Google AI チームが新しい「流体アノテーション」を発表: 画像アノテーションの速度が 3 倍に向上

>>:  自動車業界における人工知能の5つの主要な応用

ブログ    

推薦する

...

事前トレーニング後、パフォーマンスが悪化します。自己トレーニングは事前トレーニングに取って代わるものでしょうか?

2018年末には、FAIRの研究者らが「ImageNetの事前トレーニングの再考」と題する論文を発...

...

90年代以降の世代初登場!何凱明と孫建のチームが未来科学賞を受賞し、ResNetは18万回引用された。

先ほど、2023年未来科学賞の受賞者が発表されました!今年の「数学およびコンピューターサイエンス賞」...

...

FudanNLPチームの最新の成果、RLHFと人間のアラインメントのためのMOSS-RLHFがここにあります

ChatGPT に代表される大規模言語モデル (LLM) がさまざまなタスクで効率的にパフォーマンス...

フロントエンド人工知能: 機械学習による関数方程式の導出 - プラチナ III

[[259734]] tensorflow.jsとはTensorflow.js は、ブラウザーと ...

Nvidia に挑戦する Groq の起源は何ですか?新しいAIチップLPUの簡単な紹介

今日の人工知能分野では、「GPUがあれば十分」というのが徐々にコンセンサスになってきています。十分な...

2019年人工知能サバイバルガイド

「資本の冬は業界のマシュー効果と適者生存を加速させており、AI分野も例外ではありません。」Infer...

AI と SEO の組み合わせ: 祝福か呪いか?

検索エンジンは誕生以来、基本的な検索エージェントから人工知能 (AI) と機械学習 (ML) に基づ...

Google mBERT の秘密を解明: ディープラーニングは人間の言語をどのように処理するのか?

[[384615]]言語機能を備えたディープラーニングシステムは、人々の生活の中で広く利用されてき...

ディープラーニングを使用してコンピュータービジョンのすべての作業を完了するにはどうすればよいですか?

コンピュータービジョンをやってみたいですか?最近では、ディープラーニングが主流となっています。大規模...

人類は人工知能のせいで滅びるのか?ホーキング博士の最後の論文にヒントがあるかもしれない

[[251536]] 「完全な人工知能の開発は人類の終焉を意味するかもしれない...人工知能は自ら進...