現在、経済や文化の交流のグローバル化に伴い、主流言語や共通言語が勢力を増し、不利な立場にある言語は絶滅の危機に瀕しています。現在、世界には約7,000の言語が存在し、言語学者は今世紀末までにそのほとんどが消滅すると予測しています。言語が消滅すれば、それに対応する文明全体も消滅します。脆弱な言語に対してタイムリーな対策を講じなければ、人類の文化遺産を完全に記録する機会を失うことになります。 誰もが知っているように、言語は人間がコミュニケーションをとる主な手段であり、文化の担い手であり重要な表現形式であり、国家の血であり精神的な故郷です。そのため、各国語(母語)、特に少数民族の言語の保護は重要かつ緊急の課題となっており、この点でできることは数多くあります。 中国の著名な学者である周海中氏はかつて、今日の恵まれない民族言語は支配言語、グローバル化、インターネットなどの影響に直面しており、その社会利用機能は徐々に弱体化または消滅する危険にさらされていると指摘し、民族言語を保護することは人類文明の継承と発展、そして国家の統一と社会の安定に寄与すると述べた。 言語の多様性を守ることは文化の多様性を守ることであり、文化の多様性を守ることは人類共通の未来を持つコミュニティの多様性を守ることでもあります。国語は、国家存在の極めて重要な特徴の一つであるだけでなく、民族文化の継承、発展、繁栄の重要な担い手であり、人類文明の進歩と社会の調和と安定の重要な象徴であると言えます。 現代において、人工知能(AI)はもはや人々にとって馴染みのない存在ではありません。顔認識、音声制御、自動運転車、スマートホーム、スマートマシンサービスなど、私たちは日常生活におけるその影響を身をもって感じています。しかし、実は、人工知能の使命は人類の利便性だけにとどまらず、地球の文明を守ることでもあります。 絶滅危惧言語の場合、言語の記録は人手に大きく依存しています。しかし、その構造は複雑かつ変化しやすく、人力のみで完全な音声変化、意味解析、文法解析などをまとめることは現実的ではありません。さらに、学習対象言語の収集とテキスト転写の標準化が欠如しているため、多くの特有の困難が生じます。 現在、人々は人工知能技術を利用して絶滅危惧言語を体系的に研究し、それらの完全な記録を作成しています。人工知能技術は、言語の音声構造の決定、言語の統語構造の分析、基本的な意味単位と主流言語との対応関係などを含むコンテンツを記録する完全なコーパスを構築できます。 音声認識、音声転写、音声合成などの人工知能技術を使用することで、アクセントとテキストをより適切に組み合わせて、絶滅危惧言語の音声入力を実現できます。このようにして、文字を持たない絶滅危惧言語であっても、主流の言語テキストに変換され、記録され、継承されるようになります。 少し前、アメリカの有名な未来学者トーマス・フライ氏は、人工知能技術を使用して、さまざまな国の言語をビデオ、音声、文書の形でアーカイブする「グローバル言語アーカイブ」のアイデアを提案しました。彼は現在、世界中の学者と協力して、多くが絶滅の危機に瀕している約 4,000 の言語に関するデータを収集しています。 フレイ氏は収集した言語データを人工知能言語再構築エンジンに入力し、機能的な3次元アバターを生成して、その言語を学びたい人に教えることができるようにしています。同氏は、AIエンジンはさらに一歩進んで言語のギャップを埋め、必要に応じて言語の書き言葉を作成し、言語間の翻訳も提供するだろうと述べた。 中国では、iFLYTEKが人工知能技術を利用して、絶滅危惧言語のさまざまなスケールの音節意味間のつながりとパターンを見つけています。超強力な計算能力を持つサーバーの協調協力により、最終的に音声データベースを形成し、絶滅危惧言語の保存を実現しています。先進的なインテリジェント音声技術により、複数の少数言語や方言をカバーする同社の音声システムが実用化されました。 中国のアリババAIラボは最近、方言を保護するための特別グループを設立し、中国語方言の保護と発展のために1億元を投資すると発表しました。人工知能を技術的手段として活用し、全国の方言の音声認識・音声合成作業を段階的に進め、技術を活用して方言を永久に保存していく。 デジタル言語データを維持し、先住民コミュニティがアクセスできるようにすることは、多くの機関にとって課題です。カナダ先住民文化評議会 (FPCC) は最近、ブリティッシュコロンビア州の先住民言語、芸術、文化、遺産の復興を支援するために、First Voice プラットフォームを通じて言語データを保存し、教育プログラムとアプリケーションを作成する取り組みを開始しました。 これとは別に、First Voice の最新のイノベーションは、ユーザーがソーシャル メディア、電子メール、ワードプロセッサなど、モバイル デバイスで 100 を超える現地言語を入力できるキーボード アプリです。 First Voices は、人工知能と機械学習を統合したオープンソースのクラウドネイティブ コンテンツ配信エンジンである Nuxeo に言語データを保存します。 ARCダイナミック言語卓越センター(CoEDL)は、遠隔地のコミュニティに住む子供たちにオーストラリアのアボリジニ言語を教えるために、低コストで簡単に持ち運びできるスマートロボット「Opie」も開発しました。オピーの目は、物語やゲーム、レッスンを通して子供たちが学ぶときに子供たちと交流し、ロボットは子供たちの言語スキルを記録して、教師が子供たちの学習を追跡できるようにします。 さらに、CoEDL は米国で Google と協力し、アボリジニ言語の文字起こしと AI モデルの構築に取り組んでいます。現在、20 を超えるオーストラリアのアボリジニ言語の AI モデルを構築しています。これは Google のオープンソース AI プラットフォーム TensorFlow のおかげです。この機械学習テクノロジーにより、言語学者は CoEDL の 40,000 時間を超える録音を書き起こすのに何百万時間もの時間を節約できました。 言語の保存と学習における利点により、人工知能技術は絶滅の危機に瀕した言語を救うプロセスにおいてこれまで以上に重要になっています。しかし、この技術を通じてこれらの言語を保護するには、依然として大きな課題があります。例えば、多くの先住民族の言語は一般的に口頭で伝えられています。テキストに変換すると、元の意味が変わってしまったり、十分に表現できなくなったりする可能性があります。 現代のテクノロジー、特に人工知能テクノロジーの助けを借りれば、民族言語の保護の問題は解決されるだろうと私たちは確信しています。最後に、著者は、より多くの人々や機関が国語の保護に参加し、言語生態文明の構築と世界の文化的多様性の保護に知恵と力を貢献することを願っています。 |
<<: ロボットの設計は「赤ちゃん」から始めるべきでしょうか?
>>: 大きなモデルが必ずしも良いモデルとは限らない。小さな機械学習こそが未来だ
OpenAI シリーズは終わりに近づいていますが、イースターエッグがあるとは思っていませんでした。ま...
0×00 背景形式手法は、私たちのほとんどにとっては非常に高度なものです。せいぜい授業で聞いたこと...
テクノロジー業界は歴史的に平均給与が最も高い業界の一つであり、リストのトップにランクされることも少な...
昨日、私たちは地球の最大の課題に取り組む絶好の機会であるアースデーを祝いました。 COVID-19パ...
ジェニファー・ターナーの代数学の授業はかつてとても眠くて、多くの生徒が眠気を催していた。現在、教育を...
[[265994]]最近、国際人工知能教育会議、第3回世界知能会議が相次いで開催され、さまざまなA...
[[200338]]私もディープラーニングの初心者です。この記事はあくまでも私の個人的な意見です。私...
最後に、Google が昨年 12 月に約束した Gemini Ultra はリリースされるのでしょ...
Pika 1.0 が正式にリリースされてから、内部テストの資格を得たネットユーザーは大いに楽しんで...
この記事では、いくつかのクラスタリング アルゴリズムの基本的な概要を示し、シンプルでありながら詳細な...