MITとGoogle BrainはAIを使って「現代のロゼッタストーン」として知られる失われた古代の文書を解読する

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

かつて栄華を誇った古代文明の多くは、果てしない塵の下に埋もれており、これらの場所で何が起こったのかを私たちは今やはっきりと知ることができません。

この歴史を理解する最良の方法は、書かれた記録を見つけることです。しかし、考古学者は文字が記録された石板を発掘することができますが、現代人にはこれらの古代の文字の意味を理解することができず、言語学者が推測するのに多くの時間がかかります。

現在、MIT CSAILとGoogle Brainの研究者らが機械学習を利用してウガリット語と線文字Bを解読する取り組みを開始した。

[[270013]]

△ ウガリット宮殿

ウガリット語はセム語族に属する楔形文字です。文字通りの意味から、それは今日の地中海沿岸のシリアにあったウガリットと呼ばれる文明によって使われた言語であることがわかります。それは紀元前6000年頃に初めて現れ、紀元前1190年頃に消滅しました。

[[270014]]

ウガリット語

線文字B は、人類によってまだ解読されていない線文字 A から発展したものです。主にクレタ島とギリシャ南部で紀元前 1500 年から紀元前 1200 年まで生き残りました。ギリシャ語の古代の書き言葉です。

[[270015]]

△ 線状B

研究者たちは、同じ言語ファミリー内の異なる言語間のつながりを活用し、機械学習の手法を使用してこれら2つの失われた言語を解読しました。これは古代言語を解読するための新しい方法であり、ロマンス語の言語研究にも大きな影響と改善をもたらすでしょう。

この方法は多くの人を驚かせました。

まるで現代のロゼッタストーンのようです！

追記：ロゼッタストーンは、同じ内容が 3 つの言語で書かれた石板で、言語学者が古代のテキストを理解するのに役立ちます。

まずは動物や植物の言語を解読し、新しい世界への扉を発見したいと思っています。

人間の言語は常にコミュニケーションをとる

この研究の中心的な方法は、人間の言語の類似性を利用することです。

たとえば、ヨーロッパの言語間の類似点を紹介する際に、Zhihu ユーザーの @拉队短は次の例を挙げました。

文「6月下旬の湿気の多い暗い夏の日でした。」
6月末の湿気の多い、どんよりとした夏の日でした。
デンマーク語：もし満足していないなら、この夏にそれをすることはまだできます。
スウェーデン語: 「また会えるのが待ちきれません。」
ノルウェー語: とても疲れているけど、私はまだ若いです。
アイスランド語: Það var rakur、grár sumardagur í lok júní。

見て、似ていますね。何しろ、インド・ヨーロッパ語族のゲルマン語族に属しています。単語の分布や文章の構造も非常に似ています。1つの言語を理解できれば、それと関連が深い別の言語を大まかに推測することができます。