AIが古代のテキストを解読し、ネイチャーの表紙に登場:失われたテキストを修復し、地理的な場所と執筆時間を正確に特定

AIが古代のテキストを解読し、ネイチャーの表紙に登場:失われたテキストを修復し、地理的な場所と執筆時間を正確に特定

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ネイチャー最新号の表紙では、AIが再び主役を務め、今回は古代文字の解読で成果を上げています。

これは、DeepMind、Google、オックスフォード大学などの研究機関が共同で開発したTransformerアーキテクチャに基づく手法です。

破損したテキストのみを修復する場合、この方法は62% の精度を達成しました。

実際の応用では、歴史家が古代ギリシャの特定の石碑を解読した際の正確率はわずか 25% でしたが、この方法を使用した後、正確率は3 倍近く増加して 72% になりました。

この方法はテキストを修復できるだけでなく、地理的帰属タスクにおいて 71% の精度を誇り、古代テキストの執筆日を 30 年以内の精度で正確に特定できます。

現在、この方法は大きな議論を呼んでいます。

現在では、古代ギリシャ語のテキストをオンラインで解析できる Web バージョンが存在し、アーキテクチャ手法もオープンソース化されています。

トランスフォーマーが古代の文書を解読

それは、ホメロスの叙事詩『オデュッセイア』に登場するギリシャの島にちなんで名付けられたイタカと呼ばれる建造物です。

Ithaca アーキテクチャの注意メカニズムは、入力の単一文字と完全な単語の表現と連続位置を連結することによって入力テキストの各部分の位置を理解し、最終的にさまざまな入力がモデルの決定プロセスに与える影響を評価できます。

完全なアーキテクチャは複数の Transformer ブロックで構成され、各ブロックは入力文字数と同じ長さの処理済み表現のシーケンスを出力します。

次に、その入力は、テキスト復元、地理的属性、および時間的属性を担当する 3 つのタスク ヘッドに渡されます。各タスク ヘッドは、それぞれのタスクのトレーニング専用のフィードフォワード ニューラル ネットワークで構成されています。

テキスト修復タスクでは、Ithaca は確率順に並べられた 20 個の解析結果予測を提供します。

地理的所属を決定する点では、入力テキストは古代史の 84 の地域に従って分類され、考えられる地域予測カテゴリが地図と棒グラフを通じて表示されます。

日付属性タスクは、分布予測のヒストグラムとしても表示されます。

下の図に示すように、紀元前 300 年から 250 年までの 10 年ごとの日付グループは、5 つの同等の可能性の範囲として表されますが、紀元前 305 年の碑文は、100% の確率で紀元前 300 年から 310 年の 10 年ごとのグループに割り当てられます。

歴史家のためのAIアシスタント

研究者らは、歴史家と協力したイサカ、ピュティアと呼ばれる類似のAI手法、歴史家と協力したイサカなど、古代のテキストを解読するさまざまな方法を比較した。

文字誤り率(CER)が低いほど良い。テキスト復元タスクでは、Ithaca は文字誤り率と精度が最も優れている。歴史家と協力すれば、効果はさらに向上するだろう。

研究者らは論文の最後で、この研究方法は写本研究、貨幣学、パピルス学など古代文書に関連するあらゆる分野、また古代・現代を問わずあらゆる言語に適用できると述べた。

この方法はすでに実用化されており、例えば、歴史家たちがこれまで紀元前446/5年以前に書かれたものだと考えていたアテネ時代の重要な法令の碑文の年代測定などに利用されている。

イタカは歴史家らと協力して、この日付を紀元前424/3年に更新した。

Ithaca は現在、オンライン トライアルを提供しています。公式 Web サイトにログインし、ボックスに古代ギリシャの碑文を入力し、欠落している文字をダッシュ​​ (-) でマークし、予測される文字を疑問符 (?) でマークします。

各クエリは、最大 10 個の連続または非連続の疑問符を予測できます。クエリをクリックすると、テキスト内の欠落している文字が下に表示され、元の場所と時間に関連付けされます。

著者について

この研究は、DeepMind、ヴェネツィア・カフォスカリ大学、ハーバード大学、アテネ経済経営大学によって実施されました。  これは、アテネ経済大学と Google の複数の AI チームと共同で開発されました。

この論文には共同筆頭著者が 2 人います。Annnis Assael 氏は DeepMind の AI 部門の研究者です。同氏はオックスフォード大学で修士号と博士号を取得しており、Forbes の「30 歳未満のヨーロッパの傑出した科学者 30 人」の 1 人でもあります。

共同筆頭著者のテア・ソマーシールトは歴史学者であり、現在はヴェネツィアのフォスカリ大学人文科学部とハーバード大学ギリシャ研究センターの研究員です。彼女の主な研究分野は、機械学習を古代地中海の文字文化の研究に応用することです。

紙:

https://www.nature.com/articles/s41586-022-04448-z

オープンソースリンク:

https://github.com/DeepMind/ithaca

オンライントライアル:

https://ithaca.DeepMind.com/?job=eyJyZXF1ZXN0SUQiOiJmYzUwNGY0NWNhZjJjZWMxZjIxZDA4YWVjNTdkMjEzMSIsImF0dHJpYnV0aW9uIjp0cnVlLCJyZXN0b3JhdGlvbiI6dHJ1ZX0%3D

<<:  5Gベースバンドに機械学習ユニットを追加:クアルコムには多くのAI脳の穴がある

>>:  人工知能はクリーンエネルギーへの移行で数兆ドルの節約に貢献できる可能性がある

ブログ    

推薦する

中国科学院の専門家が人工知能の混乱を批判:AIチップなど存在しない

Titanium Media Note:先週日曜日、IEEE SMC 協会 (IEEE システム、人...

新しい5文字描画言語が人気で、ChatGPTはそれを学習しました

たった 5 つの文字でピクセル ペイントを完成させることができます。合計 8 色、最大 256×25...

AIがスマート交通建設を推進し、警察ドローンの高速任務を加速

スマート交通とは、モノのインターネット、空間認識、クラウドコンピューティング、モバイルインターネット...

Pudu Technology が「2021 年最も革新的な中国のケータリング ブランド トップ 100」に選出されました

最近、ケータリングボスインサイダーが主催する「Upward 2021・第6回中国ケータリングイノベー...

人工知能が注目を集め、ロボットキャスターが生放送の「新参者」に

北京ビジネスデイリー(陳偉記者) 知能ロボットは記者、シェフ、囲碁の達人になった後、最近は生放送業界...

...

人間を倒すのは人間自身であり、人工知能は人間を倒すだろう

私たちが住む世界では、炭素をベースとするほぼすべての生物は、遺伝子をその特異性の根拠として利用してい...

データマイニングの10の主要なアルゴリズムを、初心者でも一目で理解できるように平易な言葉で説明しました。

優秀なデータ アナリストは、基本的な統計、データベース、データ分析方法、考え方、データ分析ツールのス...

「地表」から「宇宙」まで、探査ロボットが未知の領域の秘密を解き明かす

ロボットは現代社会で生み出された新しい種です。科学技術の進歩により、ロボットの開発はもはや人間の能力...

魅力的な勾配フリーニューラルネットワーク最適化手法

[[336078]]勾配降下法は、機械学習における最も重要なアイデアの 1 つです。最小化すべきコス...

...

AIがコスト削減、生産性、雇用に与える影響

AI を活用して雇用を減らし、コストを削減する方法を考えている企業は、間違っていると思います。最近、...

...

AIは世界を席巻しており、すべての関係者がアプリケーションの導入に力を入れており、競争は激化している。

テンセントが最近テスラの株式5%を購入したというニュースは業界で大きな話題を呼び、人工知能(AI)分...

人工知能、モノのインターネット、新エネルギーなどへの投資ガイド。

12月21日、百度と華為は包括的な戦略提携を発表した。両者は中国市場とユーザーエクスペリエンスに重...