21 歳の SpaceX インターンが AI を使って大規模な考古学的事件を解決し、4 万ドルを獲得しました。

21 歳の SpaceX インターンが AI を使って大規模な考古学的事件を解決し、4 万ドルを獲得しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

2000年前の古代の巻物(ヘルクラネウム巻物)が、ついに21歳のコンピューター通の若者によって解読された。

この古代の巻物は非常に特別なものであると言えるだろう——

西暦79年の火山噴火により埋もれて炭化し、1752年まで発掘されませんでした。

さらに、この古代の巻物自体があまりにも壊れやすいため、何百年もの間、誰もそれに触れることを敢えてしませんでした。不適切な取り扱いをすると、塵と化してしまうからです。

(注: ヘルクラネウムと有名な古代都市ポンペイは 8 キロメートル離れており、イタリアのナポリの南東、ベスビオ山のふもとに位置しています。ヘルクラネウムはポンペイよりも火口に近いです。)

そのため、そこに何が記録されているかをどのように確認するかは、何百年もの間科学者を悩ませてきた難しい問題となっている。

今回、このコンピューターに詳しいティーンエイジャーが暗号の解読に成功したことで、彼は2000年ぶりに巻物を一度も開いたことがないのに、そこに書かれた文章を「見る」ことができた人物となった。

このタスクは、実際にはVesuvius Challengeと呼ばれるチャレンジから来ています。

出場者は、巻物の4 平方センチメートルの領域内で少なくとも10 文字を見つける必要があります。

この課題を最初に達成した人物として、この少年はイベント主催者からファーストレター賞として4万ドルを授与された。

皆さんの多くは、少年が解読した文章が何なのか気になっているに違いありません。皆さんを不安にさせることなく、答えを直接明らかにします。

これは古代ギリシャ語の πορφυραςであり、紫色の染料または紫色の衣服を意味します。

結果が発表された後、コンテストのスポンサーであるテクノロジー起業家ナット・フリードマン氏もマスク氏を直視し、誇らしげにこのティーンエイジャーを紹介した。

彼はあなたのSpaceXインターンです!

AIは古代の巻物の解読に大きく貢献した

その少年の名前はルーク・ファリター(以下、ルークと略す)で、コンピューターサイエンスを専攻している学生です。

この「ドラゴンスレイヤー」の物語を語る前に、この競技の背景を説明する必要があります。

2019年には早くも、ケンタッキー大学EduceLabのブレント・シールズ教授がヘルクラネウム文書を粒子加速器で撮影し、最大4μmの解像度で3D CTスキャンを生成しました。

△シールズ教授と彼のチームは粒子加速器でスキャンした

同教授の博士課程の学生、スティーブン・パーソンズ氏は、機械学習モデルを使用してCTスキャン内のインクを検出する研究に取り組んでいる。

そこで彼と彼のチームは、インクが見える状態で切り離された巻物の断片をスキャンして写真を撮り、真実のデータセットを提供しました。

△スティーブン博士論文より:地上データを用いた機械学習モデルのトレーニング

この研究の成功は、ベスビオ・チャレンジを後援したテクノロジー起業家ナット・フリードマン氏とダニエル・グロス氏の注目を集めました。

彼らは今年3月、古代の巻物の解読を加速させることを目的に、総額7万ドルの賞金をかけた公開コンテストを開始した。

今年8月、ケイシー・ハンドマーという研究者が、インクのように見える「ひび割れ模様」を発見したことについてブログ記事を書いた。

これは非常に重要な進歩と言えるでしょう。スティーブンもこれまでは個々の断片にインクが付着している直接的な証拠しか見たことがなく、巻物にインクが付着しているのを見たことがありませんでした。

その後、ルークさんはポッドキャストでそのニュースとチャレンジを耳にし、Discord でケイシーさんのクラック モードが広く議論されているのを目にしました。

ルーク氏はこれに大いに興味を持ち、夜の時間を使って「亀裂パターン」の機械学習モデルをトレーニングし始めました。

トレーニングの過程で、彼は数十枚のインクスケッチといくつかの完全な文字を発見しました。ルークはそれらをマークし、トレーニングデータとして使用しました。

△左:パピルス繊維の背景にひび割れたインクが見える。右:結果として得られたバイナリインクラベル。

やがて、模型には肉眼では見えないひび割れの跡が現れ、これらの跡が文字や実際の単語の最終的な形成の手がかりとなりました。

下の写真は、ルークさんがチャレンジに応募した作品です。ぼんやりと「ΠΟΡΦΥΡΑϹ」 (porphyras)という文字の形が見えます。

シールズ教授と彼のチームはこの写真を見て驚きました。

文字はぼやけていたものの、「porphyras」という単語はすぐに読み取れました。

この単語は古代の文献ではあまり一般的ではありませんが、考慮する価値はあります。おおよそ「紫」を意味します。

ある専門家は次のように説明した。

πορφυ̣ρ̣ας̣ というシーケンスは、πορφύ̣ρ̣ας̣ (名詞、紫色の染料または紫色の布)または πορφυ̣ρ̣ᾶς̣ (形容詞、紫色)である可能性があります。

文脈が不明なので、πορφύ̣ρ̣α ς̣κ[ または πορφυ̣ρ̣ᾶ ς̣κ[ である可能性も排除されます。

古代の言葉は現代の言葉とは異なることに注意する価値があります。当時のテキストにはスペースがなかったため、単語の境界を特定するのがより困難でした。

最終チャレンジの役員たちは、ルークがイニシャルレター賞に値すると信じていました。そして、彼はその知らせを聞いてとても興奮しました。

別の大学院生も同じ発見をした。

偶然にも、ケイシーとルークの研究に触発された別の参加者で、ベルリンのエジプトバイオロボティクスの大学院生であるユーセフ・ナダールは、異なるアプローチを使用して同じ結果を達成しました。

彼は、分離された断片で機械学習を行うスティーブン・パーソンズ氏の手法の改善に焦点を当てた、Kaggle のインク検出賞の受賞作品を審査しました。

これを基に、彼はドメイン転送技術を使用してこれらのモデルを古代の巻物に適応させました。つまり、巻物データに対する教師なし事前トレーニングと、その後の断片ラベルの微調整です。

Kaggle コンペティションからのこの修正モデルを使用することで、彼は Casey の亀裂を見つける手動の方法にまったく頼ることなく、いくつかの文字を見つけることができました。次に、文字の形のようなものをラベルデータに注釈付けしました。

△左:ユセフの作品の最も初期の画像。右:彼の最初の仮想インクラベルのセット。

最適化を繰り返した後、Youssef 氏は次の作品を公式に提出しました。

最終的に、ユセフさんはイニシャルレター賞の2等賞である1万ドルを獲得しました。

ユセフ氏の研究を見た後、専門家たちはルカが発見した古代の巻物に書かれた文章をさらに確認した。

彼らはさらに、上と下の単語について、おそらく ανυοντα (実現する)と ομοιων (似ている) ではないかと推測し始めました。

そしてほんの数日前、ユーセフのモデルはさらに驚くべき結果を生み出した。

この画像では、余白で区切られた 4.5 列のテキストがはっきりと確認できます。

専門家はすべての文字をすぐに認識できたわけではないが、少なくとも多くの文字は見ることができていた。

当局は、専門家らがさらなる調査を行っており、新たな結果がまもなく出るだろうと述べた。

<<: 

>>:  CTOは「大きな衝撃を受けた」:GPT-4Vの自動運転テストを5回連続で実施

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Nature サブジャーナル: 機械学習を使用してヒトの遺伝子制御の背後にある「文法」を明らかにする

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習の基礎チャート: 概念、原則、歴史、トレンド、アルゴリズム

1. 機械学習の概要1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば、猫...

業界観察:世界の人工知能開発はどのレベルに達しましたか?

[[334267]]今日の技術コミュニティにおける人工知能の開発レベルについては、学界、産業界、メ...

ボストンダイナミクスのロボット犬と一緒に散歩に行きました! 「すごい」って言い続ける…(車横転シーン添付)

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

新型コロナウイルスワクチンの製造はAIに頼っているのか?ジョンソン・エンド・ジョンソンとPwCがAIをどのように活用しているかを学ぶ

現在までに、多くの企業は AI 実験による大きな影響を感じていません。この点について、一部の専門家は...

...

BingチャットAIの品質に問題があるとユーザーが報告、マイクロソフトはエクスペリエンスの改善を約束

ここ数週間、ユーザーは Microsoft Edge に組み込まれている GPT-4 AI チャット...

MIT、指の爪ほどの大きさのドローンを作れるマイクロチップを設計

MITの研究者らが、指の爪ほどの小さなドローン用コンピューターチップを設計6月21日、Venture...

人工知能は諜報機関の「大物」になると期待されている

諜報活動は私たちが想像するよりもはるかに退屈で複雑です。現在、米国の諜報機関は、手作業に代わる人工知...

...

この AI ツールは最近、大騒ぎになっています!試してみますか?

Stable Diffusionをプレイしたことがある人は多いと思います。この製品はmjdjour...

投票の未来: AI、ブロックチェーン、生体認証

投票攻撃は止まらない2016年の米国大統領選挙は紆余曲折を経て、最終的にトランプ氏が米国大統領に選出...

JVMの基本的なガベージコレクションアルゴリズムについて

この記事は JavaEye ブログからの引用であり、元のタイトルは「JVM チューニングの概要 (パ...

Daguan Data: ナレッジグラフと Neo4j の簡単な分析

現在のビッグデータ業界では、アルゴリズムのアップグレード、特に機械学習の導入により、「パターン発見」...