21 歳の SpaceX インターンが AI を使って大規模な考古学的事件を解決し、4 万ドルを獲得しました。

21 歳の SpaceX インターンが AI を使って大規模な考古学的事件を解決し、4 万ドルを獲得しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

2000年前の古代の巻物(ヘルクラネウム巻物)が、ついに21歳のコンピューター通の若者によって解読された。

この古代の巻物は非常に特別なものであると言えるだろう——

西暦79年の火山噴火により埋もれて炭化し、1752年まで発掘されませんでした。

さらに、この古代の巻物自体があまりにも壊れやすいため、何百年もの間、誰もそれに触れることを敢えてしませんでした。不適切な取り扱いをすると、塵と化してしまうからです。

(注: ヘルクラネウムと有名な古代都市ポンペイは 8 キロメートル離れており、イタリアのナポリの南東、ベスビオ山のふもとに位置しています。ヘルクラネウムはポンペイよりも火口に近いです。)

そのため、そこに何が記録されているかをどのように確認するかは、何百年もの間科学者を悩ませてきた難しい問題となっている。

今回、このコンピューターに詳しいティーンエイジャーが暗号の解読に成功したことで、彼は2000年ぶりに巻物を一度も開いたことがないのに、そこに書かれた文章を「見る」ことができた人物となった。

このタスクは、実際にはVesuvius Challengeと呼ばれるチャレンジから来ています。

出場者は、巻物の4 平方センチメートルの領域内で少なくとも10 文字を見つける必要があります。

この課題を最初に達成した人物として、この少年はイベント主催者からファーストレター賞として4万ドルを授与された。

皆さんの多くは、少年が解読した文章が何なのか気になっているに違いありません。皆さんを不安にさせることなく、答えを直接明らかにします。

これは古代ギリシャ語の πορφυραςであり、紫色の染料または紫色の衣服を意味します。

結果が発表された後、コンテストのスポンサーであるテクノロジー起業家ナット・フリードマン氏もマスク氏を直視し、誇らしげにこのティーンエイジャーを紹介した。

彼はあなたのSpaceXインターンです!

AIは古代の巻物の解読に大きく貢献した

その少年の名前はルーク・ファリター(以下、ルークと略す)で、コンピューターサイエンスを専攻している学生です。

この「ドラゴンスレイヤー」の物語を語る前に、この競技の背景を説明する必要があります。

2019年には早くも、ケンタッキー大学EduceLabのブレント・シールズ教授がヘルクラネウム文書を粒子加速器で撮影し、最大4μmの解像度で3D CTスキャンを生成しました。

△シールズ教授と彼のチームは粒子加速器でスキャンした

同教授の博士課程の学生、スティーブン・パーソンズ氏は、機械学習モデルを使用してCTスキャン内のインクを検出する研究に取り組んでいる。

そこで彼と彼のチームは、インクが見える状態で切り離された巻物の断片をスキャンして写真を撮り、真実のデータセットを提供しました。

△スティーブン博士論文より:地上データを用いた機械学習モデルのトレーニング

この研究の成功は、ベスビオ・チャレンジを後援したテクノロジー起業家ナット・フリードマン氏とダニエル・グロス氏の注目を集めました。

彼らは今年3月、古代の巻物の解読を加速させることを目的に、総額7万ドルの賞金をかけた公開コンテストを開始した。

今年8月、ケイシー・ハンドマーという研究者が、インクのように見える「ひび割れ模様」を発見したことについてブログ記事を書いた。

これは非常に重要な進歩と言えるでしょう。スティーブンもこれまでは個々の断片にインクが付着している直接的な証拠しか見たことがなく、巻物にインクが付着しているのを見たことがありませんでした。

その後、ルークさんはポッドキャストでそのニュースとチャレンジを耳にし、Discord でケイシーさんのクラック モードが広く議論されているのを目にしました。

ルーク氏はこれに大いに興味を持ち、夜の時間を使って「亀裂パターン」の機械学習モデルをトレーニングし始めました。

トレーニングの過程で、彼は数十枚のインクスケッチといくつかの完全な文字を発見しました。ルークはそれらをマークし、トレーニングデータとして使用しました。

△左:パピルス繊維の背景にひび割れたインクが見える。右:結果として得られたバイナリインクラベル。

やがて、模型には肉眼では見えないひび割れの跡が現れ、これらの跡が文字や実際の単語の最終的な形成の手がかりとなりました。

下の写真は、ルークさんがチャレンジに応募した作品です。ぼんやりと「ΠΟΡΦΥΡΑϹ」 (porphyras)という文字の形が見えます。

シールズ教授と彼のチームはこの写真を見て驚きました。

文字はぼやけていたものの、「porphyras」という単語はすぐに読み取れました。

この単語は古代の文献ではあまり一般的ではありませんが、考慮する価値はあります。おおよそ「紫」を意味します。

ある専門家は次のように説明した。

πορφυ̣ρ̣ας̣ というシーケンスは、πορφύ̣ρ̣ας̣ (名詞、紫色の染料または紫色の布)または πορφυ̣ρ̣ᾶς̣ (形容詞、紫色)である可能性があります。

文脈が不明なので、πορφύ̣ρ̣α ς̣κ[ または πορφυ̣ρ̣ᾶ ς̣κ[ である可能性も排除されます。

古代の言葉は現代の言葉とは異なることに注意する価値があります。当時のテキストにはスペースがなかったため、単語の境界を特定するのがより困難でした。

最終チャレンジの役員たちは、ルークがイニシャルレター賞に値すると信じていました。そして、彼はその知らせを聞いてとても興奮しました。

別の大学院生も同じ発見をした。

偶然にも、ケイシーとルークの研究に触発された別の参加者で、ベルリンのエジプトバイオロボティクスの大学院生であるユーセフ・ナダールは、異なるアプローチを使用して同じ結果を達成しました。

彼は、分離された断片で機械学習を行うスティーブン・パーソンズ氏の手法の改善に焦点を当てた、Kaggle のインク検出賞の受賞作品を審査しました。

これを基に、彼はドメイン転送技術を使用してこれらのモデルを古代の巻物に適応させました。つまり、巻物データに対する教師なし事前トレーニングと、その後の断片ラベルの微調整です。

Kaggle コンペティションからのこの修正モデルを使用することで、彼は Casey の亀裂を見つける手動の方法にまったく頼ることなく、いくつかの文字を見つけることができました。次に、文字の形のようなものをラベルデータに注釈付けしました。

△左:ユセフの作品の最も初期の画像。右:彼の最初の仮想インクラベルのセット。

最適化を繰り返した後、Youssef 氏は次の作品を公式に提出しました。

最終的に、ユセフさんはイニシャルレター賞の2等賞である1万ドルを獲得しました。

ユセフ氏の研究を見た後、専門家たちはルカが発見した古代の巻物に書かれた文章をさらに確認した。

彼らはさらに、上と下の単語について、おそらく ανυοντα (実現する)と ομοιων (似ている) ではないかと推測し始めました。

そしてほんの数日前、ユーセフのモデルはさらに驚くべき結果を生み出した。

この画像では、余白で区切られた 4.5 列のテキストがはっきりと確認できます。

専門家はすべての文字をすぐに認識できたわけではないが、少なくとも多くの文字は見ることができていた。

当局は、専門家らがさらなる調査を行っており、新たな結果がまもなく出るだろうと述べた。

<<: 

>>:  CTOは「大きな衝撃を受けた」:GPT-4Vの自動運転テストを5回連続で実施

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

インダストリー4.0: AIを活用した障害検出

[[359728]] AI の向上とマシン ビジョン制御の向上を組み合わせることで、スマート製造業界...

ディープラーニングを使用して、写真用の強力な画像検索エンジンを構築します

[[412644]]数日前、鮮明に覚えている昔の写真を見返したいと思ったのですが、どこにあるのか全...

マイクロソフトはOpenAIに10億ドルを投資:公にはAGIのため、密かにGoogleと競合、クラウドコンピューティングを投資と交換したと非難

[[271493]] AIの巨大競争において、マイクロソフトは本日、新たな重要な一歩を踏み出しました...

インテリジェント運転システムの欠陥解決策の詳細な分析

従来の自動車と比較して、自動運転車は、車両が乗客を安全に目的地まで輸送できるかどうかという実用的な目...

Google の大きな動き!新しくリリースされた Cloud AutoML により、コードを書かずに AI トレーニングを完全自動化

これは大問題だ! Google が大きな動きを見せました!昨日、フェイフェイ・リーとジェフ・ディーン...

...

...

モデルはわずか7M:軽量で高精度な顔認識方式DBFace

わずか 7M サイズのこの顔認識モデルは、世界最大の自撮り写真に写っているほぼすべての人物を認識しま...

.NET 6 でのハッシュ アルゴリズムの簡略化された使用

[[422468]]この記事はWeChatの公開アカウント「amazingdotnet」から転載した...

Google の Bard チャットボットがアップデートされ、リアルタイムで応答を生成できるようになりました

10 月 29 日現在、大規模言語モデル (LLM) では即座に回答を出すことができないため、質問を...

9つの主要な回帰アルゴリズムと例のまとめ

線形回帰は、多くの場合、機械学習やデータサイエンスで最初に学ぶアルゴリズムです。シンプルでわかりやす...

「人工太陽」が正確に放電します! DeepMind、AI制御の核融合で新たなブレークスルーを達成

AI制御の核融合はもうすぐ実現します。ディープマインドは3年間の秘密の研究開発を経て、昨年、AIを使...

3 つのヒープ内キャッシュ アルゴリズム (ソース コードと設計アイデア付き)

トレードオフを最もよく反映するコンピュータ システムのテクノロジといえば、それはキャッシュです。高速...

Facebookの新しいAIモデルは、英語以外の言語から英語以外の言語に直接翻訳できる

海外メディアの報道によると、機械翻訳技術は誕生以来長い道のりを歩んできた。 Google のような翻...