この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 2000年前の古代の巻物(ヘルクラネウム巻物)が、ついに21歳のコンピューター通の若者によって解読された。 この古代の巻物は非常に特別なものであると言えるだろう—— 西暦79年の火山噴火により埋もれて炭化し、1752年まで発掘されませんでした。 さらに、この古代の巻物自体があまりにも壊れやすいため、何百年もの間、誰もそれに触れることを敢えてしませんでした。不適切な取り扱いをすると、塵と化してしまうからです。 (注: ヘルクラネウムと有名な古代都市ポンペイは 8 キロメートル離れており、イタリアのナポリの南東、ベスビオ山のふもとに位置しています。ヘルクラネウムはポンペイよりも火口に近いです。) そのため、そこに何が記録されているかをどのように確認するかは、何百年もの間科学者を悩ませてきた難しい問題となっている。 今回、このコンピューターに詳しいティーンエイジャーが暗号の解読に成功したことで、彼は2000年ぶりに巻物を一度も開いたことがないのに、そこに書かれた文章を「見る」ことができた人物となった。 このタスクは、実際にはVesuvius Challengeと呼ばれるチャレンジから来ています。
この課題を最初に達成した人物として、この少年はイベント主催者からファーストレター賞として4万ドルを授与された。 皆さんの多くは、少年が解読した文章が何なのか気になっているに違いありません。皆さんを不安にさせることなく、答えを直接明らかにします。
結果が発表された後、コンテストのスポンサーであるテクノロジー起業家ナット・フリードマン氏もマスク氏を直視し、誇らしげにこのティーンエイジャーを紹介した。
AIは古代の巻物の解読に大きく貢献したその少年の名前はルーク・ファリター(以下、ルークと略す)で、コンピューターサイエンスを専攻している学生です。 この「ドラゴンスレイヤー」の物語を語る前に、この競技の背景を説明する必要があります。 2019年には早くも、ケンタッキー大学EduceLabのブレント・シールズ教授がヘルクラネウム文書を粒子加速器で撮影し、最大4μmの解像度で3D CTスキャンを生成しました。 △シールズ教授と彼のチームは粒子加速器でスキャンした 同教授の博士課程の学生、スティーブン・パーソンズ氏は、機械学習モデルを使用してCTスキャン内のインクを検出する研究に取り組んでいる。 そこで彼と彼のチームは、インクが見える状態で切り離された巻物の断片をスキャンして写真を撮り、真実のデータセットを提供しました。 △スティーブン博士論文より:地上データを用いた機械学習モデルのトレーニング この研究の成功は、ベスビオ・チャレンジを後援したテクノロジー起業家ナット・フリードマン氏とダニエル・グロス氏の注目を集めました。 彼らは今年3月、古代の巻物の解読を加速させることを目的に、総額7万ドルの賞金をかけた公開コンテストを開始した。 今年8月、ケイシー・ハンドマーという研究者が、インクのように見える「ひび割れ模様」を発見したことについてブログ記事を書いた。 これは非常に重要な進歩と言えるでしょう。スティーブンもこれまでは個々の断片にインクが付着している直接的な証拠しか見たことがなく、巻物にインクが付着しているのを見たことがありませんでした。 その後、ルークさんはポッドキャストでそのニュースとチャレンジを耳にし、Discord でケイシーさんのクラック モードが広く議論されているのを目にしました。 ルーク氏はこれに大いに興味を持ち、夜の時間を使って「亀裂パターン」の機械学習モデルをトレーニングし始めました。 トレーニングの過程で、彼は数十枚のインクスケッチといくつかの完全な文字を発見しました。ルークはそれらをマークし、トレーニングデータとして使用しました。 △左:パピルス繊維の背景にひび割れたインクが見える。右:結果として得られたバイナリインクラベル。 やがて、模型には肉眼では見えないひび割れの跡が現れ、これらの跡が文字や実際の単語の最終的な形成の手がかりとなりました。 下の写真は、ルークさんがチャレンジに応募した作品です。ぼんやりと「ΠΟΡΦΥΡΑϹ」 (porphyras)という文字の形が見えます。 シールズ教授と彼のチームはこの写真を見て驚きました。
この単語は古代の文献ではあまり一般的ではありませんが、考慮する価値はあります。おおよそ「紫」を意味します。 ある専門家は次のように説明した。 πορφυ̣ρ̣ας̣ というシーケンスは、πορφύ̣ρ̣ας̣ (名詞、紫色の染料または紫色の布)または πορφυ̣ρ̣ᾶς̣ (形容詞、紫色)である可能性があります。 文脈が不明なので、πορφύ̣ρ̣α ς̣κ[ または πορφυ̣ρ̣ᾶ ς̣κ[ である可能性も排除されます。 古代の言葉は現代の言葉とは異なることに注意する価値があります。当時のテキストにはスペースがなかったため、単語の境界を特定するのがより困難でした。 最終チャレンジの役員たちは、ルークがイニシャルレター賞に値すると信じていました。そして、彼はその知らせを聞いてとても興奮しました。 別の大学院生も同じ発見をした。偶然にも、ケイシーとルークの研究に触発された別の参加者で、ベルリンのエジプトバイオロボティクスの大学院生であるユーセフ・ナダールは、異なるアプローチを使用して同じ結果を達成しました。 彼は、分離された断片で機械学習を行うスティーブン・パーソンズ氏の手法の改善に焦点を当てた、Kaggle のインク検出賞の受賞作品を審査しました。 これを基に、彼はドメイン転送技術を使用してこれらのモデルを古代の巻物に適応させました。つまり、巻物データに対する教師なし事前トレーニングと、その後の断片ラベルの微調整です。 Kaggle コンペティションからのこの修正モデルを使用することで、彼は Casey の亀裂を見つける手動の方法にまったく頼ることなく、いくつかの文字を見つけることができました。次に、文字の形のようなものをラベルデータに注釈付けしました。 △左:ユセフの作品の最も初期の画像。右:彼の最初の仮想インクラベルのセット。 最適化を繰り返した後、Youssef 氏は次の作品を公式に提出しました。 最終的に、ユセフさんはイニシャルレター賞の2等賞である1万ドルを獲得しました。 ユセフ氏の研究を見た後、専門家たちはルカが発見した古代の巻物に書かれた文章をさらに確認した。 彼らはさらに、上と下の単語について、おそらく ανυοντα (実現する)と ομοιων (似ている) ではないかと推測し始めました。 そしてほんの数日前、ユーセフのモデルはさらに驚くべき結果を生み出した。 この画像では、余白で区切られた 4.5 列のテキストがはっきりと確認できます。 専門家はすべての文字をすぐに認識できたわけではないが、少なくとも多くの文字は見ることができていた。 当局は、専門家らがさらなる調査を行っており、新たな結果がまもなく出るだろうと述べた。 |
>>: CTOは「大きな衝撃を受けた」:GPT-4Vの自動運転テストを5回連続で実施
今年、大規模言語モデルが急速に発展したため、BERT のようなモデルは「小規模」モデルと呼ばれるよう...
人工知能または機械知能は、学習アルゴリズムを通じて人間のような知能をシミュレートします。今日、人工知...
どの学校も生徒をより深く理解したいと考えていますが、テクノロジーを駆使した解決策の中には、満場一致で...
01 データサイエンスとは何ですか? データサイエンスは何をするのですか?まずはデータサイエンスの分...
【51CTO.comオリジナル記事】近年、RPAの開発はかつてないほど注目を集めています。 Mark...
最近、ChatGPT/GPT-4シリーズの製品は世界的な注目と議論を集めており、それらに代表される大...
国内の大型モデルスタートアップがテクノロジーの最前線で新記録を打ち立てている。 10月30日、百川知...
近年、自動化プロセスの導入は世界中で加速しています。生産効率の大幅な向上により、低技能労働者の代わり...