8年生の理科のテストに60点で合格すれば、8万ドル(57万人民元相当)の賞金を獲得できます。
ただし、試験を受ける「学生」は AI である必要があります。 4年間にわたって700人以上のコンピューター科学者がこのAIコンテストに参加しましたが、彼らのAIはすべて不合格となり、合格点を獲得した人は一人もいませんでした。 しかし今、新たな歴史的記録が誕生した。アレン研究所の Aristo という AI がこれを解明しました。8 年生の理科のテストで 90% 以上の質問に正しく答えただけでなく、高校のテストでも 80% の質問に正しく答えました。 これは AI にとってはちょっとやりすぎです。 言語理解+論理、AIは困惑 AIは囲碁の世界チャンピオンに勝ち、テキサスホールデムでブラフを仕掛けることができ、IBMのワトソンはクイズ番組「Jeopardy!」で長年にわたり人気を博してきたが、米国の中学2年生の理科の試験に合格するのは、AIにとって依然として大きな課題だ。 たとえ絵や図表の問題が除外されたとしても、理科の試験の問題と解答は単純な自然言語理解の問題ではなく、論理的推論や常識さえも必要とします。解答がどこかのテキストに明らかに記載されているわけではありません。 たとえば、試験では、いくつかの質問は比較的簡単で、情報の検索のみを必要とします。 特定の機能を実行するために協力する組織のグループは次のように呼ばれます。 (1)臓器 (2)生物 (3)システム (4)細胞 しかし、いくつかの問題は次のようになります: どのような変化によって、ある地域のリスの数が減少するのでしょうか? (1)肉食動物の減少 (2)リス同士の競争が減る (3)食物摂取量の増加 (4)森林火災の増加 これは、ルールを学習するだけで AI が答えられる質問ではありません。論理的推論は人間にとっては簡単かもしれませんが、AI にとってはそれほど簡単ではありません。 複数選択の質問もあります。 2016年にアルファ碁が世界に衝撃を与えたとき、この最強のAIシステムはニューヨーク州の中学2年生の理科のテストで59.3%の正解率しか達成できず、残念ながら不合格となった。 バートをベースにしたアリスト アリストはどのようにして躍進を遂げたのでしょうか? 実際、それは巨人の肩の上に立っています。 Aristo は、Allen Institute のディープコンテキスト単語表現 ELMo (NAACL 2018 最優秀論文) と有名な BERT 開発 (現在は RoBERTa に置き換えられています) に基づいています。8 種類のエージェントを統合しており、そのうちのいくつかはデータベース内で回答を見つける役割を担い、いくつかは関連する概念 (タプル) のリストを確認する役割を担い、いくつかは論理的推論の実行に専念しています。 各エージェントは回答にスコアを付け、Aristo はさまざまなスコアに重み付けして選択を決定します。 実験では、研究者らはアリストに2017年から2019年までのニューヨーク州の各学年の試験を受けさせた。その結果、4年生と8年生の試験におけるアリストの正解率は約90%で、ニューヨーク州教育省が認める「優秀基準」(85%)を満たしていたことが分かった。 12 年生の試験の正解率は 83.54% で、優秀にわずかに届きませんでした。 これまで、これらのテスト データは Aristo のトレーニング セットには含まれていませんでした。 さらに、Aristo の回答はテキストの質問に限定されなくなりました。コンピューター ビジョン関連のチャートの質問にも回答できます。 メディアとのインタビューで、アリストプロジェクトのシニアマネージャーであるピーター・クラーク氏は次のように語った。 アリストの目標は、科学の試験に合格することだけではなく、科学をより深く理解することにつながるシステムを構築することです。 しかし、同様の研究を行ったマイクロソフトの研究員、ジンジン・リウ氏が言うように、現実にはアリストはまだ「本物の」知能を持っておらず、アリストの能力を人間の学生の推論能力と比較することはできない。しかし、間違いなく、それは良いアプリケーションの方向性を生み出します。 たとえば、より強力な検索やパーソナライズされた教育などです。 ちなみに、Aristo には現在オンライン デモがあり、オンラインでプレイできます。 ポータル デモ: http://aristo-demo.allenai.org/ データセット: http://data.allenai.org/ai2-science-questions/ 関連論文: 2019年11月2日更新 |
<<: ロシアのロボット宇宙飛行士が3Dプリントされた骨組織サンプルを持って地球に帰還
Q: S/MIME プロトコルでは 3DES 対称暗号化はどのように実装されていますか? A:実際...
SMICは最近、研究開発への投資を増やすことで14nmプロセスチップを量産し、2021年に正式に出荷...
[[430175]]デジタル変革の波を受けて、さまざまな新興技術が急速に応用され、普及してきました...
いろいろ検索してみたところ、インターネット上にはまだ人工知能に関する本のリストがないので、自分で作っ...
2016年3月、人間と機械の戦い「イ・セドル対AlphaGo」は、人工知能の力を世界に知らしめた。...
[[396433]]この記事はWeChatの公開アカウント「Beta Learns JAVA」から転...
[[428794]]この記事はWeChatの公開アカウント「WeDoctor Front-end ...
もし人工知能技術によって亡くなった愛する人を生き返らせ、あなたと交流できるようにできるとしたら、あな...
専門家は、2025 年までにデータ ユニバース、つまりデータ ユニバースの規模が 180 ゼタバイト...
人工知能と機械学習が人間の世界を完全に変える運命にあることは疑いようがありません。これは軍事分野にも...
現代の産業環境にはセンサーやスマート コンポーネントが満載されており、それらすべてが組み合わさって大...
[[385301]]核となる考え方は、次のように簡単にまとめることができます。ニューラル ネットワー...