ヒントン氏の「AIは常識を持つ」という予測は、どうすれば実現できるのか?ケンブリッジ大学の最新研究:子犬から学ぶ

ヒントン氏の「AIは常識を持つ」という予測は、どうすれば実現できるのか?ケンブリッジ大学の最新研究:子犬から学ぶ

常識は常に AI の開発を悩ませてきた難しいパズルでした。たとえ AI が囲碁で人間に勝ったとしても、GPT-3 のようなスマートマシンが「太陽の目はいくつあるか」といった質問を理解できないというのは直感に反します。最近、Google DeepMind、インペリアル・カレッジ、ケンブリッジの研究者らは、AI が動物から常識を学習できるという画期的な提案をしました。これからは、子犬を訓練するようにインテリジェントエージェントを訓練できるようになります。

ジェフリー・ヒントンはかつて、10年以内に常識を持ったコンピューターが登場すると予測した。

これらのコンピューターには魂はありません。ただ、人間の世界がどのように機能するかについての知識があり、人間の日常生活に精通しているだけです。彼らは、ストーブは熱くなること、人々が通常 12 台のオーブンを購入することはないこと、などについて知っています。

常識とは何でしょうか?最も一般的な説明は、特別な学習を必要としない生来の判断能力、または説明や実証を必要としない誰もが知っている知識を指すというものです。

[[348961]]

常識は数十年にわたって、AI の開発を悩ませてきた難しいパズルでした。AI が囲碁や Atari のゲームで人間に勝つことができたとしても、GPT-3 のようなスマート マシンが「太陽にはいくつの目があるか」などの質問を理解できないのは常識に反します。

AIに常識を与えるための長い探求において、研究者は多くの場合、神経科学と行動科学からインスピレーションと答えを求めて、乳児や幼児から始めます。

最近、Google DeepMind、インペリアル・カレッジ・ロンドン、ケンブリッジ大学の人工知能研究者らは、AIが動物から常識を学習できるという画期的な提案をしました。

AIが動物から学ぶことが示唆されたのは今回が初めてではない。AIの第一人者ヤン・ルカン氏はかつて「飼い猫は最も賢い機械よりもはるかに常識がある」と述べた。

[[348963]]

人間の常識は、他の多くの動物が持つ一連の基本能力に基づいて構築されており、深層強化学習を通じて、インテリジェントエージェントは動物から多くのことを学ぶことができる可能性があります。

「動物の認知は、非言語的かつ知的な行動のよく理解されたレパートリーを提供し、評価のベンチマークとして役立ち、環境とタスクの設計を導くことができる実験的アプローチを示唆している」と研究チームは、Cell Press Reviews誌に掲載された論文「人工知能と動物の常識」に記している。

子犬から学ぶ?エージェントをペットのように訓練する

有名なイソップ寓話では、鳥たちは水と浮かんでいる餌が入ったガラス管に物を落として水位を上げ、餌を手に入れるように言われました。

[[348964]]

動物を訓練するプロセスには通常、目標と報酬が伴います。たとえば、子犬を訓練する場合、子犬が正しい行動をとれば餌で報酬を与えます。これは、深層強化学習を使用してインテリジェントエージェントを訓練する方法に似ています。

[[348965]]

対照的に、アシスタントのAlexaやSiriなどの他の形態の人工知能には、迷路の中で報酬や食べ物を探す能力がありません。

これまで、認知行動科学者は、ウミガラスの復讐心やイルカの自己認識など、動物がこれまで考えられていたよりも高いレベルの知能を持っていることを発見してきた。 (子どもが自己認識を発達させ、鏡に映った自分の姿を認識できるようになるには、1歳半になる必要があります)

[[348966]]

多くの場合、動物は目的を達成するために欺瞞や策略に訴えることもあります。たとえば、チンパンジーはライバルを混乱させるために目的の物体から目をそらしたり、カケスは秘密の隠し場所を守るために偽の場所に食べ物を保管しているふりをしたりします。

実験では、研究者らはテストシナリオで動物と強化学習エージェントの類似性を利用し、人工知能システムの認知能力をテストする新しい方法を採用した。 「人工知能と動物の常識」という記事では、鳥類と霊長類に対する認知実験について詳しく説明しています。

この実験の本来の目的は、鳥が課題に関連する機能的な物体と非機能的な物体を区別できるかどうかを判断し、関連する因果関係を鳥がどの程度理解しているかを調べることでした。

上手に料理しなければ、食べることはできません。原因と結果を理解し、まずは失敗してみましょう。

リスはナッツの殻をこじ開けて中の果物を取り出す方法を見つけます。また、オウムの中にはさまざまな容器から食べ物を取り出すのが得意な種もいます。ひび割れや穴、割れ目を見ると、「開けたい」と反応する動物もいます。

何故ですか?これは、彼らの意識の中に「原因と結果」という概念があるからです。

つまり、「開ければ食べ物がある」ということです。そして、これはAIにトレーニングが必要な部分でもあります。

著者は動物の訓練方法について考え、「試行錯誤」が非常に効果的であることを発見しました。

動物の認知実験から派生したもので、強化学習エージェントが獲得した常識をテストするために使用される

上記のように、

(A) 身体認知能力は、4つの異なる形式のパイプラインを使用してテストされました。棒を間違った端から引き抜くと、食べ物は失われます。さまざまな状況に対処するために試行錯誤で表面的な関連性のみを学習した動物(i)は、転移課題(バリエーション(ii)~(iv))で成績が悪くなる傾向がありましたが、因果関係の理解を獲得した動物は最初の試行で良い成績を収める傾向がありました。

(B) 物体の永続性の理解をテストするために、目に見えない変位課題が使用されました。餌を与えた後、カップは右に示す最終的な配置に移動されました。次に、動物たちは食べ物が入ったカップを選ばなければなりませんでした。もちろんカップは不透明ですが、食べ物の位置ははっきりと見えます。この目に見えない変位を理解できた動物は、たとえ問題の物体を以前に見たことがなかったとしても、4つの異なる状況すべてで問題なく行動しました。

トレーニングには、壊れたりこじ開けられたりする可能性のある貝殻、ねじを外したりこじ開けたりできないボトルのキャップ、破れやすい梱包箱、その他の物体を含む、十分にリアルな 3D 世界のシミュレーションが必須条件です。

RL エージェントのトレーニングのための 3D 環境

(A)DeepMindゲームルーム環境

(B) 前のものと同じですが、エージェントの視点から

エージェントはシーン内を移動し、オブジェクトを押すことができます。ゲームルーム環境では、エージェントはオブジェクトを拾い上げたり置いたりすることもでき、「テディベアを青い四角形に置く」などの自然言語コマンドを正常に実行すると報酬を受け取ります。 Animal AI 環境では、エージェントは緑色の球体を動かすことで報酬を獲得します。

さらに興味深いのは、動物と食物の因果関係を正確に模倣するためです。研究者たちは、緑色の物体を「食べ物」として位置づけ、触れると肯定的な報酬が得られ、その後、食べられたかのように消える物体だと考えた。

[[348968]]

高次の常識:類推と比喩、AI:私はとても難しい

まとめると、常識は人間に特有のものなのでしょうか?いいえ、研究者たちは、常識はいくつかの基本的な概念に依存していると考えています。たとえば、目の前にある物体は何でしょうか?どれくらいのスペースを占めますか?そして原因と結果の関係など。

さらに、これらの理解は心に深く刻み込まれ、時間が経っても変化しません。

しかし、動物が示す常識には、報酬の認識も含まれると考えられます。

「このような AI 技術をどのように構築するかについては、まだ答えが出ていません。しかし、私たちは、RL エージェントが豊富な仮想環境との拡張されたインタラクションを通じて必要なものを得るというアプローチを提唱しています。」

したがって、適切なタスクについてエージェントをトレーニングすることで、AI に常識を与えることが可能になります。

[[348969]]

もちろん、常識にはこれ以外にも多くのものがあります。物理学は単なる常識の分野です。私たちは、いくつかの心理的概念(何かを信じる、不幸を表現するなど)と関連する常識的な社会的概念(誰かまたは何かと一緒にいる、誰かに何かを与えるなど)を無視しています。

物理的に言えば、上記の実験は固体に焦点を当てています。より完全な概念には、液体 (水たまり、小川、ボトルに入ったワイン)、気体 (煙、霧、炎)、粒子状物質 (土、砂)、さらには変形可能な物体 (スポンジ、紙、ロープ、衣服、葉、枝、動物の体) や空間 (穴、戸口、入り口) も含まれます。

この意味で、常識は相互に関連する基本原則と抽象的な概念の集合として見ることができます。より高度で抽象的なレベルでは、類推や隠喩の使用も含まれます。

[[348970]]

「理想的には、(認知に関する)これらの相互に関連する原理と概念を理解し、人間レベルの一般化と革新の能力を備えたAI技術を構築したい」と論文は結論づけている。

AIに常識を与えるのは、結局のところ長い道のりのようです。

<<:  企業はどのように AI を活用してビジネスの成長を促進できるのでしょうか?

>>:  人工知能が火星の新しいクレーターの発見に貢献

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

私たちは本当にロボットの「カンブリア紀の進化」に近づいているのでしょうか?

ロボット工学の分野は驚異的なスピードで進歩しており、多くの専門家がこの急速な発展を生物学における「カ...

...

AIの変革力:AI市場の探究

人工知能 (AI) は、急速に現代の最も変革的なテクノロジーの 1 つとなり、産業を再編し、生産性を...

金融業界は AI を活用してデータを強化する準備ができているでしょうか?

金融業界は国民経済の生命線です。モバイルインターネットやオンライン決済の普及により、データは企業にと...

スマートシティ:都市生活にテクノロジーを統合する

この魅力的な旅をさらに深く探究する中で、モノのインターネット (IoT)、スマート交通システム、エネ...

GitHub Wanxing リソース: 強化学習アルゴリズムの実装、チュートリアル コード学習計画

[[273322]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

...

人工知能は大学のキャンパスにどのような変化をもたらしたのでしょうか?

[[279290]] [51CTO.com クイック翻訳] 大学はどのようにして、個人の教育キャリ...

...

JavaScript におけるいくつかの一般的なソートアルゴリズムの共有

説明する各ブラウザテストから取得されるデータは異なります。たとえば、Chrome を使用してテストす...

AI技術は非常に高いレベルに達しており、解読と着色は非常に進歩している

画像処理の分野では、AIブラシがますます目立つようになってきています。以前、AIロスレス画像拡大、A...

脳の治癒、人間と機械の共生、マスク氏は「脳コンピューターインターフェース」を擁護

[[316164]]天才イーロン・マスクについて語るとき、多くの人はまずテスラを思い浮かべるでしょう...

AI開発の次のステップ:独自の言語でコミュニケーションするロボット

今日では、周囲の世界を「学習」できることが人工知能アルゴリズムの基本要件となっています。 AI ロボ...