人間の子どもの最も基本的な運動知能、例えばつかむ、持ち上げる、あるいはキルトや衣服をたたむといった家事などを訓練したい場合、ほとんど指導は必要ありません。 多くの場合、赤ちゃんを日常生活の状況に置き、周囲の環境や物体とやりとりさせれば、ほとんどの赤ちゃんは遊びの中で空間、重力、協調性などを判断する能力を自動的に習得することができます。
それに比べると、ロボットはもっと「甘やかされている」のです。 現在、ほとんどのロボットは複雑な環境に適応し、一般的な動作能力を学習することができません。 ここで問題が起こります。ロボットは、プログラマーが事前にプログラムしたいくつかのアクションを「不器用に」実行することしかできず、単一のオブジェクトを使用して単一のスキルを完了することしかできません。この特定のタスクと小道具がロボットの世界のすべてです。たとえば、カップを渡すことはできても、キルトを折ることはできません。 つまり、特定のタスクを処理するためだけに何千ものロボットを設計する必要があるかもしれないということです。これは本当に愚かなことだ。しかし、機械が自律的に世界を認識し、環境の変化に応じて対応する行動を取るように教えるのは、大規模なプロジェクトです。 最近、バークレー大学は視覚モデルの強化学習に基づく新しいアルゴリズムを開発し、万能ロボットを可能にしました。 つまり、本来人間に特有であった「メタ運動知能」が、機械においても発揮される可能性があるのだ。 ロボットが一般的なスキルを習得し、それを「経験」として内面化する能力を持つようになると、毎回再学習したりプログラミングしたりすることなく、さまざまな類似のタスクを柔軟に実行できるようになります。その見通しは明らかに驚くべき価値があります。 それで、このような奇跡的なことはどうやって起こったのでしょうか? 新しいアルゴリズムはどのようにして機械を動作させるのでしょうか? つまり、このアルゴリズムは、ラベルのない感覚データセットを通じてメキシコを予測することができ、機械が多数の多様な画像を自律的に学習し、タスクを完了するときにより柔軟な予測と判断を行うことができます。これにより、各オブジェクトまたはタスクのアルゴリズムを再学習することなく、さまざまなオブジェクトに対してさまざまなタスクを実行できるようになります。 バークレーの研究者にとって、この一般的な運動能力を単一のモードで達成する能力は、知性の基本的な現れです。 では、この方法は具体的にどのようにロボットを誘導して作業を完了させるのでしょうか? まず、研究者たちは、単一の物体やスキルに限定されない、ロボットのための大規模で豊富なデータセットを作成しました。 ロボットには、画像ピクセル(視覚)、腕の位置(自己認識)を感知し、モーターコマンド(動作)を送信できるさまざまなセンサーが搭載されました。 これらの準備が完了したら、2 台のロボットに同時にリソース ライブラリでデータを収集して自律的に学習させ、リアルタイムで共有します。 2 台のロボットは互いの感覚とデータを共有できるため、次の腕の動きを予測する能力を獲得し、可動範囲の柔軟性が向上し、さまざまな種類の物体の操作を含むさまざまなタスクを実行できるようになります。 例えば、リンゴのような硬い物体を動かしたり、衣服のような柔軟な物体を折ったりする作業を機械に実行させたところ、ロボットは非常に優れたパフォーマンスを発揮しました。
さらに、これまで見たことのないターゲットに直面した場合でも、予測は人間ほど完璧ではないものの、指定されたタスクを効果的に完了することができます。 たとえば、下の図では、研究者から与えられたタスクはリンゴを皿に置くことです。中央にはロボットが立てた計画と、その実行が示されています。 このアルゴリズム モデルは、そのアイデアが間違いなくユニークです。予想される結果に基づいて行動計画を立て、さまざまなステップと観察に基づいてリアルタイムで計画を繰り返して改善することは、複雑な世界で予期せぬ事態に対処するための人間独自のスキルです。最近では、ロボットもこのような「高知能」ゲームを学習することが期待されており、その応用範囲の変化は実に刺激的です。 機械効率の座標系の再構築:新しいモデルの適用シナリオ 実際の環境は複雑かつ多様です。この新しいアルゴリズムにより、ロボットの環境適応能力が向上し、タスクの実行がより柔軟になります。ロボットのアプリケーションに大きな想像力をもたらします。 *** のハイライトは、マシンの機能コンセプトがより現実に沿っていることです。一般的な機能はさまざまなタスクに簡単に転送できるため、特定のタスクを完了するために開発および展開する必要があるアルゴリズムの数が大幅に削減されます。 現時点では、新しいモデルは少なくとも以下の分野でロボットのパフォーマンスに革命をもたらすと思われます。
一般的なスキルを習得した機械の用途は多く、その背後にあるビジネスの展望も非常に広いです。結局のところ、効率性は人間が機械を発明した本来の意図です。 果物を味わう前に克服しなければならない課題は何ですか? いろいろ言ってみたものの、新アルゴリズムの実装は難しくなく、アプリケーション側も十分なサポート能力を備えていると感じています。それはすぐに現実になるのでしょうか? 現時点では、「桃を摘む」前に、アルゴリズムにはまだいくつかの特別な制限があり、実際の適用を妨げる可能性があります。 まず、必要なトレーニングデータの量が膨大です。実用的な予測を行う機械の能力は、大規模で多様なデータセットに完全に依存します。 研究者らは、機械が前のフレームの予測された動きの分布に基づいて次のピクセルの動きを想像し、シミュレートできるようにするために、大規模な自己教師学習のために 59,000 件のロボット相互作用のデータセットを導入しました。 コストを抑えながら、いかにして大量かつ高品質なデータリソースを取得するかが、アルゴリズム実装における最大のハードルとなるでしょう。 2つ目は、教師なし学習によってもたらされる一連の問題です。たとえば、トレーニング データにはラベルや報酬メカニズムがないため、ロボットが割り当てられたタスクを理解して受け入れ、結果指向のアクションを実行できるようにする方法については、実際には不明な点が多くあります。 バークレーの解決策は、機械が目標に興味を持ち続け、それを追跡し続け、成功するまで再試行し続ける自己監視アルゴリズムを設定することです。しかし、安定した出力が得られるかどうかについては、さらなる研究が必要です。 たとえば、監視のない機械による予測は、人間が経験に基づいて説明することはできません。それらは最善の伝送ソリューションではない可能性があり、「ブラックボックス」による予測不可能なリスクをもたらす可能性があります。 私たち自身の「メタ知能」がどのように機能するかを理解していないのに、どうすれば機械の「メタ知能」をうまく制御できるのでしょうか? 全体として、このアルゴリズムは驚くべきものですが、完璧ではありません。想像力は美しく、実用性も悪くないが、研究室から商業の現場に至るまでにはまだまだ長い道のりがある。 |
<<: このような秩序だったニューロンは、皆さんがよくご存知の再帰型ニューラル ネットワークに似ていますか?
予想外のことが起こらなければ、人類は人工知能の時代へと急速に進んでいくだろう。ウェイター、宅配便業者...
バーチャルリアリティ(VR)は、新しい実用的な技術です。バーチャルリアリティ技術は、コンピュータ、電...
序文データ構造とアルゴリズムシリーズ(完了部分):時間計算量と空間計算量の分析配列の基本的な実装と特...
COVID-19パンデミックの発生以来、世界中の研究チームがコロナウイルスの検出や感染の予測に役立つ...
AIプログラミングツールを使っている開発者のみなさん、作業効率はどれくらい向上しましたか?最近、AI...
7月21日、鄭州市の西40キロにある米河鎮は停電、インターネット、道路が遮断され、完全な情報孤島とな...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
良いニュースです。お勧めの新しいコースがあります!理論と実践を組み合わせた完全無料の海外で最も人気の...
10月10日、最近のレポートによると、OpenAIの人工知能チャットボットChatGPTの収益成長が...
急速に進化するデジタル環境において、人工知能 (AI) とサイバーセキュリティの組み合わせは、進化す...
経路探索アルゴリズムは、コンピュータグラフィックスや人工知能の分野で一般的に使用されるアルゴリズムの...