アメリカの科学者が新技術を開発:ロボットが行動する前によく考えさせる

アメリカの科学者が新技術を開発:ロボットが行動する前によく考えさせる

カリフォルニア大学バークレー校の新しい研究によると、ロボットはビデオ認識技術を通じて物体を移動させる前に何が起こるかを「予見」し予測する能力も持つことができるという。

人間には行動する前に考える能力がある。たとえば、ボールを蹴りたい場合、ボールがどこに行くか、そしてボールを新しい場所に蹴る確率を考慮するかもしれません。ロボットは、通常、単純なタスクのみを実行するようにプログラムされており、特に人工知能プログラムを搭載していないロボットでは、この能力が欠けていることがよくあります。

しかし、カリフォルニア大学バークレー校の研究者たちは、ロボットにもこの直感があることを発見した。これを実証するために、研究者らはロボットが先を見越して「これまで遭遇したことのない物体の操作方法を見つけ出す」ことを可能にする新しいロボット学習技術を開発した。

研究チームはこの技術を「視覚的先見」と呼んでいるが、少なくとも現時点では、ロボットが未来を予測する能力を持っているわけではない。

バークレーの研究者たちはこの技術を「Vestri」と呼ばれるロボットに適用し、ロボットのカメラが数秒後に見るものを予測できるようにした。新しいビジョンにより、Vestri は近くにある他の物体に触れることなく、テーブルの上で小さな物体を移動させることができます。最も驚くべきことは、この技術により、ロボットは人間の指導や監督、あるいは物理学の知識がなくても、これらの小さなタスクを実行できるようになることです。

「私たちが周囲の環境で行動するのと同じように、このアプローチにより、ロボットはさまざまな行動が周囲の世界にどのような影響を与えるかを視覚化できます」と、バークレー校の電気工学およびコンピューターサイエンスの助教授で共著者のジル・レヴィン氏は言う。「これにより、複雑な現実世界の環境で非常に柔軟なスキルをインテリジェントに計画できるようになります。」

Visual Foresight の基礎は、「畳み込み再帰ビデオ予測」、つまり動的ニューラル移流 (DNA) です。研究チームによれば、DNAベースのモデルは、ロボットの動作に基づいて、画像内のピクセルが1つのフレームから別のフレームにどのようにジャンプするかを予測できるという。ヴェストリのようなロボットは、今では「さまざまな視覚的物体操作能力を完全に独力で習得できる」と、レバイン研究室の博士課程の学生で、オリジナルの DNA モデルの発明者でもあるチェルシー・ファイン氏は説明する。

レバイン研究室のフェデリコ・アルベルト氏は、このロボットの動作を、人間が周囲の物体とやりとりする方法と比較した。

「人間は生涯を通じて、さまざまな物体と何百万回もやり取りすることで、教師なしで操作スキルを習得します」とアルバート氏は言う。「私たちは、自動的に収集された大量のデータを使用して、幅広く応用可能な操作能力、特に物体を押す能力を学習できるロボットシステムを開発できることを示しました。」

レビン氏は、ヴェストリの能力にはまだいくつかの限界があるが、技術を向上させるためにさらなる措置が講じられるだろうと指摘した。この技術は将来、自動運転車が新しい環境や未知の物体にうまく対応できるようになるかもしれない。

しかし、この目標を達成するには、より洗練されたビデオ予測や手法を組み込むなど、テクノロジーにはまだ多くの改善が必要です。将来のロボットは、同様の技術を使用して、物体を拾い上げて置いたり、衣服やロープなどの柔らかくて変形しやすい物体を扱ったりするなど、より複雑なタスクを実行できるようになるかもしれません。この推測に基づくと、洗濯機には将来、衣類を折りたたむという追加機能が搭載されるようになるかもしれません。

[[215648]]

<<:  AIとビッグデータ2017「成長痛」

>>:  率直に言って、2018年に私たちが耐えなければならないかもしれない人工知能の暗い側面

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

CMU と ETH が画期的な成果を達成: 敏捷性が最大限に高められたロボット犬は、スピードと安全性を兼ね備え、超高速で障害物を乗り越えることができます。

高速ロボット動作の分野では、速度と安全性の両立が常に大きな課題となっています。しかし今、カーネギーメ...

普通のプログラマーはどうやって AI を活用するのでしょうか?

[[199775]]現在、人工知能はますます人気が高まっている分野となっています。普通のプログラマ...

今後 5 年以内にトラックは自動運転できるようになるでしょうか? 「人工知能の女王」はシノトラックでこの答えを出した

「人工知能の女王」ジャスティン・カッセル氏が済南の中国重汽で「人工知能と世界の未来経済」について講演...

速報 | SmartOneがAIショッピングガイドロボットを発表、マイクロソフトと戦略的提携を強化

6月27日、北京のマイクロソフトビルでSmart One 2018新製品発表会が開催された。同会は「...

...

アヴネットの鍾喬海氏:人工知能はモノのインターネットの実装を加速させる

【51CTO.comオリジナル記事】 今日では、AI や IoT テクノロジーに投資する企業がますま...

...

人工知能とデザインの未来

人工知能はあらゆる業界に混乱をもたらしています。医療分野では、AI 技術が病気の診断において人間を上...

開発者にとって必須の 5 つの AI ツール、お見逃しなく!

今日のペースが速く、競争が激しい時代では、作業効率と製品品質の向上が特に重要になっています。ソフトウ...

...

効率が1200倍にアップ! MIT、医薬品製造向けの新たなAIモデルを開発

海外メディアTech Xploreによると、MITの研究者らは最近、新しいタンパク質分子の構造を事前...

顔認識アルゴリズムはどのように機能するのでしょうか?

過去 10 年間で、ディープラーニングの分野では多くの高度な新しいアルゴリズムと画期的な研究が登場し...

...

人工知能技術は、ビルインターホン業界の発展における主流技術の一つとなっている。

現在、人工知能、ビッグデータ、顔認識技術、クラウドコンピューティングなどの新技術が急速に発展し、産業...

バイトマルチモーダル大規模モデル PixelLM: SA に頼らない効率的なピクセルレベル推論

マルチモーダルな大規模モデルが爆発的に増加していますが、画像編集、自動運転、ロボット工学などのきめ細...