人間が世界を理解するのに近づく:研究者はAIに「想像力」を与える

人間が世界を理解するのに近づく:研究者はAIに「想像力」を与える

オレンジ色の猫を想像してください。次に、その猫の毛が黒だけであることを想像してください。そして、万里の長城に沿って闊歩する猫を想像してください。この一連の思考により、脳内のニューロンが急速に活性化し、世界に対するこれまでの理解に基づいてさまざまなイメージが浮かび上がります。言い換えれば、人間は異なる特性を持つ物体を想像することが容易なのです。

[[412060]]

しかし、ディープニューラルネットワークはいくつかのタスクにおいて人間と同等かそれ以上のパフォーマンスを達成しているものの、コンピューターは依然として「想像力」という人間特有のスキルに苦労しています。

現在、コンピューターサイエンスの教授であるローラン・イッティ氏と博士課程の学生であるユンハオ・ゲ氏、サミ・アブ・エル・ハイジャ氏、ガン・シン氏を含む南カリフォルニア大学の研究チームは、人間のような能力を使って、これまで見たことのない、異なる特性を持つ物体を想像できるAIを開発した。

「我々は人間の視覚の一般化能力にヒントを得て、人間の想像力を機械でシミュレートしようとした」と、この研究論文の筆頭著者であるゲ氏は語った。「人間は、学んだことを属性(形、姿勢、位置、色など)ごとに分離し、それらを再結合して新しい物体を想像することができる。我々の論文は、ニューラルネットワークを使ってこのプロセスをシミュレートしようとしている。」

AIにおける一般化の問題

車の画像を生成する AI システムを作成したいとします。理想的には、アルゴリズムに車の画像をいくつか入力して、さまざまな角度からさまざまな色で車の画像を生成できるようにします。

これは AI が長年追求してきた目標の 1 つであり、外挿できるモデルを作成することです。つまり、ほんの数例が与えられれば、モデルは基礎となるルールを抽出し、それをこれまでに見たことのない多数の新しい例に適用できるはずです。しかし、機械は通常、オブジェクトの属性を考慮せずに、ピクセルなどのサンプルの特徴に基づいてトレーニングされます。

想像力の科学

新しい研究では、研究者たちは「分離」と呼ばれる概念を使ってこの制限を克服しようとした。分離はディープフェイクを生成するために使用できます。ゲ氏は、こうすることで「新しい画像や動画を合成して、元の人物を別の人物のアイデンティティに置き換えながら、元の動きは維持できる」と指摘した。

同様に、新しい手法では、従来のアルゴリズムのように一度に 1 枚ずつサンプル画像を取得するのではなく、サンプル画像のセットを取得し、それらの類似点を掘り起こして、「制御可能な分離表現学習」と呼ばれるものを実現します。

次に、この知識を再結合して、「新しいイメージの制御可能な合成」、つまり想像力と呼べるものを実現します。 「これは、人間が推測する方法に似ています。ある物体の色を見ると、元の色を新しい色に置き換えることで、他の物体にも簡単に適用できます。」研究チームは、この技術を使用して 156 万枚の画像の新しいデータセットを生成しました。これは、この分野での将来の研究に役立つ可能性があります。

世界を理解する

分離は新しい概念ではないが、研究者らは、彼らのフレームワークはほぼあらゆる種類のデータや知識と互換性があると言う。これにより、応用の機会が広がります。たとえば、人種や性別などのデリケートな属性を方程式から除外すると、より公平な AI を作成できます。

医療分野では、薬物の機能を他の特性から分離し、それらを再結合して新しい薬物を合成することで、医師や生物学者がより有用な薬物を発見するのに役立ちます。機械に想像力を与えることは、より安全な AI の作成にも役立ちます。たとえば、自動運転車が、訓練されていない危険なシナリオを想像して回避できるようになります。

「ディープラーニングは多くの分野で驚くべきパフォーマンスと将来性を示していますが、これは多くの場合、各オブジェクトをユニークにする個々の特性を深く理解することなく、浅い模倣によって行われています」とイッティ氏は述べました。「この新しい分離アプローチは、初めてAIシステムの新しい可能性を解き放ち、世界を人間が理解することに近づけます。」

<<:  エンジニアがソフトロボットを制御する空気圧式コンピュータメモリを開発

>>:  人工知能は人間が理解できない量子実験を設計する

ブログ    
ブログ    
ブログ    

推薦する

OpenAI がハッカーのグループチャットに潜入!盗まれたChatGPTは「Meow Meow GPT」に置き換えられました、ネットユーザー:まさに伝説的

ChatGPT がハッカーによって「ハッキング」された場合、OpenAI はどのように対応するのでし...

AIoT: 次世代コンバージェンスの利点と用途を理解する

人工知能 (AI) とモノのインターネット (IoT) は、過去 10 年間を定義してきました。ビッ...

自動運転車のソフトウェアアップグレードに関する技術管理と規制戦略の分析

スマート車両ネットワーキング、インテリジェンス、アーキテクチャ技術の発展に伴い、自動車ではファームウ...

AIが人間社会に与える影響

今後 25 年間は、既存の制御可能かつプログラム可能ないわゆる「人工知能」を活用して、人類が生物学の...

顔認識の3つの主要技術と4つの主要機能

2016年百度世界大会が開幕し、百度創始者の李承燁氏は大会で「人工知能」をテーマに講演し、最新製品「...

機械学習アルゴリズムを使用して配信リンクを最適化する方法

【51CTO.comオリジナル記事】 1. 背景紹介---VODソース配信の問題点オンデマンドビデオ...

顔認識の悪用は情報セキュリティ上の懸念を引き起こす

食べ物を注文した後、カメラをかざすだけで支払いが完了します。ホテルに宿泊する場合、顔をスキャンしない...

ガートナーは、信頼、成長、変化を通じてイノベーションを推進する新興テクノロジーをリストアップ

[[419256]] [51CTO.com クイック翻訳]信頼の設計、成長の加速、変化の形成は、ガー...

ニューラルシンボリックシステム、学際的相互作用、李飛飛と他の16人の学者がAIの未来について議論する

昨年、ニューヨーク大学の心理学および神経科学の教授であるゲイリー・マーカス氏と、ディープラーニングの...

清華大学の崔鵬氏:因果推論技術の最新開発動向

著者 | 真実を追求する実践主義者人工知能が発展し続けるにつれて、セキュリティとコンプライアンスの問...

...

...

AlphaFold 2 の最強のライバルが自らを弱体化させます!メタ、12人チームを即刻解散

ちょうど今日、Meta 社は商用 AI に注力するため、AI を使用して約 6 億個のタンパク質の折...

ハーバード大学とコロンビア大学が、AlphaFold 2 のプライベート トレーニング データの問題を解決するために 1,600 万個のタンパク質配列をオープンソース化しました。

タンパク質は生命の原動力であり、その配列と構造を理解することは、新しい酵素の設計や命を救う薬の開発な...

2019年ロボカップのハイライト!人間が4対1で勝利し、中国チームが多くの賞を獲得した

[[271788]]今月、オーストラリアのシドニーで2019年ロボカップ(ロボットワールドカップ)が...