人工知能の「想像力」を実現する

人工知能の「想像力」を実現する

[[416371]]

[51CTO.com クイック翻訳]まず、オレンジ色の猫を頭の中で想像してください。次に、同じ猫の毛が真っ黒になっているところを想像してください。さて、そんな猫が万里の長城に沿って闊歩しているところを想像してみてください。

こうした想像の最中、脳内の一連のニューロンが、世界に対するこれまでの理解に基づいて、さまざまなイメージを素早く生成します。つまり、人間は異なる特性を持つ物体を持つことが容易なのです。しかし、コンピューターに関しては、ディープ ニューラル ネットワークが特定のタスクにおいて人間のパフォーマンスに匹敵、あるいはそれを凌駕するほどの画期的な成果を上げているにもかかわらず、人間の「想像力」に対抗することはまだできていない。

現在、USC の研究者チームは、人間のような能力を使って、これまでとは異なる特性を持つ物体を想像する新しい AI を開発しました。この論文「Zero-Shot Synthesis with Group-Supervised Learning」は、今年5月7日にICLR2021(ディープラーニング分野のトップ学術会議)で発表されました。

「私たちは人間の視覚の一般化能力にヒントを得て、人間の想像力を機械でシミュレートしようとしました」と、この研究の主執筆者であるユンハオ・ゲ氏は語った。「人間は、学習したことをさまざまな属性(形状、姿勢、位置、色など)で分離し、それらを再結合して新しい物体を想像することができます。私たちの論文は、ニューラルネットワークを使用してこのプロセスをシミュレートしようとしています。」

人工知能の一般化

たとえば、車の画像を生成する AI システムを作成したいとします。理想的には、アルゴリズムに車の写真を何枚か入力して、ポルシェからポンティアック、ピックアップトラックまで、あらゆるメーカー、形状、色の車の写真をさまざまな角度から生成させることができます。

これは人工知能が長年追求してきた目標の 1 つであり、推論を実行できるモデルを作成することです。この目標を達成するということは、いくつかの例が与えられた場合に、モデルが基本的なルールを抽出し、それをこれまでに見たことのない多数の新しい例に適用できることを意味します。しかし、機械は通常、オブジェクトの属性を考慮せずに、ピクセルなどのサンプルの特徴に基づいてトレーニングされます。

想像力の科学

新しい研究では、研究者らは「分離」と呼ばれる概念を使ってこの限界を克服しようとした。 「デエンタングルメント」は「ディープフェイク」にも利用でき、葛雲豪氏は、人の顔の表情や特徴を「デエンタングルメント」して「フェイススワッピング」することで、元の動きはそのままに、元の持ち主のアイデンティティを別の人物に置き換え、新たな画像や動画を合成できると述べた。同様に、新しい手法では、従来のアルゴリズムのように一度に 1 枚ずつではなく、サンプル画像のセットを取得し、それらの類似点を掘り起こして、「制御可能な分離表現学習」と呼ばれるものを実現します。そして、この知識を組み換えることで、「新しいイメージの制御可能な合成」、つまり「想像力」を実現します。

彼はトランスフォーマーの例を挙げた。メガトロンの形、バンブルビーの色、ニューヨークのタイムズスクエアの背景などは映画から取り入れることができる。その結果、訓練中には見ら​​れなかったものの、タイムズスクエアを疾走するバンブルビー色のメガトロンカーが誕生した。

このプロセスは人間の推論に似ています。人間が 1 つの物体の色を見ると、元の色を新しい色に置き換えることで、その色を他の物体に簡単に適用できます。研究チームはこの技術を使って、この分野の将来の研究に役立つ156万枚の画像の新しいデータセットを生成した。

世界を理解する

もつれ解除は新しいアイデアではないが、研究者らは、このフレームワークはほぼあらゆる種類のデータや知識と互換性があり、応用の機会が広がると述べている。たとえば、敏感な属性を方程式から完全に排除し、人種や性別に関する知識を除外することで、AI はより公平になる可能性があります。

例えば、医療分野では、薬物の機能を他の特性から分離し、それらを再結合して新しい薬物を合成することで、医師や生物学者がより有用な薬物を発見するのに役立ちます。自動運転の分野では、自動運転車がトレーニング中に見たことのない危険なシナリオを想像して回避できるようにすることで、より安全な人工知能の作成を促進します。

「ディープラーニングは多くの分野で比類のないパフォーマンスと将来性を示してきましたが、これは多くの場合、各個人をユニークにする特性を深く理解することなく、浅はかな模倣によって達成されてきました」と、コンピューターサイエンスの教授であるローレン・イッティ氏は語ります。「この新しい『脱エンタングルメント』アプローチは、AIシステムの想像力を真に解き放ち、それを人間の世界理解に近づける初めてのものです。」

オリジナルリンク: 人工知能の「想像力」を可能にする

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  中国は人工知能研究で米国を追い越している

>>:  Githubには13,000個のスターがある。JAXの急速な発展はTensorFlowやPyTorchに匹敵する

ブログ    
ブログ    
ブログ    

推薦する

ヘルスケアにおけるAIの加速

[[407769]]ヘルスケア業界における人工知能の活用AI技術が進歩するにつれて、その応用も拡大し...

...

高性能な PyTorch はどのように実現されるのでしょうか?経験豊富な専門家がまとめた落とし穴を避ける10のヒント

最小限の労力で最も効率的な PyTorch トレーニングを完了するにはどうすればよいでしょうか? P...

...

DiDiのグローバルDi-Techアルゴリズムコンテストが終了し、中国のプレイヤーが10万ドルの優勝賞金を獲得した。

7月20日、滴滴出行の第一回グローバルDi-Techアルゴリズムコンテストが本日正式に終了しました...

「林季」が中国国際サービス貿易交易会に登場しました! Orange Cloud AIエコシステムが従来の産業の束縛を打ち破る

9月3日午後、「オレンジクラウドテクノロジーイノベーションプラットフォームが産業企業のデジタル変革を...

Tech Neo 10月号: 同時実行最適化

51CTO.com+プラットフォームは、オリジナルの技術コンテンツの選択と絶妙なレイアウトを通じて、...

PyTorch スキルを向上させる 7 つの実用的なヒント (例付き)

[[399124]] PyTorch は、動的ニューラル ネットワーク (if ステートメントや ...

ドローンのバッテリー寿命の悩みをどう解決するか?答えは3つの主要な方向から得られる

近年、我が国のドローン産業は、継続的な技術革新、継続的な政策奨励、加速した資本注入、段階的な市場改善...

李碩:AIは産業知能の波を促進する

2020年12月29日、2020年産業インターネットイノベーション大会(第4回)が盛大に開幕しました...

あなたの GPU は Llama 2 のような大規模なモデルを実行できますか?このオープンソースプロジェクトを試してみてください

コンピューティング能力が重要視される時代に、GPU は大規模モデル (LLM) をスムーズに実行でき...

人工知能とデータセンター: AI がリソースを大量に必要とする理由

2023 年末までに AI 生成にどれだけのエネルギーが必要になるかについての予測は不正確です。たと...

人工知能とインテリジェント人工知能、AIの開発はデータサポートから切り離せない

AIは半世紀以上もの間、低調でしたが、囲碁の人工知能プログラム、AI茶室、AI+医療、AI+交通など...

...

AIはIoTベースのDDoS攻撃を阻止できる

研究者らによると、人工知能はインターネットサービスプロバイダー(IPS)がDDoS攻撃に先手を打つの...