新しい検索エンジンのスキル: アリババの新しい研究では、2D 画像を使用して 3D モデルを検索します

新しい検索エンジンのスキル: アリババの新しい研究では、2D 画像を使用して 3D モデルを検索します

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI技術の研究は2Dからより難しい3Dへと移行しています。 12月3日、記者はアリババの技術チームが2D画像に基づいて対応する3Dモデルを正確に検索できる新しい3D AIアルゴリズムを開発したことを知りました。これにより、精度が10%大幅に向上しました。これにより、3Dプリント、VRハウス内覧、シーンショッピングガイドなどの分野で敷居を下げることができます。この研究成果は、トップAIカンファレンス「NeurIPS 2020」に掲載されました。

3D プリントや VR などの応用シナリオは徐々に成熟していますが、3D 検索に代表される 3D インテリジェント技術はまだ初期の研究段階にあります。たとえば、2D画像の色やテクスチャ情報と3Dモデルの形状情報には違いがあるため、従来のAI手法によるモデルマッチングの精度は低くなります。過去数年間、カーネギーメロン大学、MIT、スタンフォード大学などのトップ機関がこの分野の研究に投資してきました。

(Ali の 3D AI アルゴリズムは、2D 画像に基づく膨大なデータセットから一致する 3D モデルを正確に見つけることができます)

世界最高峰のAIカンファレンス「NeurIPS 2020」の公式発表によると、アリババの技術チームが率先して3D検索の新しい手法を提案しており、まずAIに大量の複雑な2D画像サンプルを学習させ、それによってテクスチャなどの干渉情報を弱め、AIネットワークが幾何学的詳細の学習に集中できるようにすることで、AIが2D画像と3Dモデルの違いをよりよく理解できるようにするという。

実験結果によると、トレーニングされたアルゴリズム モデルは 3D モデル データセットをより効率的に一致させることができ、さまざまなデータセットでの精度が約 10% 向上しました。たとえば、家具の写真を使用すると、家具の 3D モデルを直接見つけることができます。

論文の著者であり、アリババ・タオバオの技術アルゴリズムの専門家であるフー・フアン氏は、「3D検索、3D再構築、3D表示はすべて3D分野の基本技術です。将来、アルゴリズムと3Dデータセットがさらに強力になるにつれて、検索エンジンはあらゆるものの3Dモデルを見つけることができるようになります」と述べています。

アリババの技術チームは、3D再構成や3D検索などの技術分野で数々のブレークスルーを達成し、関連技術はタオバオ3Dショッピングやフラットデザイナーなどのシーンに応用されていると報じられている。今年3月、アリババは国際的に著名な学者数名と協力し、質感の詳細を満載した業界初の大規模3D家具データセット(3D-FUTURE)をオープンソース化し、スタンフォード大学、カリフォルニア大学バークレー校、清華大学、香港中文大学などの大学や、アップルやフェイスブックなどの企業を惹きつけ、最先端の学術研究と応用研究を実施しました。

<<:  競争が激化する中、ドローン配達の時代はいつ来るのでしょうか?

>>:  たった 10 行のコードでディープラーニングを実行できますか? PaddlePaddleフレームワークの高レベルAPIでAIを簡単に操作しよう

ブログ    
ブログ    
ブログ    

推薦する

AIトレーニングの福音: 合成データについて

今日、AI テクノロジーは克服するのが難しいいくつかの主要な課題に直面しています。正確な結果を提供す...

フォーカス | 機械学習に役立つ 7 つのクラウド コンピューティング サービス

データ分析は、多くの組織がクラウド コンピューティング プラットフォーム上で実行する主要なコンピュー...

人工知能は世界の終わりか、それとも深淵か?

あなたは深淵を見つめ、深淵もまたあなたを見つめ返します。 「第一法則: ロボットは人間を傷つけたり、...

この記事では人工知能とは何かを徹底的に解説します!

人工知能 (AI) は、自然科学のさまざまな分野を網羅しており、主に特定の種類の知的な人間の活動をモ...

ホワイトハウスのAIに関する大統領令がサイバーセキュリティリーダーに何を意味するか

AIは引き続きテクノロジーの注目を集めており、2023年の最後の四半期を迎えるにあたり、AIの力を活...

...

...

...

すべてのピクセルに教師なしラベル付け! 1時間のビデオに800時間を費やす必要はもうありません

ICLR 2022の授賞式を利用して、MIT、コーネル、Google、Microsoftが新しいSO...

人材情報プラットフォームの変革における人工知能の役割

人工知能 (AI) が人材情報プラットフォームを変革することで採用業界に革命をもたらしていることは否...

GoogleはコードネームGenesisと呼ばれるAIニュースライティング製品をテストしていると報じられている。

ニューヨーク・タイムズ紙は7月20日、3つの情報源を引用して、グーグルがAI技術を使ってニュース記事...

アイデアから実装まで、2018 年の 13 の驚くべき新しい NLP 研究

2018 年には、自然言語処理の分野で多くの刺激的なアイデアやツールが生まれました。概念的な視点から...

もう読み間違えないでください!人工知能と人間の知能の違いを理解する

人工知能が賢くなるにつれて、人類を絶滅させるだろうという主張が次々と現れています。実際、多くの有力者...

自然言語処理がCOVID-19に対する世界的な戦いに貢献

インターネットの普及と膨大な情報の出現により、人工知能の分野における重要な方向性としての自然言語処理...

「車輪の再発明」を拒否し、EasyDL で AI カスタム開発を体験できます

[[414878]]私たちは、あらゆるものが感知され、接続され、インテリジェントになる世界に突入して...