新しい検索エンジンのスキル: アリババの新しい研究では、2D 画像を使用して 3D モデルを検索します

新しい検索エンジンのスキル: アリババの新しい研究では、2D 画像を使用して 3D モデルを検索します

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI技術の研究は2Dからより難しい3Dへと移行しています。 12月3日、記者はアリババの技術チームが2D画像に基づいて対応する3Dモデルを正確に検索できる新しい3D AIアルゴリズムを開発したことを知りました。これにより、精度が10%大幅に向上しました。これにより、3Dプリント、VRハウス内覧、シーンショッピングガイドなどの分野で敷居を下げることができます。この研究成果は、トップAIカンファレンス「NeurIPS 2020」に掲載されました。

3D プリントや VR などの応用シナリオは徐々に成熟していますが、3D 検索に代表される 3D インテリジェント技術はまだ初期の研究段階にあります。たとえば、2D画像の色やテクスチャ情報と3Dモデルの形状情報には違いがあるため、従来のAI手法によるモデルマッチングの精度は低くなります。過去数年間、カーネギーメロン大学、MIT、スタンフォード大学などのトップ機関がこの分野の研究に投資してきました。

(Ali の 3D AI アルゴリズムは、2D 画像に基づく膨大なデータセットから一致する 3D モデルを正確に見つけることができます)

世界最高峰のAIカンファレンス「NeurIPS 2020」の公式発表によると、アリババの技術チームが率先して3D検索の新しい手法を提案しており、まずAIに大量の複雑な2D画像サンプルを学習させ、それによってテクスチャなどの干渉情報を弱め、AIネットワークが幾何学的詳細の学習に集中できるようにすることで、AIが2D画像と3Dモデルの違いをよりよく理解できるようにするという。

実験結果によると、トレーニングされたアルゴリズム モデルは 3D モデル データセットをより効率的に一致させることができ、さまざまなデータセットでの精度が約 10% 向上しました。たとえば、家具の写真を使用すると、家具の 3D モデルを直接見つけることができます。

論文の著者であり、アリババ・タオバオの技術アルゴリズムの専門家であるフー・フアン氏は、「3D検索、3D再構築、3D表示はすべて3D分野の基本技術です。将来、アルゴリズムと3Dデータセットがさらに強力になるにつれて、検索エンジンはあらゆるものの3Dモデルを見つけることができるようになります」と述べています。

アリババの技術チームは、3D再構成や3D検索などの技術分野で数々のブレークスルーを達成し、関連技術はタオバオ3Dショッピングやフラットデザイナーなどのシーンに応用されていると報じられている。今年3月、アリババは国際的に著名な学者数名と協力し、質感の詳細を満載した業界初の大規模3D家具データセット(3D-FUTURE)をオープンソース化し、スタンフォード大学、カリフォルニア大学バークレー校、清華大学、香港中文大学などの大学や、アップルやフェイスブックなどの企業を惹きつけ、最先端の学術研究と応用研究を実施しました。

<<:  競争が激化する中、ドローン配達の時代はいつ来るのでしょうか?

>>:  たった 10 行のコードでディープラーニングを実行できますか? PaddlePaddleフレームワークの高レベルAPIでAIを簡単に操作しよう

ブログ    
ブログ    

推薦する

...

NanoNets: データが限られている場合にディープラーニングを適用するにはどうすればよいでしょうか? (優れた)

私は AI をロケット船の建造に例えています。巨大なエンジンと大量の燃料が必要です。エンジンが大きく...

大学卒業後、彼はGoogleに入社し、先駆的な作品「Thinking Chain」を執筆した。このOpenAIの新人は、学部生の質問に答えている。

「思考の連鎖(CoT)」の概念を注意深く研究したことがあるなら、おそらく Jason Wei とい...

Nvidia の新しいブラック テクノロジーが「Minecraft」のモザイクをリアルな大ヒット作に変える

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能の可能性を解き放つ3つのステップ

ガートナーのデータによると、2020 年までに人工知能は CIO の 30% 以上にとって最優先事項...

AIを活用して食材を分析し、より適切な栄養バランスを実現しましょう!

[[396039]]ビッグデータダイジェスト制作出典: Engadget編集:赤道のパンダ人工知能...

ディープラーニングモデルを使用して Java でテキスト感情分析を実行する

肯定的ですか? 否定的ですか? 中立的ですか? Stanford CoreNLP コンポーネントと数...

...

人工知能: ビジネスの未来はすでに始まっている

ほとんどの場合、テクノロジーがビジネスに与える影響は徐々に増加しますが、時折、ビジネスの世界観全体を...

人工知能アルゴリズムが核融合の応用に一歩近づく

核融合は現在一般的に使用されている核分裂法よりも安全で環境に優しいことはよく知られています。しかし、...

IBMは人工知能にアナログコンピューティングを使用し、AIコンピューティングを改革する

IBM は人工知能コンピューティングを改革する方法に取り組んでいます。 IBM の研究者は、人工知能...

AI人材が500万人不足!文部省、高等職業教育に人工知能専攻を追加

教育部は最近、浙江大学を含む35の大学の学部課程に人工知能専攻科目を追加したことに続き、大学の職業教...

RLHFの2%ハッシュレートを使用してLLMからの有害な出力を阻止するために、ByteはLLM忘却学習を提案した。

大規模言語モデル (LLM) の開発により、実務者はより多くの課題に直面しています。 LLM からの...