Google AIが新世代の「物体検出」システムをリリース

Google AIが新世代の「物体検出」システムをリリース

[[319182]]

3月19日、Google BrainとAIチームは今週、EfficientDet(効率的検出)と呼ばれる人工知能システムをリリースしました。

このシステムは計算量を削減し、より効率的な検出ターゲットを取得します。

このシステムの開発者らは、CPU や GPU と併用した場合、YOLO や AmoebaNet などの他の一般的な検出モデルよりも高速なパフォーマンスも実現できると述べています。

EfficientDet は、物体検出に関連する別のタスクでも優れたパフォーマンスを達成しました。 PASCAL を使用してオブジェクトを視覚化し、データセットをトレーニングしてセマンティック セグメンテーション実験を実行します。

EfficientDet は、Coral ボード シングルボード コンピューター向けに昨年提供された一連の高度なオブジェクト検出モデルである EfficientNet の更新バージョンです。 Google のエンジニアである Mingxing Tan、Ruoming Pang、Quoc Le の 3 人は、昨年秋に初めて発表した論文で EfficientDet の詳細を説明したが、日曜日にその論文 (コードを含む) を改訂し、更新した。

「精度と効率を最適化することを目標に、使用要件を満たすさまざまなモデルを開発したいと考えています」と、物体検出のためのニューラルネットワークアーキテクチャの設計を研究した論文には記されている。

物体検出をスケーリングする既存の方法は、精度を犠牲にしたり、リソースを大量に消費したりすることが多いと著者らは述べている。 EfficientDet は、「すべてのバックボーン、特徴ネットワーク、ボックス/クラス予測ネットワークの解像度、深度、幅を同時にスケーリング」することで、エッジまたはクラウドでオブジェクト検出を展開するための、より安価でリソースをあまり消費しない方法を可能にします。

「モデルのサイズが巨大で計算​​コストが高いため、モデルのサイズとレイテンシが厳しく制約されるロボット工学や自動運転車などの多くの現実世界のアプリケーションへの導入が妨げられている」と論文には書かれている。 「これらの現実世界のリソース制約を考慮すると、物体検出においてモデルの効率性がますます重要になります。」

EfficientDet の最適化は、Tan と Le による EfficientNet に関するオリジナルの研究に触発されています。バックボーン ネットワークとフィーチャ ネットワークの結合複合スケーリング手法を提案します。このうち、特徴ネットワークとしては双方向特徴ピラミッドネットワーク(BiFPN)が使用され、バックボーンネットワークとしてはImageNet事前学習済み特徴ネットワークが使用されます。

EfficientDet は、入力エッジが 1 つだけのノードを削除してクロススケール接続を最適化し、よりシンプルな双方向ネットワークを作成します。また、効率性とシンプルさで知られるオブジェクト検出器の一種であるシングルステージ検出器パラダイムにも依存しています。

「我々は、特徴融合中に各入力に追加の重みを追加して、ネットワークが各入力特徴の重要性を学習することを提案する」と論文には書かれている。

これは Google からの最新の物体検出ニュースです。Google の物体検出用 Google Cloud Vision システムは最近、公開 API から男性と女性のラベルを削除しました。

KHARI JOHNSON 著

<<:  顔認識技術が「無人小売」時代の到来を牽引

>>:  IoTミツバチ:私たちの未来を救う技術

ブログ    
ブログ    

推薦する

MITはレーザー彫刻機にAIを搭載し、材料を自動的に識別し、98%の精度で彫刻の強度を判定した。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

機械学習の再考: 人工知能はどのようにして「記憶を失う」ことを学ぶのか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

ビデオ会議圧縮アルゴリズム

ビデオ会議 264 ビデオ圧縮 - SVC H.264 には、階層化されたエンコードを可能にする S...

2021年に注目すべき人工知能と機械学習の5つのトレンド

人工知能と機械学習は市場で注目されている技術であり、その重要性は 2020 年にピークに達しました。...

アリババが3D位置マップ圧縮アルゴリズムを革新、その論文結果がトップカンファレンスCVPR 2022に選出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

10回!マイクロソフトは、1000億のパラメータをトレーニングできる史上最大のNLGモデルをオープンソース化しました。

AI の最新の傾向は、自然言語モデルが大きくなるほど精度が向上するということですが、コスト、時間、...

...

AI技術年次報告:中国の2つの側面におけるパフォーマンスは注目に値する

スタンフォード大学は最近、「人工知能指数(2018年グローバルAIレポート)」を発表しました。これは...

マイクロソフトは、Power Platform 向け Copilot サービスの開始を正式に発表しました。これにより、AI によるアプリ開発が一文で可能になります。

マイクロソフトは10月27日、エンタープライズアプリケーションカンファレンスにおいて、ローコードプラ...

基本的なアルゴリズムについての簡単な説明: AVL ツリーとスプレイ ツリー (パート 3)

順序上記に引き続き、このトピックについて話し続けましょう。バランス二分木: AVL 木 (1962)...

150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

過去 10 年間、データ サイエンスと機械学習の分野では驚異的な進歩が見られました。ディープラーニン...

ネットで熱い議論:感染拡大から半年でディープラーニングの求人数が激減

[[340795]]ビッグデータダイジェスト制作近年、ディープラーニング エンジニアは市場で最も人気...

現実世界の AI: 今こそ AI が必要な理由

人類が最も懸念している問題の一つは、人工知能(AI)の将来の発展です。真の AI は、人間の作業のス...

興味深い AI アルゴリズムをいくつかお勧めします。とても面白いです!

デュアルスタイルGAN高解像度のポートレートスタイル転送アルゴリズム​DualStyleGAN​​ ...