Google は機械学習を利用して画像内のオブジェクトにラベルを付け、インターフェース全体の速度を 3 倍に向上させました。

Google は機械学習を利用して画像内のオブジェクトにラベルを付け、インターフェース全体の速度を 3 倍に向上させました。

台湾メディアiThome.com.twによると、Googleは2018年のACMマルチメディアカンファレンスで機械学習を使った画像注釈インターフェースを発表し、ユーザーは画像内のオブジェクトの輪郭とラベルを素早くマークできるようになり、全体的なタグ付け速度が3倍に向上したという。最新のディープラーニングベースのコンピューター ビジョン モデルのパフォーマンスはラベル付けされたトレーニング データの量に依存するため、データベースが大きいほど機械学習のパフォーマンスが向上します。

Google は多くのディープラーニング研究で、高品質のトレーニング データを取得するのは容易ではないと繰り返し述べており、この問題はコンピューター ビジョンの開発、特に自動運転、ロボット工学、画像検索などのピクセルベースの認識タスクにおける主なボトルネックとなっています。

従来の方法では、ユーザーは手動でラベル付けツールを使用して、画像内のオブジェクトの境界を囲む必要があります。Google は、COCO plus Stuff データセットを使用すると、画像にラベルを付けるには 19 分、データセット全体にラベルを付けるには 53,000 時間かかり、時間がかかりすぎて非効率的であると述べています。そこで Google は、機械学習を使用してユーザーが画像内のオブジェクトの輪郭のラベルをすばやく見つけられるようにする新しいトレーニング データ ラベリング方法である Fluid Annotation を検討しました。

Fluid アノテーションは、強力なセマンティック セグメンテーション モデルの出力から始まります。ユーザーは、機械学習によって支援された自然なユーザー インターフェイスを使用して、それを編集および変更できます。このインターフェイスは、修正する必要があるオブジェクトと順序をユーザーに提供し、マシンがまだ明確に識別できない部分にユーザーが集中できるようにします。画像に注釈を付けるために、Google は分類ラベルと信頼スコアが付いた約 1,000 枚の画像を使用してセマンティック セグメンテーション モデル (Mask-RCNN) を事前トレーニングしました。最も信頼度の高いセグメントは、最初のラベル付けに使用できます。

Fluid Annotation は、ユーザーが 1 回のクリックでオブジェクトにすばやくラベルを付けるための候補リストを生成します。また、ユーザーは、検出されていないオブジェクトをカバーする範囲マーカーを追加し、スクロールして最も適切な形状を選択することもできます。追加できるだけでなく、既存のオブジェクト タグを削除したり、オブジェクトの深度順序を変更したりすることもできます。

流動的な注釈付けの現在のフェーズの目標は、画像をより速く簡単に作成し、データセット全体のラベル付け速度を最大 3 倍に向上させることです。次に、Google はオブジェクト境界のラベル付けを改善し、より多くの人工知能を使用してインターフェース操作を高速化し、現在認識できないカテゴリを処理できるようにインターフェースを拡張します。

<<:  人工知能は人間の言語を習得したのか?見た目は騙されることがある

>>:  中国では普及していない無人コンビニが、なぜアメリカでは人気があるのか​​?

ブログ    
ブログ    
ブログ    

推薦する

バイトダンスのGPTアカウントが突然凍結、OpenAIが不正行為を調査

バイトダンスは、この大規模モデルをめぐる世論の嵐に巻き込まれている。 The Vergeによると: ...

会話型AI: パンデミック時代の最先端技術

パンデミックの発生により、世界中の労働システムが危険にさらされています。コンタクト センターの従業員...

データセンターの物理的セキュリティに AI を活用する方法

機械学習と人工知能は、データセンターの問題に対する万能薬として宣伝されてきました。その多くは誇大宣伝...

自動運転は安全試験に合格するのが難しい。自動車メーカー、サプライヤー、規制当局は協力を強化すべき

[[276381]]現在、レベル3自動運転の量産化を円滑に推進するためには、コンピューティング能力、...

データ構造とアルゴリズム: 単調に増加する数値

[[439817]]単調に増加する数字LeetCode の問題へのリンク: https://leet...

AIに取り組んでいる学部生がオンラインでクラッシュ:GitHubモデルの実行に3か月かかり、難しすぎる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

5G消毒ロボットが武漢を支援し、人間の感染を効果的に防ぐことができる

中国移動の公式ニュースによると、2月3日と2月4日、武漢協和病院と同済天佑病院はそれぞれ、中国移動と...

12ページの線形代数ノートがGitHubのホットリストに掲載され、ギルバート・ストラングからの手書きの署名も受け取っている。

すでに誰かが線形代数の要点を描くのを手伝ってくれています。全12ページ、半分がイラストなので初心者で...

人工知能によりデータセンターの設計が再考される

AI が企業で大規模に導入されるにつれて、データセンターのワークロードのより大きな割合が AI によ...

機械学習がデータセンター管理をどう変えるか

機械学習はデータセンターの経済性を劇的に変え、将来の改善への道を開きます。機械学習と人工知能がデータ...

RPA プロジェクトを社内で開発すべきでない理由

ロボティック・プロセス・オートメーション (RPA) は、今日最も急速に成長しているテクノロジーの ...

顔認証がまたもや放棄される。米国に続いて今度はEUの番

近年、人工知能の継続的な台頭により、顔認識が広く使用されるようになり、「顔スキャン」の時代が静かに到...

AIを活用してパイロットプロジェクトを計画する方法

人工知能 (AI) は、あらゆる業界の企業にビジネス運営の成長と改善の機会を提供します。 Fortu...

...

2024年のテクノロジートレンド: AIは金融サービス企業のデジタル変革の実現に役立つ

AIは銀行の顧客サービスの性質を変える銀行やその他の金融機関は、コールセンターからチャットボット、よ...