この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 さらに、顔分析タスクでは、その精度は実際のデータに劣りません。 これは Microsoft チームによる最新の研究であり、論文のタイトルがすべてを物語っています。
この記事では、プログラムで生成された 3D 顔モデルと合成データベースを組み合わせて画像をトレーニングする方法を紹介します。顔の解析などのタスクの結果は、実際のデータと比較できます。 研究者らは、これにより手作業によるラベル付けが不可能な分野に新たな方法が開かれたと述べた。 将来、本当に手作業によるラベル付けはなくなるのでしょうか? ! どうやってそれを達成するのでしょうか?顔データセットをより多様で豊かにしたい場合、収集とラベル付けによってそれを実現することはますます困難になっています。 言うまでもなく、Web スクレイピングなどの収集は、重大なプライバシーおよび著作権の問題を引き起こす可能性があります。手動でラベルを付ける場合、エラーが発生したり、ラベルに一貫性がなくなったりする可能性があります。 そのため、研究チームは、実際のデータの補強または置き換えに合成データを使用することを検討しました。しかし、顔モデル自体が複雑なため、実装が困難でした。 それで、今回はどのように達成されたのでしょうか? 最初のステップは、プログラムを使用して、アイデンティティ、表情、顔の質感、髪型、服装、さまざまな照明環境下での効果を含む合成顔を生成することです。 これらのデータはすべて個別にサンプリングされ、より多様な個体が作成されるように事前に「手動で」ノイズが除去されました。 例えば顔モデルではこんな感じです〜 例えば衣服はファッションデザイナーやシミュレーションソフトウェアデザイナーによって手作りされており、合計30セットのさまざまな衣服がありました。 ヘッドドレス(36個)、マスク(7個)、メガネ(11個)も含まれています。 これに加えてタグが合成されます。 トレーニング段階に移り、研究者らは解像度 512 × 512 の 10 万枚の画像のデータセットを作成し、データ拡張を実行し、150 個の NVIDIA M60 GPU を使用して 48 時間レンダリングしました。 さらに、チームは顔解析ネットワーク(合成データのみを使用)とラベル適応ネットワークをトレーニングし、合成ラベルと人間が注釈を付けたラベル間の体系的な違いを考慮しました。 最終的に、顔分析やランドマークの位置特定などのタスクの結果は、実際のデータを使用する他のモデルに匹敵します。 しかし、研究者たちはこの技術にはまだ一定の限界があることを認めている。 たとえば、顔のモデルには頭と首しかなく、実際のしわをシミュレートできず、顔をランダムにマッチングすると、ひげを生やした女性など、不合理な顔が生成されます。 今後の研究では、これらの制限に対処する予定です。 興味のある方は下の論文リンクをクリックしてください〜 論文リンク: |
<<: 「未来ロボット」が1億元の資金調達を完了。自動物流が次の「阿修羅場」となるか?
>>: 携帯電話に搭載された3D姿勢推定は、モデルサイズが類似モデルの1/7しかないが、誤差はわずか5cmである。
少し前に、自称メディアスターの板狐仙人が「自動運転のいくつかの期限問題」を発表し、将来の自動運転の実...
導入現在、HBase を搭載した最新の製品では、HBase の読み取りおよび書き込みパフォーマンスに...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
近年、研究者らはトカマクの停止や損傷の原因となる核分裂反応を研究している。核分裂反応を予測・制御でき...
2023年のコンピュータービジョンの分野では、「 Segment Anything Model」が大...
7月7日のニュースによると、サンフランシスコのテクノロジー業界は、数か月に及ぶレイオフの後、人工知能...
「Qwen-72Bモデルは11月30日に発売されます。」数日前、Xプラットフォームのネットユーザー...
太陽光パネルには常に埃や汚れなどのゴミがたまります。また、高層ビルの屋上や遠隔地に設置されていること...
ハリー・ポッターの世界では、組分け帽子は生徒の行動履歴、好み、性格に関するデータを取得し、そのデータ...
iPhone Xのレビュー解禁に伴い、海外の主要主流メディアやテクノロジーブログが関連するテストや体...
[[433624]] 1. バブルソートバブル ソートは、C 言語のシンプルな初級レベルのソート ア...