画像認識といえば、皆さんすでによくご存知だと思います。この技術は、顔認証、決済、出勤記録、ホテルチェックイン、カメラによる違法運転の識別、セレブの商品をオンラインで購入する際の画像検索、自動運転車の運転支援、医療画像の補助診断、画像や動画の分析、編集、再現など、私たちの生活のあらゆる側面に深く組み込まれてきました。 これらはすべて画像分類とターゲット検出のアプリケーションではないのかと疑問に思う人もいるかもしれません。しかし、その背後にはさらに多くのものがあり、メトリック学習や画像検索もあり、現在ではさまざまな機能を統合した[ユニバーサル画像認識システム]もあり、1つのシステムであらゆる分野のソリューションを簡単に手に入れることができ、上記のアプリケーションシナリオをカバーしています。 急いでStarで節約しましょう: https://github.com/PaddlePaddle/PaddleClas では、このプロジェクトの何が特別なのでしょうか? 画像認識は、画像分類や物体検出よりもどう優れているのでしょうか? [製品認識]を例に挙げてみましょう。簡単な画像分類と物体検出を使用すると、次のことがわかります。 製品カテゴリは数万種類あり、すべてのカテゴリを事前にトレーニング セットに入れることは不可能です。トレーニング セットが不完全な場合、アルゴリズムをトレーニングするにはどうすればよいですか? サンプル カテゴリは非常に不均衡です。各カテゴリの製品数は不均等に分散されており、一部のカテゴリには写真が 1 枚または 2 枚しかありません。このようなカテゴリをアルゴリズムでトレーニングしたとしても、認識精度は依然として非常に低くなります。 製品カテゴリは非常に速く更新されます。さまざまな販売者が常に新しいカテゴリを立ち上げており、新しい製品が追加されるたびに、モデルを多大な労力で再トレーニングする必要があります。 画像認識を使用すると、上記の問題を完全に解決できるだけではありません。すぐに始められて、理解しやすいです。識別するオブジェクトの画像を準備したら、複数のカテゴリ、小さなサンプル、データの不均衡の問題を解決するのに必要なのは 3 つのステップだけです。商品認識だけでなく、車両、顔、ロゴ、歩行者も認識可能! ! !識別したいものを何でも識別しましょう! (自由を感じる!) さらに、この画像認識システムの 4 つのコア コンポーネントはすべて慎重に磨き上げられています。単独で使用しても、連続して使用しても、驚くべき効果があります。 被写体検出: 高精度かつ超軽量の PP-YOLOv2 検出アルゴリズムを使用して、画像の被写体を素早く検出し、認識効率を向上させます。 バックボーン ネットワーク: 最も洗練されたモバイル モデルと高精度のサーバー モデルをカバーする 6 シリーズのバックボーンを選択し、さまざまな使用シナリオのニーズに合わせて構造を迅速に変更できるようにします。 メトリック学習: ArcMargin、CenterLoss、TriHard などの業界最先端のメトリック学習手法を統合し、任意に組み合わせて堅牢な画像機能を簡単にトレーニングできます。 検索システム: Baidu が独自に開発した Möbius アルゴリズムを統合し、ベクトル検索を効率的に完了し、検索ライブラリをいつでも更新できるため、一度のトレーニングで長期使用が可能になります。 開発者は、これら 4 つのモジュールを個別に使用したり、独立して組み立てたりできるだけでなく、車両認識、ロゴ認識、製品認識、アニメーション認識の 4 つの構築されたシステムを直接採用することもできます。検索ライブラリを追加するだけで、すぐに制作を開始できます。 このような強力で思慮深いプロジェクト、何を待っていますか? !急いで🌟スター🌟をコレクションに追加して参加しましょう! ポータル: https://github.com/PaddlePaddle/PaddleClas クイック体験: https://github.com/PaddlePaddle/PaddleClas/blob/release%2F2.2/docs/zh_CN/tutorials/quick_start_recognition.md |
>>: NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換
人工知能は人間の弱点を補うものであり、人間に代わるものではない多くの人が「人工知能が人間に取って代わ...
今後 20 ~ 30 年で、自動運転車 (AV) は私たちの運転習慣や輸送業界を変え、社会全体に影響...
[[227297]]注: この記事は、Keras の作者である François Chollet に...
人工知能(AI)の急速な発展は、さまざまな業界に革命的な変化をもたらし、イノベーションの新たな時代を...
ヤン・ルカンは演説中に、フランス革命の有名な絵画「民衆を導く自由の女神」を再生し、「革命は監視されな...
[[279134]]機械学習の旅で次の大きな一歩を踏み出す準備はできていますか? 実験的なデータセッ...
大規模な事前トレーニング済み言語モデルと画像拡散モデル (Satble Diffusion など) ...
マシンビジョン技術には、コンピューターサイエンス、人工知能、信号処理、画像処理、機械学習、光学、自動...
人工知能アルゴリズムやディープラーニングなどのさまざまな技術の徹底的な発展により、人工知能(AI)は...
近年、セキュリティ業界では、デジタル化された人工知能の学習および認識技術の概念がかなり普及しています...
企業や政府がサイバーセキュリティに対する意識を高め、毎年数十億ドルがこの分野に投資されるようになると...
スマートホームデバイスへの自然言語生成 (NLG) の統合により、テクノロジーとのやり取りの方法に革...
[[389144]]今まで見たことのない犬種や色であっても、私たちは一目見てその犬を認識することがで...
[[345174]]計算コストが高く、必ずしも解析的な表現ではなく、導関数が不明な関数 f(x) が...