ついに!この強力な「オープンソース画像認識システム」がオンラインになりました!

ついに!この強力な「オープンソース画像認識システム」がオンラインになりました!

  [[407147]]

画像認識といえば、皆さんすでによくご存知だと思います。この技術は、顔認証、決済、出勤記録、ホテルチェックイン、カメラによる違法運転の識別、セレブの商品をオンラインで購入する際の画像検索、自動運転車の運転支援、医療画像の補助診断、画像や動画の分析、編集、再現など、私たちの生活のあらゆる側面に深く組み込まれてきました。

これらはすべて画像分類とターゲット検出のアプリケーションではないのかと疑問に思う人もいるかもしれません。しかし、その背後にはさらに多くのものがあり、メトリック学習や画像検索もあり、現在ではさまざまな機能を統合した[ユニバーサル画像認識システム]もあり、1つのシステムであらゆる分野のソリューションを簡単に手に入れることができ、上記のアプリケーションシナリオをカバーしています。

急いでStarで節約しましょう:

https://github.com/PaddlePaddle/PaddleClas

では、このプロジェクトの何が特別なのでしょうか? 画像認識は、画像分類や物体検出よりもどう優れているのでしょうか?

[製品認識]を例に挙げてみましょう。簡単な画像分類と物体検出を使用すると、次のことがわかります。

製品カテゴリは数万種類あり、すべてのカテゴリを事前にトレーニング セットに入れることは不可能です。トレーニング セットが不完全な場合、アルゴリズムをトレーニングするにはどうすればよいですか?

サンプル カテゴリは非常に不均衡です。各カテゴリの製品数は不均等に分散されており、一部のカテゴリには写真が 1 枚または 2 枚しかありません。このようなカテゴリをアルゴリズムでトレーニングしたとしても、認識精度は依然として非常に低くなります。

製品カテゴリは非常に速く更新されます。さまざまな販売者が常に新しいカテゴリを立ち上げており、新しい製品が追加されるたびに、モデルを多大な労力で再トレーニングする必要があります。

画像認識を使用すると、上記の問題を完全に解決できるだけではありません。すぐに始められて、理解しやすいです。識別するオブジェクトの画像を準備したら、複数のカテゴリ、小さなサンプル、データの不均衡の問題を解決するのに必要なのは 3 つのステップだけです。商品認識だけでなく、車両、顔、ロゴ、歩行者も認識可能! ! !識別したいものを何でも識別しましょう! (自由を感じる!)

さらに、この画像認識システムの 4 つのコア コンポーネントはすべて慎重に磨き上げられています。単独で使用しても、連続して使用しても、驚くべき効果があります。

被写体検出: 高精度かつ超軽量の PP-YOLOv2 検出アルゴリズムを使用して、画像の被写体を素早く検出し、認識効率を向上させます。

バックボーン ネットワーク: 最も洗練されたモバイル モデルと高精度のサーバー モデルをカバーする 6 シリーズのバックボーンを選択し、さまざまな使用シナリオのニーズに合わせて構造を迅速に変更できるようにします。

メトリック学習: ArcMargin、CenterLoss、TriHard などの業界最先端のメトリック学習手法を統合し、任意に組み合わせて堅牢な画像機能を簡単にトレーニングできます。

検索システム: Baidu が独自に開発した Möbius アルゴリズムを統合し、ベクトル検索を効率的に完了し、検索ライブラリをいつでも更新できるため、一度のトレーニングで長期使用が可能になります。

開発者は、これら 4 つのモジュールを個別に使用したり、独立して組み立てたりできるだけでなく、車両認識、ロゴ認識、製品認識、アニメーション認識の 4 つの構築されたシステムを直接採用することもできます。検索ライブラリを追加するだけで、すぐに制作を開始できます。

このような強力で思慮深いプロジェクト、何を待っていますか? !急いで🌟スター🌟をコレクションに追加して参加しましょう!

ポータル:

https://github.com/PaddlePaddle/PaddleClas

クイック体験:

https://github.com/PaddlePaddle/PaddleClas/blob/release%2F2.2/docs/zh_CN/tutorials/quick_start_recognition.md

<<:  AI は教育にどのように役立つのでしょうか?

>>:  NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換

ブログ    

推薦する

...

ChatGPT の機能低下が論争を引き起こしています。AIGC アプリケーションは依然として信頼できるのでしょうか?

スタンフォード大学とカリフォルニア大学バークレー校(UCLA)の研究者による新しい研究では、これらの...

...

ChatGPTの現在の時代では、ベクトルデータベースには大規模モデル用のスーパーブレインが搭載されています

次のような経験をしたことはありませんか。インターネットで壁紙を見て、写真に写っている雪をかぶった山や...

新しいAGVロボットナビゲーション技術!屋内ナビゲーション用の新しいロボット フレームワークが登場しました。

移動ロボットは、人間が設計したタスクを完了するために、現実世界の環境を効果的にナビゲートし、周囲の人...

...

...

...

K8S向け機械学習ツール「Kubeflow」の詳しい解説

[51CTO.com オリジナル記事] Kubeflowには多くのコンポーネントがあり、各コンポーネ...

ブラックボックスモデルを突破せよ! MITの中国人博士がモデル解釈のための新しいツールExSumをリリース

近年の人工知能の急速な発展は主にニューラルネットワークモデルによるものですが、モデルが大規模かつ複雑...

OpenAIがGPTストアを正式に開始

1月11日、リーダーシップの混乱を経験した後、人工知能スタートアップOpenAIは製品とサービスのプ...

将来、軍隊は完全に人工知能になるのでしょうか?空想するのはやめてください!全体的な傾向と方向性は変えられない

現在の国際情勢から判断すると、将来の軍事兵器の開発は主に宇宙に向けられることになるが、スペースシャト...

人工知能プロジェクトのための 10 のヒント - ガイド

昨日の人工知能プロジェクトに関する 10 の提案 - 理論に続き、今日は人工知能プロジェクトの 10...

...

...