Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

[[439245]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ターゲット検出業界のスターモデルYOLOの最新バージョンv5が、携帯電話でもプレイできるようになりました!

見てください!わずか数十ミリ秒で、テーブル上のすべてのものが検出されました。

この速度はコンピューターの速度と同等のようですね?

自分で作ってみませんか?チュートリアルに進みます。

AndroidスマートフォンにYOLOv5を導入する

正確にはYOLOv5sです。

YOLOv5は2020年5月にリリースされました。最大の特徴は小型モデルで高速なため、モバイル端末でも十分使えることです。

実際、YOLOv5 は、画像の検出、分類、位置合わせのためのiOS アプリとして初めて人々の目に留まり、このアプリは YOLOv5 の作者自身によって開発されました。

Android デバイスにデプロイするには、次の環境が必要です。

  • Ubuntu 18.04をホ​​ストする
  • ドッカー

テンソルフロー 2.4.0
パイトーチ 1.7.0
オープンヴィーノ2021.3

  • Androidアプリ

Android Studio 4.2.1
最小SDKバージョン28
ターゲットSDKバージョン29
TFライト2.4.0

  • Androidデバイス

Xiaomi Mi 11 (メモリ 128GB/ RAM 8GB)
オペレーティング システム MUI 12.5.8

次に、GitHub で著者のプロジェクトを直接ダウンロードします。

git clone --recursive https://github.com/lp6m/yolov5s_android

ホストの評価とモデル変換には Docker コンテナを使用します。

cd yolov5s_android docker build ./ -f ./docker/Dockerfile -t yolov5s_android docker run -it —gpus all -v pwd:/workspace yolov5s_anrdoid bash

アプリ フォルダー内の ./tflite_model/*.tflite を app/tflite_yolov5_test/app/src/main/assets/ ディレクトリにコピーすると、Android Studio でアプリケーションをビルドできます。

ビルドされたプログラムは、入力画像のサイズ、推論精度、およびモデルの精度を設定できます。

「Open Directory」を選択すると、検出結果はcoco形式のjsonファイルとして保存されます。

カメラからのリアルタイム検出モードでは、精度と入力画像サイズが int8/320 に固定されています。Xiaomi 11 でこのモードで達成される画像フレーム レートは 15FPS です。

このプロジェクトは、著者が参加した「Yolov5s Export」コンテスト(最終的に 2,000 ドルの賞金を獲得)であったため、パフォーマンス評価も実施しました。

評価には遅延と精度が含まれます。

  • 遅延時間

Xiaomi 11 で測定。前処理/後処理およびデータ転送にかかる時間は除きます。

結果は次のとおりです。

モデルの精度が float32 か int8 かに関係なく、時間は 250 ミリ秒以内、つまり 0.5 秒未満で制御できます。

△ フロート32

△ 整数8

お使いのコンピューターで YOLOv5 とパフォーマンスを比較できます。

  • 正確さ

さまざまなモードでの最高の mAP (平均精度) 値は 28.5 で、最低は 25.5 です。

最後に、詳細なチュートリアルについては、以下のリンクをクリックしてください。試してみたいだけの場合は、作者は上記のAndroidインストールパッケージも提供しています〜

プロジェクトアドレス:

https://github.com/lp6m/yolov5s_android

<<:  脳波を使って魔法ダメージをアップさせよう!プレイヤーが『エルダー・スクロールズV』の脳コンピューターインターフェースを改造して魔法を発動

>>:  顔認識が再び物議を醸す

ブログ    

推薦する

情報格差を打破せよ!大規模モデル向けの驚異的な 3D 視覚化ツールです。

最近、ニュージーランド出身のブレンダン・バイクロフトという男がテクノロジー界で大流行を巻き起こしてい...

機械学習で保険ビジネスの問題を簡素化する3つのシナリオ

実際の請求ケースでは、保険会社は個人、シナリオ、さらには他の影響要因を含む大量のデータを使用する必要...

...

マスク氏がxAIの目標を設定:汎用人工知能の実現期限は2029年

「xAIの目標は、宇宙を理解することを主な目的とする、真のAGI(人工汎用知能)を構築することです」...

...

Googleの新しい論文によると、「AIは人間を超えようとしている」というのはまだ現実的ではなく、AIにも限界がある

11月8日、Googleの研究者3人がプレプリントライブラリ(ArXiv)に最近提出した論文の中で、...

糖尿病網膜症のスクリーニングの改善におけるAIの役割

糖尿病は網膜症を引き起こす可能性があり、これは失明につながる合併症です。しかし、良いニュースとしては...

ChatGPT は検索エンジンに取って代わることができますか?

ChatGPT は、いくつかの簡単な問題のタスクを完璧に完了できます。しかし、AI に記事全体を書...

エアコンピューティング、高度に発達した人工知能を備えた未来の世界

インターネット技術の急速な発展に伴い、「クラウド コンピューティング」や「フォグ コンピューティング...

人工知能医療機器業界は前進する

[[443093]]新世代の人工知能技術の台頭は、医療業界にインテリジェント変革を実現するための新た...

顔認証がまたもや放棄される。米国に続いて今度はEUの番

近年、人工知能の継続的な台頭により、顔認識が広く使用されるようになり、「顔スキャン」の時代が静かに到...

ガイドはここにあります! GPT3.5を微調整して大規模モデルをカスタマイズしましょう!

著者 | 崔昊レビュー | Chonglou一般的なモデルは優れていますが、技術者は、独自の大規模な...

GPT-4Vの自動運転への応用の見通しは?現実世界のシナリオの包括的な評価はここにあります

GPT-4V のリリースにより、多くのコンピューター ビジョン (CV) アプリケーションに新たな可...

...

核酸の結果を数えるのは難しいですか?復旦大学の博士課程の学生の活動が人気に

核酸レポートの手動検証は時間がかかり、面倒で、エラーが発生しやすくなります。どうすればよいでしょうか...