Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

[[439245]]

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

ターゲット検出業界のスターモデルYOLOの最新バージョンv5が、携帯電話でもプレイできるようになりました！

見てください！わずか数十ミリ秒で、テーブル上のすべてのものが検出されました。

この速度はコンピューターの速度と同等のようですね？

自分で作ってみませんか?チュートリアルに進みます。

AndroidスマートフォンにYOLOv5を導入する

正確にはYOLOv5sです。

YOLOv5は2020年5月にリリースされました。最大の特徴は小型モデルで高速なため、モバイル端末でも十分使えることです。

実際、YOLOv5 は、画像の検出、分類、位置合わせのためのiOS アプリとして初めて人々の目に留まり、このアプリは YOLOv5 の作者自身によって開発されました。

Android デバイスにデプロイするには、次の環境が必要です。

Ubuntu 18.04をホストする
ドッカー

テンソルフロー 2.4.0
パイトーチ 1.7.0
オープンヴィーノ2021.3

Androidアプリ

Android Studio 4.2.1
最小SDKバージョン28
ターゲットSDKバージョン29
TFライト2.4.0

Androidデバイス

Xiaomi Mi 11 (メモリ 128GB/ RAM 8GB)
オペレーティングシステム MUI 12.5.8

次に、GitHub で著者のプロジェクトを直接ダウンロードします。

git clone --recursive https://github.com/lp6m/yolov5s_android

ホストの評価とモデル変換には Docker コンテナを使用します。

cd yolov5s_android docker build ./ -f ./docker/Dockerfile -t yolov5s_android docker run -it —gpus all -v pwd:/workspace yolov5s_anrdoid bash

アプリフォルダー内の ./tflite_model/*.tflite を app/tflite_yolov5_test/app/src/main/assets/ ディレクトリにコピーすると、Android Studio でアプリケーションをビルドできます。

ビルドされたプログラムは、入力画像のサイズ、推論精度、およびモデルの精度を設定できます。

「Open Directory」を選択すると、検出結果はcoco形式のjsonファイルとして保存されます。

カメラからのリアルタイム検出モードでは、精度と入力画像サイズが int8/320 に固定されています。Xiaomi 11 でこのモードで達成される画像フレームレートは 15FPS です。

このプロジェクトは、著者が参加した「Yolov5s Export」コンテスト（最終的に 2,000 ドルの賞金を獲得）であったため、パフォーマンス評価も実施しました。

評価には遅延と精度が含まれます。

遅延時間

Xiaomi 11 で測定。前処理/後処理およびデータ転送にかかる時間は除きます。

結果は次のとおりです。

モデルの精度が float32 か int8 かに関係なく、時間は 250 ミリ秒以内、つまり 0.5 秒未満で制御できます。

△ フロート32

△ 整数8

お使いのコンピューターで YOLOv5 とパフォーマンスを比較できます。

正確さ

さまざまなモードでの最高の mAP (平均精度) 値は 28.5 で、最低は 25.5 です。

最後に、詳細なチュートリアルについては、以下のリンクをクリックしてください。試してみたいだけの場合は、作者は上記のAndroidインストールパッケージも提供しています〜

プロジェクトアドレス:

https://github.com/lp6m/yolov5s_android

<<: 脳波を使って魔法ダメージをアップさせよう！プレイヤーが『エルダー・スクロールズV』の脳コンピューターインターフェースを改造して魔法を発動

>>: 顔認識が再び物議を醸す

OpenAIはDALL-E 3モデルをテストしていると報じられており、AI画像生成を新たな段階に押し上げると期待されている。

ブログ

「反AI」感情を捨て去ろう！ドイツのマックス・プランク研究所が明らかに：人間は自己カスタマイズされたAIアートを好む

ブログ

ホワイトペーパー「マシンビジョンセキュリティカメラの画質評価手法に関する調査レポート」を公開

ブログ

2021年に注目すべき5つのAIトレンド

ブログ

人工知能時代のセキュリティ専門職とは？

ブログ

CMU がオープンソースの AI コード生成モデルを作成、C 言語は Codex を上回る

ブログ

個人情報を使って死者をデジタルで蘇らせるロボットを作る

ブログ

13 のインテリジェントなインタラクティブ AI チャットボットプラットフォーム

ブログ

製薬業界を覆すAIは「仕掛け」か「希望」か？

ブログ

Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

AndroidスマートフォンにYOLOv5を導入する

OpenAIはDALL-E 3モデルをテストしていると報じられており、AI画像生成を新たな段階に押し上げると期待されている。

「反AI」感情を捨て去ろう！ドイツのマックス・プランク研究所が明らかに：人間は自己カスタマイズされたAIアートを好む

ホワイトペーパー「マシンビジョンセキュリティカメラの画質評価手法に関する調査レポート」を公開

2021年に注目すべき5つのAIトレンド

人工知能時代のセキュリティ専門職とは？

CMU がオープンソースの AI コード生成モデルを作成、C 言語は Codex を上回る

個人情報を使って死者をデジタルで蘇らせるロボットを作る

13 のインテリジェントなインタラクティブ AI チャットボットプラットフォーム

製薬業界を覆すAIは「仕掛け」か「希望」か？

推薦する

情報格差を打破せよ！大規模モデル向けの驚異的な 3D 視覚化ツールです。

機械学習で保険ビジネスの問題を簡素化する3つのシナリオ

マスク氏がxAIの目標を設定：汎用人工知能の実現期限は2029年

Googleの新しい論文によると、「AIは人間を超えようとしている」というのはまだ現実的ではなく、AIにも限界がある

糖尿病網膜症のスクリーニングの改善におけるAIの役割

ChatGPT は検索エンジンに取って代わることができますか?

エアコンピューティング、高度に発達した人工知能を備えた未来の世界

人工知能医療機器業界は前進する

顔認証がまたもや放棄される。米国に続いて今度はEUの番

ガイドはここにあります! GPT3.5を微調整して大規模モデルをカスタマイズしましょう！

GPT-4Vの自動運転への応用の見通しは？現実世界のシナリオの包括的な評価はここにあります

核酸の結果を数えるのは難しいですか？復旦大学の博士課程の学生の活動が人気に