Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

Androidスマートフォンを使用してターゲット検出モデルYOLOv5のロックを解除すると、認識速度はわずか数十ミリ秒です

[[439245]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ターゲット検出業界のスターモデルYOLOの最新バージョンv5が、携帯電話でもプレイできるようになりました!

見てください!わずか数十ミリ秒で、テーブル上のすべてのものが検出されました。

この速度はコンピューターの速度と同等のようですね?

自分で作ってみませんか?チュートリアルに進みます。

AndroidスマートフォンにYOLOv5を導入する

正確にはYOLOv5sです。

YOLOv5は2020年5月にリリースされました。最大の特徴は小型モデルで高速なため、モバイル端末でも十分使えることです。

実際、YOLOv5 は、画像の検出、分類、位置合わせのためのiOS アプリとして初めて人々の目に留まり、このアプリは YOLOv5 の作者自身によって開発されました。

Android デバイスにデプロイするには、次の環境が必要です。

  • Ubuntu 18.04をホ​​ストする
  • ドッカー

テンソルフロー 2.4.0
パイトーチ 1.7.0
オープンヴィーノ2021.3

  • Androidアプリ

Android Studio 4.2.1
最小SDKバージョン28
ターゲットSDKバージョン29
TFライト2.4.0

  • Androidデバイス

Xiaomi Mi 11 (メモリ 128GB/ RAM 8GB)
オペレーティング システム MUI 12.5.8

次に、GitHub で著者のプロジェクトを直接ダウンロードします。

git clone --recursive https://github.com/lp6m/yolov5s_android

ホストの評価とモデル変換には Docker コンテナを使用します。

cd yolov5s_android docker build ./ -f ./docker/Dockerfile -t yolov5s_android docker run -it —gpus all -v pwd:/workspace yolov5s_anrdoid bash

アプリ フォルダー内の ./tflite_model/*.tflite を app/tflite_yolov5_test/app/src/main/assets/ ディレクトリにコピーすると、Android Studio でアプリケーションをビルドできます。

ビルドされたプログラムは、入力画像のサイズ、推論精度、およびモデルの精度を設定できます。

「Open Directory」を選択すると、検出結果はcoco形式のjsonファイルとして保存されます。

カメラからのリアルタイム検出モードでは、精度と入力画像サイズが int8/320 に固定されています。Xiaomi 11 でこのモードで達成される画像フレーム レートは 15FPS です。

このプロジェクトは、著者が参加した「Yolov5s Export」コンテスト(最終的に 2,000 ドルの賞金を獲得)であったため、パフォーマンス評価も実施しました。

評価には遅延と精度が含まれます。

  • 遅延時間

Xiaomi 11 で測定。前処理/後処理およびデータ転送にかかる時間は除きます。

結果は次のとおりです。

モデルの精度が float32 か int8 かに関係なく、時間は 250 ミリ秒以内、つまり 0.5 秒未満で制御できます。

△ フロート32

△ 整数8

お使いのコンピューターで YOLOv5 とパフォーマンスを比較できます。

  • 正確さ

さまざまなモードでの最高の mAP (平均精度) 値は 28.5 で、最低は 25.5 です。

最後に、詳細なチュートリアルについては、以下のリンクをクリックしてください。試してみたいだけの場合は、作者は上記のAndroidインストールパッケージも提供しています〜

プロジェクトアドレス:

https://github.com/lp6m/yolov5s_android

<<:  脳波を使って魔法ダメージをアップさせよう!プレイヤーが『エルダー・スクロールズV』の脳コンピューターインターフェースを改造して魔法を発動

>>:  顔認識が再び物議を醸す

ブログ    
ブログ    

推薦する

プロジェクトを始めたいけれど、どこから始めればいいのか分からないですか?興味深いオープンソースの機械学習プロジェクト7つを試してみる

プロジェクトを実行することが機械学習を学ぶ唯一の方法であり、興味深く価値のあるプロジェクトを見つける...

自動運転のテストが加速:北京と上海が重要なニュースを発表

2018 年後半には、自動運転とインテリジェント コネクテッド ビークルの市場が活況を呈しました。昨...

GPT-4よりも優れた20億パラメータモデルは、ほぼ100%の精度で算術問題を解く

現在、大規模言語モデル (LLM) は、NLP の分野におけるさまざまな下流タスクの処理において優れ...

...

...

AI人材の世界的な需要が急増、一部の職種では年間40万ドル近くを稼ぐ

AI業界の急速な発展に伴い、テクノロジー業界におけるAI人材の需要も高まっています。 USA Tod...

データサイエンスと機械学習のためのトップ 16 プラットフォーム

調査会社ガートナーは、データ サイエンスおよび機械学習プラットフォームを「さまざまなデータ サイエン...

復活したジャンルのトップ10を数えると、必ず気に入るジャンルが見つかる

統計モデルやその他のアルゴリズムに加えて、回帰は機械学習を正常に動作させるための重要な要素です。回帰...

...

AIが建物をスマートにする5つの方法

[[407368]]今の世界は30年前とは大きく異なります。この変化の理由の一部は技術の発展です。今...

人工知能の今後の発展における3つの大きなトレンド、それぞれが驚きである

人工知能は、知能機械や機械知能とも呼ばれ、人間が作った機械が示す知能を指します。人工知能は、医療、テ...

...

機械学習アルゴリズム入門: 線形モデルからニューラルネットワークまで

最近、「機械学習」という言葉をよく耳にするようになりました(通常は予測分析や人工知能の文脈で)。過去...

TikTokの買収者は、コアアルゴリズムの削除を含む4つの買収オプションについて議論している

CNBCが以前報じたように、当初この取引は早ければ火曜日にも発表される予定だったが、当日になっても取...

マシンビジョンは人工知能の次のフロンティアとなる

人工知能は過去1年間で大きな進歩を遂げ、人々にますます多くの利益をもたらしました。将来的には、マシン...