この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 ターゲット検出業界のスターモデルYOLOの最新バージョンv5が、携帯電話でもプレイできるようになりました! 見てください!わずか数十ミリ秒で、テーブル上のすべてのものが検出されました。 この速度はコンピューターの速度と同等のようですね? 自分で作ってみませんか?チュートリアルに進みます。 AndroidスマートフォンにYOLOv5を導入する正確にはYOLOv5sです。 YOLOv5は2020年5月にリリースされました。最大の特徴は小型モデルで高速なため、モバイル端末でも十分使えることです。 実際、YOLOv5 は、画像の検出、分類、位置合わせのためのiOS アプリとして初めて人々の目に留まり、このアプリは YOLOv5 の作者自身によって開発されました。 Android デバイスにデプロイするには、次の環境が必要です。
テンソルフロー 2.4.0
Android Studio 4.2.1
Xiaomi Mi 11 (メモリ 128GB/ RAM 8GB) 次に、GitHub で著者のプロジェクトを直接ダウンロードします。 git clone --recursive https://github.com/lp6m/yolov5s_android ホストの評価とモデル変換には Docker コンテナを使用します。 cd yolov5s_android docker build ./ -f ./docker/Dockerfile -t yolov5s_android docker run -it —gpus all -v pwd:/workspace yolov5s_anrdoid bash アプリ フォルダー内の ./tflite_model/*.tflite を app/tflite_yolov5_test/app/src/main/assets/ ディレクトリにコピーすると、Android Studio でアプリケーションをビルドできます。 ビルドされたプログラムは、入力画像のサイズ、推論精度、およびモデルの精度を設定できます。 「Open Directory」を選択すると、検出結果はcoco形式のjsonファイルとして保存されます。 カメラからのリアルタイム検出モードでは、精度と入力画像サイズが int8/320 に固定されています。Xiaomi 11 でこのモードで達成される画像フレーム レートは 15FPS です。 このプロジェクトは、著者が参加した「Yolov5s Export」コンテスト(最終的に 2,000 ドルの賞金を獲得)であったため、パフォーマンス評価も実施しました。 評価には遅延と精度が含まれます。
Xiaomi 11 で測定。前処理/後処理およびデータ転送にかかる時間は除きます。 結果は次のとおりです。 モデルの精度が float32 か int8 かに関係なく、時間は 250 ミリ秒以内、つまり 0.5 秒未満で制御できます。 △ フロート32 △ 整数8 お使いのコンピューターで YOLOv5 とパフォーマンスを比較できます。
さまざまなモードでの最高の mAP (平均精度) 値は 28.5 で、最低は 25.5 です。 最後に、詳細なチュートリアルについては、以下のリンクをクリックしてください。試してみたいだけの場合は、作者は上記のAndroidインストールパッケージも提供しています〜 プロジェクトアドレス: https://github.com/lp6m/yolov5s_android |
<<: 脳波を使って魔法ダメージをアップさせよう!プレイヤーが『エルダー・スクロールズV』の脳コンピューターインターフェースを改造して魔法を発動
最近、ニュージーランド出身のブレンダン・バイクロフトという男がテクノロジー界で大流行を巻き起こしてい...
実際の請求ケースでは、保険会社は個人、シナリオ、さらには他の影響要因を含む大量のデータを使用する必要...
「xAIの目標は、宇宙を理解することを主な目的とする、真のAGI(人工汎用知能)を構築することです」...
11月8日、Googleの研究者3人がプレプリントライブラリ(ArXiv)に最近提出した論文の中で、...
糖尿病は網膜症を引き起こす可能性があり、これは失明につながる合併症です。しかし、良いニュースとしては...
ChatGPT は、いくつかの簡単な問題のタスクを完璧に完了できます。しかし、AI に記事全体を書...
インターネット技術の急速な発展に伴い、「クラウド コンピューティング」や「フォグ コンピューティング...
[[443093]]新世代の人工知能技術の台頭は、医療業界にインテリジェント変革を実現するための新た...
近年、人工知能の継続的な台頭により、顔認識が広く使用されるようになり、「顔スキャン」の時代が静かに到...
著者 | 崔昊レビュー | Chonglou一般的なモデルは優れていますが、技術者は、独自の大規模な...
GPT-4V のリリースにより、多くのコンピューター ビジョン (CV) アプリケーションに新たな可...
核酸レポートの手動検証は時間がかかり、面倒で、エラーが発生しやすくなります。どうすればよいでしょうか...