1月23日のニュース、今日では、ビデオ監視の存在により、過去には検証が困難だった多くの事実を記録することができるようになりました。 しかし、24時間連続監視で1~2秒の「犯罪現場」を見つけようとするのは、依然として労力を要する作業だ。 欲しい写真をすぐに見つける良い方法はありますか? 実際、数人の外国人が、24 時間のビデオ録画を 10 分で処理し、テキストを使用して画面をフレームごとに正確に検索できるツールを開発しました。 何より、無料です! 使い方は?この道具は「Sieve」と呼ばれ、中国語で「ふるい」を意味します。 まず、Sieve を使用する許可を得るために、API キーを申請する必要があります。 Sieveのウェブサイトのホームページに申し込みポータルがあります。メールアドレスや名前などの簡単な情報を入力するだけです。 次に、受け取ったキーを次の URL に入力します。 https://sievedata.com/App/query?api_key = あなたのキー 開くと、次のインターフェースが表示されます。 「ビデオをアップロード」をクリックし、URL を入力してビデオをアップロードします。 この URL には、クラウド ストレージ リポジトリ上の任意のアドレスを指定できます。 もちろん、ローカルビデオをアップロードすることもできますが、コマンドラインを使用する必要があります—— まずリポジトリ アドレスをクローンし、依存関係をインストールします。 cd automatic-video-processingconda create --name myenv python=3.7conda activate myenvpip install -r requirements.txt 次に、スクリプトを実行し、次の 2 つのパラメータを使用してローカル ビデオをアップロードします。 python run.py --sieve_api_key キー プラットフォームが自動的に URL を生成します。 ビデオをアップロードした後、システムが自動的にデータをフレームに分割し、各フレームに対応するメタデータを生成するまで待ちます (これらのメタデータは「タグ」であり、後続のクエリで対応する画像を見つけやすくなります)。 著者らは、約27万フレームの24時間のビデオを10分未満で処理できると述べている。 次に、最も期待される部分であるクエリを開始できます。 クエリでは固定パラメータを使用する必要があります。 たとえば、person_count に「3」と入力すると、数秒以内に次の結果が表示されます。 まあ、とても満足しています。足だけを見せている人でも検出できます。 各写真はクリックすると拡大して閲覧することができ、右側にはフレームの元情報も表示されます。 ただし、フレームの位置のみが表示され、具体的な時点は表示されないようです。 その他のパラメータは次のとおりです。
クエリを組み合わせることができます。たとえば、「緑の植物、明るい光、2 人の人物」の画像を検索するには、次の 3 つのパラメータを入力します。 必要な結果が見つかったら、画像データをローカル コンピューターにエクスポートすることもできます。 以上が動画検索ツールSieveの使い方と機能です。 本当にリバースモニタリングの効率化が図れるのでしょうか? しかし、一部のネットユーザーが言うように、これは本当に強力そうだが、ビデオに映っている人物がいつ到着し、いつ出発したかがわかるタイムラインが得られ、複数のカメラ間で「容疑者」を追跡できれば、より実用的になるだろう。 著者は次のように返答しました:より実用的なクエリパラメータを提供することを検討しています。 著者についてSieve の創設者の 1 人であり CEO である Mokshith Voodarla 氏は、まだ 20 歳ですが、カリフォルニア大学バークレー校で電気工学とコンピューター サイエンスの学士号を取得しています。 彼は、Scale AI で ML、Ford Greenfield Labs でコンピューター ビジョン、NVIDIA でロボティクスに携わってきました。 ウェブサイトアドレス:クリックして開く GitHub ホームページ: クリックしてアクセス 参考リンク:クリックして開く |
>>: デンマークはロボット工学をリードしています – IoT はどのような役割を果たすのでしょうか?
おそらく、新しく導入されたカスタム指示機能はあまり議論を呼んでいないと感じたため、アルトマン氏は個人...
12月14日水曜日(米国時間)、Googleはクラウドコンピューティングの顧客により良いサービスを提...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[331362]] 1 はじめにトラバーサルとは、特定のノードから開始し、特定の検索ルートに従って...
1G の時代では、電話をかけたり受けたりすることしかできませんでした。 2G 時代は、電話をかけた...
[[243616]]地図: 小魚クラウド コンピューティングやビッグ データなどのアプリケーション...
[[249335]] VentureBeatによると、Googleの人工知能研究部門は音声認識におい...
顔認識は、テクノロジーを通じて人の顔を識別する方法です。顔認識システムは生体認証技術を使用して、写真...
Language I/O のプロダクト担当副社長である Chris Jacob が、進化する AI ...
スポーツにロボットを導入することは、器用な移動、リアルタイムのモーション制御、経路計画などの最新ロボ...