顔認識に興味がありますか? JavaScriptで実装された顔検出方法

私はビデオや画像における顔のタグ付け、検出、顔認識技術に常に興味を持っています。顔認識ソフトウェアやプラグインを開発するためのロジックやアルゴリズムを入手するのは私の想像を超えていることは承知しています。笑顔、目、顔の構造を認識できる JavaScript ライブラリについて知ったとき、チュートリアルを書こうという気持ちになりました。純粋な JavaScript ベースまたは Java ベースのライブラリが多数あります。

今日は、 Eduardo Lundgren が開発した軽量の JavaScript ライブラリである、tracking.js の学習を始めます。これを使用すると、リアルタイムの顔検出、色追跡、友達の顔のタグ付けが可能になります。このチュートリアルでは、静止画像から顔、目、口を検出する方法について説明します。

チュートリアルの最後には、ヒントやコツ、さらに技術的な詳細を含む実用的な例を提供するチュートリアルがあります。

まず、プロジェクトをビルドする必要があります。GitHub からプロジェクトをダウンロードし、ビルドフォルダーを抽出します。ファイルとディレクトリの構造に従ってビルドフォルダーを配置します。このチュートリアルでは、次のファイルとディレクトリ構造を使用しました。

フォルダ構造

プロジェクトフォルダ
│
 │ インデックス
│
 ├───資産
│ 顔.jpg
 │
 └───js
    │トラッキング最小値.js
    │トラッキング
    │
    └───データ
            目-min.js
            目.js
            フェイス-min.js
            フェイス
            口-min.js
            口.js

js フォルダーには、tracking.js から抽出した JavaScript ファイルがあることがわかります。以下はindex.htmlのHTMLコードです。

HTMLコード

<!doctype html >  
 <html>  
 <ヘッド>  
   <メタ 文字セット= "utf-8" >  
   < title > @tuts 顔検出チュートリアル</ title >  
   
   <スクリプト  src = "js/tracking-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/face-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/eye-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/mouth-min.js" > </スクリプト>  
   
   <スタイル>  
  .rect {
    境界線: 2px 実線 #a64ceb;
    左: -1000px;
    位置: 絶対;
    上: -1000px;
  } 
   
  #画像 {
    位置: 絶対;
    上位: 50%;
    左: 50%;
    マージン: -173px 0 0 -300px;
  } 
   </スタイル>  
 </ヘッド>  
 <本文>  
 < div  クラス= "imgContainer" >  
   <画像  id = "画像"   src = "アセット/face.jpg"   />  
 </div>  
   
 </本文>  
 </html>

上記の HTML コードでは、tracking.js から 4 つの JavaScript ファイルをインポートします。これらのファイルは、画像から顔、目、口を検出するのに役立ちます。次に、静止画像から顔、目、口を検出するコードを記述します。この画像を意図的に選んだのは、表情やポーズの異なる複数の顔が含まれているからです。

目標を達成するには、HTML ファイルのヘッダー内のコードを変更する必要があります。

HTMLコード

<!doctype html >  
 <html>  
 <ヘッド>  
   <メタ 文字セット= "utf-8" >  
   < title > @tuts 顔検出チュートリアル</ title >  
   
   <スクリプト  src = "js/tracking-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/face-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/eye-min.js" > </スクリプト>  
   <スクリプト  src = "js/data/mouth-min.js" > </スクリプト>  
   
   <スタイル>  
  .rect {
    境界線: 2px 実線 #a64ceb;
    左: -1000px;
    位置: 絶対;
    上: -1000px;
  } 
   
  #画像 {
    位置: 絶対;
    上位: 50%;
    左: 50%;
    マージン: -173px 0 0 -300px;
  } 
   </スタイル>  
 //トラッキングコード。
 <スクリプト>  
     window.onload =関数（）{
      var img =ドキュメント.getElementById('img'); 
   
      var tracker = new tracker.ObjectTracker(['face', 'eye', 'mouth']); // パラメータに基づいて配列を返します。
      トラッカー.setStepSize(1.7); 
   
      トラッキング.track('#img', トラッカー); 
   
      トラッカー.on('トラック', 関数(イベント) {
        イベント.データ.forEach(関数(rect) {
          描画(rect.x、rect.y、rect.width、rect.height);
        });
      }); 
   
      関数draw(x, y, w, h) {
        var rect = document .createElement('div');
        document.querySelector('.imgContainer').appendChild(rect);
        rect.classList.add('rect'); 
         rect.style.width = w + 'px'; 
         rect.style.height = h + 'px'; 
         rect.style.left = (img.offsetLeft + x) + 'px'; 
         rect.style.top = (img.offsetTop + y) + 'px';
      };
    }; 
   </スクリプト>  
   
 </ヘッド>  
 <本文>  
 < div  クラス= "imgContainer" >  
   <画像  id = "画像"   src = "アセット/face.jpg"   />  
 </div>  
   
 </本文>  
 </html>

結果

コードの説明。

tracking.ObjectTracker()メソッドは、追跡するオブジェクトを識別するクラスを受け取り、配列をパラメーターとして受け入れます。
setStepSize() はブロックのステップサイズを指定します。
追跡するオブジェクトを “track” イベントにバインドします。オブジェクトが追跡されると、追跡対象のオブジェクトはすぐに追跡イベントをトリガーします。
データはオブジェクトの配列の形式で取得されます。この配列には、各オブジェクト (顔、口、目) の幅、高さ、x 座標、y 座標が含まれます。

結果の要約。
結果は症状の形状によって異なる場合があり、改善と拡張の余地がありますが、私たちはこのタイプの API の開発を認識し、高く評価しています。

例を実行します:

画像付き実行例。

その他のリソース – Javascript による顔認識

https://github.com/auduno/headtrackr

https://github.com/auduno/clmtrackr

HTML5 Canvas とウェブカメラのビデオおよび画像のタグ付けを使用した顔追跡のチュートリアルを作成する予定です。上で説明したクライアントアクセスカメラブログを使用すると、既知の方法でユーザーのカメラにアクセスできるようになります。

注意:ブラウザのセキュリティ上の理由により、このプログラムは同じドメインで実行するか、ブラウザで Web セキュリティを無効にして実行する必要があります。

この記事は気に入りましたか？

この記事に関してご提案や追加事項がある場合、または誤りや古い情報を見つけた場合は、お気軽にお問い合わせください。皆様のご意見をお待ちしております。

ぜひこの記事を友達と共有したり、コメントを残したりしてください。皆様のご支援を心より感謝いたします！

Javascript ベースの顔検出方法

<<: WeChat JS-SDK-使用許可署名アルゴリズム

>>: 非常に厳しい CPU 制約下でも正常に動作しますか? Java におけるさまざまな圧縮アルゴリズムのパフォーマンス比較

顔認識に興味がありますか? JavaScriptで実装された顔検出方法

Pythonを知らない人は、人工知能時代の新たな「文盲」になるだろう

ChatGPTを使用してPythonクローラースクリプトを自動的に作成する

人工知能技術の発展の概要

自動運転車は交通事故の3分の1しか解決できない、と研究が示す

なぜ2G/3GとAIは火花を散らすことができないのでしょうか?この論文で答えが分かります

複数人の3D姿勢を正確かつ効率的に推定、Meitu Beihang分散知覚シングルステージモデルがCVPRに採用

「ZAO」かっこいいですね！ディープフェイクを使って顔を変える方法

レポート：データセンターは人工知能を生成するサーバーを冷却するために大量の水を消費している

Pythonで検索アルゴリズムを実装する方法を教えます

AI アシスタントの人気が高まっていますが、次に購入するスマートフォンはなぜ電話なのでしょうか?

推薦する

李開復：「AI+」から「+AI」へ、テクノロジーが中国経済を変革

BEVFusionを超えて！高速かつシンプルなBEV統合展開ソリューション

AIの民主化：ローコードおよびノーコードソリューションの台頭

AI、ブロックチェーン、IoT、5Gの未来は統合だ

AIの時代において、従来の検索エンジンはどこへ向かうのでしょうか?

小売業界におけるロボットの応用は何ですか?

次のマーク・ザッカーバーグはAIになるのか？

盲目的に大規模モデルを追求して計算能力を積み上げないでください。シュム、カオ・イン、マー・イーは、AIを理解するための2つの基本原則、シンプルさと自己一貫性を提案した。

プログラム分析を通じてニューラルネットワークプログラムのバックドアを見つける方法

人工知能、モノのインターネット、新エネルギーなどへの投資ガイド。

Googleの視覚言語モデルPaLI-3がリリースされました。パラメータはわずか50億で、より小さく、より高速で、より強力です。