Pythonは画像内のすべての顔を認識し、それを表示する機能を実装しています

Pythonは画像内のすべての顔を認識し、それを表示する機能を実装しています

Python3 を使用して、写真内のすべての顔を認識して表示します。コードは次のとおりです。

  1. # -*- コーディング: utf-8 -*-  
  2. # 画像内のすべての顔を識別して表示する 
  3. # ファイル名: find_faces_in_picture.py  
  4. PIL インポート画像から 
  5. 顔認識をインポートする 
  6. # jpgファイルをnumpy配列にロードする 
  7. 画像=顔認識.load_image_file("linuxidc.com.jpg")  
  8. # デフォルトのHOGモデルを使用して画像内のすべての顔を見つけます 
  9. # この方法は非常に正確ですが、GPUアクセラレーションを使用しないため、CNNモデルほど正確ではありません。  
  10. # 参照: find_faces_in_picture_cnn.py  
  11. face_locations = face_recognition.face_locations (画像)  
  12. # CNNモデルの使用 
  13. # face_locations = face_recognition .face_locations(image, number_of_times_to_upsample = 0 , model = "cnn" )  
  14. # 印刷: 画像内にいくつの顔が見つかりましたか?  
  15. print("この写真には {} 人の顔が見つかりました。".format(len(face_locations)))  
  16. # 見つかったすべての面をループする 
  17. face_locations 内の face_location の場合:  
  18. # 各顔の位置情報を出力します 
  19. 上、右、下、=顔の位置   
  20. print("顔はピクセル位置にあります。上: {}、左: {}、下: {}、右: {}".format(top, left, bottom, right))  
  21. # 顔の位置情報を指定して顔画像を表示する 
  22. face_image = 画像[上:下、左:右]  
  23. pil_image = Image.fromarray (face_image)  
  24. pil_image.show()
  1. # またはPythonファイルを実行します 
  2. $ python3 www.linuxidc.com.py

画像から 10 人の顔を識別して表示します。

  1. この写真の中に10人の顔を見つけました。  
  2. 顔はピクセル位置上: 445、左: 1867、下: 534、右: 1957 にあります。  
  3. 顔はピクセル位置上: 544、左: 643、下: 619、右: 718 にあります。  
  4. 顔はピクセル位置上: 478、左: 1647、下: 553、右: 1722 にあります。  
  5. 顔はピクセル位置上: 504、左: 126、下: 594、右: 215 にあります。  
  6. 顔はピクセル位置にあります 上: 536、左: 395、下: 611、右: 469  
  7. 顔はピクセル位置にあります 上: 544、左: 1042、下: 619、右: 1116  
  8. 顔はピクセル位置上: 553、左: 818、下: 627、右: 892 にあります。  
  9. 顔はピクセル位置上: 511、左: 1431、下: 586、右: 1506 にあります。  
  10. 顔はピクセル位置上: 564、左: 1227、下: 626、右: 1289 にあります。  
  11. 顔はピクセル位置にあります 上: 965、左: 498、下: 1017、右: 550

以下のように表示されます。

<<:  スタートアップがAIを活用している3つの分野

>>:  [ビッグガイがやってくるエピソード8] 電子商取引リスク管理ツール - モバイルデバイス向けの信頼できるID

推薦する

シュナイダーエレクトリックの革新力は、デジタル化と低炭素化の二重の変革を加速させる上でどのような役割を果たすのでしょうか。

デジタル変革の後半期に入る中、デジタルとリアルの融合をいかに加速し、グリーン・低炭素の発展へと向かう...

一貫性のあるハッシュは難しいですか?これを読んで全て理解できました

[51CTO.com からのオリジナル記事] この記事では、コンシステント ハッシュとは何か、そして...

マイクロソフト、AIアシスタントCopilotを搭載したWindows 11のメジャーアップデートをリリース

11月1日(米国時間火曜日)、ソフトウェア大手マイクロソフトは、パソコン用OS「Windows 11...

画像を外国語として扱うKuaishouと北京大学のマルチモーダル大規模モデルはDALLE-3に匹敵する

GPT や LLaMA などの現在の大規模言語モデルは、自然言語処理の分野で大きな進歩を遂げており、...

オープンソース | AREX: Ctrip の次世代自動回帰テスト ツールの設計と実装

著者についてCtrip の R&D エネルギー効率マネージャー兼 SRE である Haibi...

...

SAP、データスフィアプラットフォームを強化する新たな生成AI機能を発表

SAP は、生成 AI 向けの多数の新機能を発表しており、まもなく SAP Datasphere プ...

スタンフォード大学の研究:スマートフォンの録画で人が酔っているかどうかを98%の精度で識別できる

11月9日、スタンフォード大学の最近の研究で、スマートフォンは音声パターンから人が酔っているかどうか...

...

ブロックチェーンが人工知能に力を与える方法

現在、データはデジタル環境に残っており、共有する動機はほとんどありません。これにより、Google、...

...

AIは人間の仕事を奪うが、これらの業界ではより多くの仕事も生み出すだろう

イーロン・マスク、ビル・ゲイツらは、人工知能(以下、AI)が「世界の終末」をもたらすだろうと国民に繰...

自分だけのデジタルヒューマンを開発しよう、FACEGOODが音声駆動表現技術をオープンソース化

現在、メタバースのトレンドの下、AIデジタルヒューマンもエンターテインメント、サービス、教育、マーケ...