パンダは人間の顔を認識できるのでしょうか?パンダは人生のハイライトの瞬間を迎えました。これからはようやく私を認識できるようになります。

パンダは人間の顔を認識できるのでしょうか?パンダは人生のハイライトの瞬間を迎えました。これからはようやく私を認識できるようになります。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

みなさんこんにちは。私がこの研究を初めて見たとき、次のような表情をしました。

[[322466]]

えっと?ジャイアントパンダ?パンダはどれも同じように見えませんか? ...同じくかわいい! (生き残りたいという気持ちでいっぱい)

しかし、よく見てみると、この研究はパンダ顔盲の人にとって非常に親切なものであることがわかりました。

もうパンダが見分けられないと心配する必要はありません。

[[322467]]

この魔法の技術とは、ジャイアントパンダの認識です。

つまり、顔認識技術がジャイアントパンダに応用されているのです。

最近、中国のジャイアントパンダ大学(中国西師範大学)のジャイアントパンダ研究チームがこのテーマに関する一連の論文を発表しました。

論文の1つは「動物の個体識別にディープラーニング技術を活用する:ジャイアントパンダを例に」と題されており、ジャイアントパンダの個体識別の技術的課題を研究しています。

パンダの顔認識?

この論文の核心は、ディープラーニング技術を使用して、CNN ベースの顔認識モデルを使用してジャイアントパンダを識別することです。

さらに、ジャイアントパンダの顔認識ネットワークの構築にも成功しました。

これからは浮かびながらパンダを見に行けそうな気がする(山や川を指差して)。

[[322468]]

この研究には主に 2 つのハイライトがあります。

  • このデータセットは、四川省の 3 つの基地で飼育されているジャイアントパンダから収集されたものです。デジタルカメラや携帯電話を使って、ジャイアントパンダの多様な特徴を撮影しましょう。特に、食事、休憩、遊びなどの特定の動作を撮影する場合は、より鮮明な顔の特徴を取得する必要があります。最終的に、6 人の学生が 7 日間かけて約 65,000 枚のサンプル写真を撮影しました。 (科学研究におけるこのような努力は本当に称賛に値します。)
  • 「クマの顔認識」率は95%にも達します。長期間にわたるデータ選別と認識ネットワークのデバッグを経て、現在の認識率は95%に達します。

研究チームの張金東教授は、技術的な問題に取り組むのに約半年かかり、最終的に認識モデルが成功し、このような高い認識率を達成したと語った。

もちろん、これは数学・情報学部の鄭伯川教授のチームのサポートと切り離せないものです。

1つはパンダのデータ収集を担当し、もう1つは識別技術を担当しています。私たちが今日の成果を達成できたのは、一致団結した努力があったからこそです。

[[322469]]

どうやってそれを達成するのでしょうか?

多くのディープラーニング技術モデルと同様に、この作業は主にデータ収集、モデルトレーニング、モデル検証の 3 つのステップに分かれています。

最初のステップも上記で説明しました。目標は、3つの基地から飼育されているジャイアントパンダ25頭の画像を収集することです。

写真を撮るときは、ジャイアントパンダの邪魔にならないように少なくとも5 メートル離れてから、携帯電話やカメラのズーム機能を使用してパンダの顔を撮影してください。

パンダの頭を上向き、下向き、または傾ける角度は 30 度を超えないようにしてください。このように撮影すると、写真の品質が低下します。これに気づいて、私たちは豊かな表情と特定の姿勢をとった写真をいくつかデータセットとして選びました。

2番目のステップはモデルをトレーニングすることです

この研究で使用した認識ネットワークは畳み込みニューラルネットワークであるVGGNetです。

VGGNet は、5 つの畳み込みモジュール、3 つの完全接続層、およびソフトマックス接続層で構成されています。

このデータセットには、 65,000 枚のジャイアントパンダの顔画像が含まれており、パンダ 1 頭あたり平均 4,300 枚になります。 39,000 枚の写真がトレーニング セットとして使用され、19,500 枚が検証に使用され、6,500 枚がモデルのキャリブレーションに使用されました。

モデルのトレーニングにはTensorflow ツールボックスを使用し、トレーニングには GPU NVIDIA Quadro P5000 (16GB) を利用しました。

認識ネットワークの収束を高速化し、ディープネットワークの不安定な勾配問題を解決するために、Xavier初期化法を採用しました。初期バッチ サイズは 128 に設定され、学習率は 0.001 に設定されています。

最終的に、 250,000 回の反復後にトレーニングは停止されました。

次に、最後のステップであるモデルの検証に進みます。

既存の 19,500 の検証セットに加えて、中国ジャイアントパンダ保護研究センター (CCRCGP) の臥龍基地から 10 頭の個体の画像 3,000 枚も収集し、モデルの未知の個体識別能力を検証しました。

最終的に、この実験では一般人の識別において95% の精度を達成しました。

なぜパンダの顔認識が必要なのでしょうか?

これにより、ジャイアントパンダを識別し監視する従来の方法も変わります。

例えば:

1. 経験に基づく人工視覚認識

実際、それはあなたの脚力、視力、そしてさまざまな感覚に依存します。私のような凡人には、視力だけでこれを実現するのは不可能です。

専門の研究者にとっては、この方法は単純かつ効果的ですが、長期にわたる研究やジャイアントパンダの大規模な個体群の研究となると、作業は複雑になります。

パンダの数が増えれば増えるほど、各パンダの特徴を覚える必要があり、エラー率が高くなります。

これは本当に難しすぎる、難しすぎる。

[[322470]]

さらに、比較的高度な方法もいくつかあります。

2. 距離結び目法

知識を増やしましょう!パンダの糞便中に見つかった竹の茎である咬み節には、パンダの生物学的特徴が残っていると考えられている。

研究者たちは、噛み合わせた部分の長さをまとめて測定することで、個々のジャイアントパンダを区別した。この方法はシンプルで実用的であり、ジャイアントパンダの個体群の時間的変動特性を反映することができます。しかし、ジャイアントパンダの移動距離は多くの要因の影響を受け、異なる個体を区別するための閾値を得ることは困難です。

3. 分子生物学的手法

つまり、ジャイアントパンダの糞からDNAを抽出し、個々のパンダを識別するのです。

しかし、効果を上げるには糞が新鮮でなければならないため、この方法を野生で実施するのは困難です。同時に、多くの人的資源と物的資源を消費することになります。

[[322471]]

4. GPS首輪追跡

名前が示すように、監視の対象となる個人は麻酔をかけられ、GPS 首輪を装着します。

このようにして、正確な追跡を実現し、必要な行動データをリアルタイムで取得することができます。

この首輪は寿命が短く、コストが高いことは言うまでもなく、多数のパンダの群れにとって優しいものではありません。さらに、パンダは捕獲されなければならず、その過程で何か問題が起きた場合、誰もその結果を負担できません。

[[322472]]

だから何!これらの方法にはいずれも一定の限界があり、張金東チームの本来の目的である野生のジャイアントパンダの保護に多大な困難をもたらしている。

これにより、正確な識別が可能となり、他の自然要因の影響を受けにくく、大規模なモニタリングにも使用できる手法が誕生しました。

張金東教授は「クマの顔認識」は2つの面で応用できると語った。

一方、飼育されているジャイアントパンダの場合、各パンダにIDが付けられるため、管理担当者による統一的な管理が容易になるだけでなく、観光客が各個体を識別して理解しやすくなります。

一方、私たちがより重視している野生パンダの保護という側面では、次のステップとして、現在フィールドモニタリングで広く使用されている赤外線カメラを組み合わせて、野生パンダの個体写真をさらに収集し、これらのデータを識別し、野生パンダの個体識別データベースを構築し、タイムリーなモニタリングとビッグデータ分析を実現することを検討する予定です。

ネットユーザーは何と言っているでしょうか?

この研究が発表された後、多くのネットユーザーが「もう二度と混乱することはないだろう!」と言った。

もちろん、興味深いコメントもありました。

実用的な友人向け:

有機的な精神的な観点:

新しい角度もあります:

もちろん、トゥアンジがついに人生のハイライトの瞬間に到達したことは否定できない。

この技術はパンダの生態管理者にとっても朗報であり、野生のジャイアントパンダの保護に強力な支援を提供します。

[[322477]]

もう一つ

もう一つだけ質問があります。

パンダの顔認識はクマの顔認識に分類されるべきでしょうか?それとも猫の顔認識?

つまり、パンダは猫ですか?それともクマ?

主流の意見によれば、パンダは「クマ」に分類されるべきなので、これはクマの顔認識の分野です。

しかし、ここには小さなエピソードがあります。

動物学者夏元宇が35年前に書いたエッセイ「50年の過ち パンダの名誉を回復するために」によると。

記事は、抗日戦争中の四川省の博物館で、右から左に読むべき標識を誤って読み、「パンダ」という本来の文字が「パンダ」と読み間違えられたという歴史的なエピソードに触れていた。

まあ、真面目に言うなら、国宝は「パンダ」と呼ぶべきでしょう...

<<:  トリソララン人は救われた!ディープラーニングは三体問題を解決する

>>:  深さ優先探索 (DFS) と幅優先探索 (BFS) の 2 つのアルゴリズムの詳細な説明

ブログ    
ブログ    
ブログ    

推薦する

Pudu Technology、新製品「Hulu」をリリース、4月19日より先行販売開始

人工知能やマルチセンサー情報融合などの技術の進化により、サービスロボットは急速に発展し、さまざまな分...

医療機器における人工知能:これらは新たな産業アプリケーションです

人工知能により、研究者や製造業者は生活の質を向上させることができます。 [[419960]]人工知能...

機械学習における特徴選択の3つの代替手法

ソレダッド・ガリ翻訳者:趙青棠企画丨孫淑娇、梁策インターネットで「特徴選択」を検索してみると、特徴選...

建物をスマートかつ持続可能なものに変える重要性

[[428632]]温室効果ガス削減目標と規制要件を満たすには、企業は施設をエネルギー効率の高いスマ...

...

2日間で星の数が1,000を突破:OpenAIのWhisperの蒸留後、音声認識が数倍高速化

少し前に、「テイラー・スウィフトが中国語を披露」する動画がさまざまなソーシャルメディアプラットフォー...

ニューヨーク大学のチームは、自然言語を使ってチャットボットChatGPTを使ってマイクロプロセッサをゼロから設計した。

6月19日、生成型人工知能がハードウェア設計などの分野に参入し始めました。最近、ニューヨーク大学の...

ChatGPT: 機械学習とディープラーニングを簡単かつ楽しく

ディープラーニングと機械学習は、今日のテクノロジーのホットな話題ですが、初心者にとっては少し複雑で難...

2021 年のトップ 12 AI ツールとフレームワーク

AIトレンドがあらゆるところに広がる2021年を迎える準備はできていますか? 2021 年のトップ ...

中国科学院のチームは、最初のLLMモデル圧縮レビューを発表しました。剪定、知識蒸留、量子化技術の詳細な議論です。

最近、大規模言語モデル (LLM) はさまざまなタスクで優れたパフォーマンスを示しています。しかし、...

...

ある日、お子さんが「お父さん、機械学習って何?」と尋ねたとします。

お父さん、機械学習って何ですか?答えるのは難しい!髪の毛が抜け始めた頭を掻いた後でも、お父さんはこの...

GoogleのチーフAIサイエンティスト、フェイフェイ・リーがスタンフォード大学のAIラボを離れ、再び戻る可能性

BI中国語ウェブサイトが6月28日に報じた。グーグルの主任人工知能(AI)科学者、フェイフェイ・リー...

Facebook は顔認識を中止することで本当にリスクを回避しているのでしょうか?人種差別は致命的である

名前にちなんでFacebookとしても知られるMateは、顔認識システムを無効化し、10億人以上の個...

蘭州テクノロジーの周明氏:大きなモデルは必ずしも大きいほど良いというわけではありません。100億規模のモデルでも十分かもしれません。

この記事は、WOT2023カンファレンスでの蘭州科技の創設者兼CEOである周明氏の基調講演からまとめ...