パンダは人間の顔を認識できるのでしょうか？パンダは人生のハイライトの瞬間を迎えました。これからはようやく私を認識できるようになります。

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

みなさんこんにちは。私がこの研究を初めて見たとき、次のような表情をしました。

えっと？ジャイアントパンダ？パンダはどれも同じように見えませんか？ ...同じくかわいい！（生き残りたいという気持ちでいっぱい）

しかし、よく見てみると、この研究はパンダ顔盲の人にとって非常に親切なものであることがわかりました。

もうパンダが見分けられないと心配する必要はありません。

この魔法の技術とは、ジャイアントパンダの認識です。

つまり、顔認識技術がジャイアントパンダに応用されているのです。

最近、中国のジャイアントパンダ大学（中国西師範大学）のジャイアントパンダ研究チームがこのテーマに関する一連の論文を発表しました。

論文の1つは「動物の個体識別にディープラーニング技術を活用する：ジャイアントパンダを例に」と題されており、ジャイアントパンダの個体識別の技術的課題を研究しています。

パンダの顔認識？

この論文の核心は、ディープラーニング技術を使用して、CNN ベースの顔認識モデルを使用してジャイアントパンダを識別することです。

さらに、ジャイアントパンダの顔認識ネットワークの構築にも成功しました。

これからは浮かびながらパンダを見に行けそうな気がする（山や川を指差して）。

この研究には主に 2 つのハイライトがあります。

このデータセットは、四川省の 3 つの基地で飼育されているジャイアントパンダから収集されたものです。デジタルカメラや携帯電話を使って、ジャイアントパンダの多様な特徴を撮影しましょう。特に、食事、休憩、遊びなどの特定の動作を撮影する場合は、より鮮明な顔の特徴を取得する必要があります。最終的に、6 人の学生が 7 日間かけて約 65,000 枚のサンプル写真を撮影しました。（科学研究におけるこのような努力は本当に称賛に値します。）
「クマの顔認識」率は95％にも達します。長期間にわたるデータ選別と認識ネットワークのデバッグを経て、現在の認識率は95％に達します。

研究チームの張金東教授は、技術的な問題に取り組むのに約半年かかり、最終的に認識モデルが成功し、このような高い認識率を達成したと語った。

もちろん、これは数学・情報学部の鄭伯川教授のチームのサポートと切り離せないものです。

1つはパンダのデータ収集を担当し、もう1つは識別技術を担当しています。私たちが今日の成果を達成できたのは、一致団結した努力があったからこそです。

どうやってそれを達成するのでしょうか?

多くのディープラーニング技術モデルと同様に、この作業は主にデータ収集、モデルトレーニング、モデル検証の 3 つのステップに分かれています。

最初のステップも上記で説明しました。目標は、3つの基地から飼育されているジャイアントパンダ25頭の画像を収集することです。

写真を撮るときは、ジャイアントパンダの邪魔にならないように少なくとも5 メートル離れてから、携帯電話やカメラのズーム機能を使用してパンダの顔を撮影してください。

パンダの頭を上向き、下向き、または傾ける角度は 30 度を超えないようにしてください。このように撮影すると、写真の品質が低下します。これに気づいて、私たちは豊かな表情と特定の姿勢をとった写真をいくつかデータセットとして選びました。

2番目のステップはモデルをトレーニングすることです

この研究で使用した認識ネットワークは畳み込みニューラルネットワークであるVGGNetです。

VGGNet は、5 つの畳み込みモジュール、3 つの完全接続層、およびソフトマックス接続層で構成されています。

このデータセットには、 65,000 枚のジャイアントパンダの顔画像が含まれており、パンダ 1 頭あたり平均 4,300 枚になります。 39,000 枚の写真がトレーニングセットとして使用され、19,500 枚が検証に使用され、6,500 枚がモデルのキャリブレーションに使用されました。

モデルのトレーニングにはTensorflow ツールボックスを使用し、トレーニングには GPU NVIDIA Quadro P5000 (16GB) を利用しました。

認識ネットワークの収束を高速化し、ディープネットワークの不安定な勾配問題を解決するために、Xavier初期化法を採用しました。初期バッチサイズは 128 に設定され、学習率は 0.001 に設定されています。

最終的に、 250,000 回の反復後にトレーニングは停止されました。

次に、最後のステップであるモデルの検証に進みます。

既存の 19,500 の検証セットに加えて、中国ジャイアントパンダ保護研究センター (CCRCGP) の臥龍基地から 10 頭の個体の画像 3,000 枚も収集し、モデルの未知の個体識別能力を検証しました。

最終的に、この実験では一般人の識別において95% の精度を達成しました。

なぜパンダの顔認識が必要なのでしょうか?

これにより、ジャイアントパンダを識別し監視する従来の方法も変わります。

例えば：

1. 経験に基づく人工視覚認識

実際、それはあなたの脚力、視力、そしてさまざまな感覚に依存します。私のような凡人には、視力だけでこれを実現するのは不可能です。

専門の研究者にとっては、この方法は単純かつ効果的ですが、長期にわたる研究やジャイアントパンダの大規模な個体群の研究となると、作業は複雑になります。

パンダの数が増えれば増えるほど、各パンダの特徴を覚える必要があり、エラー率が高くなります。

これは本当に難しすぎる、難しすぎる。

さらに、比較的高度な方法もいくつかあります。

2. 距離結び目法

知識を増やしましょう！パンダの糞便中に見つかった竹の茎である咬み節には、パンダの生物学的特徴が残っていると考えられている。

研究者たちは、噛み合わせた部分の長さをまとめて測定することで、個々のジャイアントパンダを区別した。この方法はシンプルで実用的であり、ジャイアントパンダの個体群の時間的変動特性を反映することができます。しかし、ジャイアントパンダの移動距離は多くの要因の影響を受け、異なる個体を区別するための閾値を得ることは困難です。

3. 分子生物学的手法

つまり、ジャイアントパンダの糞からDNAを抽出し、個々のパンダを識別するのです。

しかし、効果を上げるには糞が新鮮でなければならないため、この方法を野生で実施するのは困難です。同時に、多くの人的資源と物的資源を消費することになります。

4. GPS首輪追跡

名前が示すように、監視の対象となる個人は麻酔をかけられ、GPS 首輪を装着します。

このようにして、正確な追跡を実現し、必要な行動データをリアルタイムで取得することができます。

この首輪は寿命が短く、コストが高いことは言うまでもなく、多数のパンダの群れにとって優しいものではありません。さらに、パンダは捕獲されなければならず、その過程で何か問題が起きた場合、誰もその結果を負担できません。

だから何！これらの方法にはいずれも一定の限界があり、張金東チームの本来の目的である野生のジャイアントパンダの保護に多大な困難をもたらしている。

これにより、正確な識別が可能となり、他の自然要因の影響を受けにくく、大規模なモニタリングにも使用できる手法が誕生しました。

張金東教授は「クマの顔認識」は2つの面で応用できると語った。

一方、飼育されているジャイアントパンダの場合、各パンダにIDが付けられるため、管理担当者による統一的な管理が容易になるだけでなく、観光客が各個体を識別して理解しやすくなります。
一方、私たちがより重視している野生パンダの保護という側面では、次のステップとして、現在フィールドモニタリングで広く使用されている赤外線カメラを組み合わせて、野生パンダの個体写真をさらに収集し、これらのデータを識別し、野生パンダの個体識別データベースを構築し、タイムリーなモニタリングとビッグデータ分析を実現することを検討する予定です。