パンダは人間の顔を認識できるのでしょうか?パンダは人生のハイライトの瞬間を迎えました。これからはようやく私を認識できるようになります。

パンダは人間の顔を認識できるのでしょうか?パンダは人生のハイライトの瞬間を迎えました。これからはようやく私を認識できるようになります。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

みなさんこんにちは。私がこの研究を初めて見たとき、次のような表情をしました。

[[322466]]

えっと?ジャイアントパンダ?パンダはどれも同じように見えませんか? ...同じくかわいい! (生き残りたいという気持ちでいっぱい)

しかし、よく見てみると、この研究はパンダ顔盲の人にとって非常に親切なものであることがわかりました。

もうパンダが見分けられないと心配する必要はありません。

[[322467]]

この魔法の技術とは、ジャイアントパンダの認識です。

つまり、顔認識技術がジャイアントパンダに応用されているのです。

最近、中国のジャイアントパンダ大学(中国西師範大学)のジャイアントパンダ研究チームがこのテーマに関する一連の論文を発表しました。

論文の1つは「動物の個体識別にディープラーニング技術を活用する:ジャイアントパンダを例に」と題されており、ジャイアントパンダの個体識別の技術的課題を研究しています。

パンダの顔認識?

この論文の核心は、ディープラーニング技術を使用して、CNN ベースの顔認識モデルを使用してジャイアントパンダを識別することです。

さらに、ジャイアントパンダの顔認識ネットワークの構築にも成功しました。

これからは浮かびながらパンダを見に行けそうな気がする(山や川を指差して)。

[[322468]]

この研究には主に 2 つのハイライトがあります。

  • このデータセットは、四川省の 3 つの基地で飼育されているジャイアントパンダから収集されたものです。デジタルカメラや携帯電話を使って、ジャイアントパンダの多様な特徴を撮影しましょう。特に、食事、休憩、遊びなどの特定の動作を撮影する場合は、より鮮明な顔の特徴を取得する必要があります。最終的に、6 人の学生が 7 日間かけて約 65,000 枚のサンプル写真を撮影しました。 (科学研究におけるこのような努力は本当に称賛に値します。)
  • 「クマの顔認識」率は95%にも達します。長期間にわたるデータ選別と認識ネットワークのデバッグを経て、現在の認識率は95%に達します。

研究チームの張金東教授は、技術的な問題に取り組むのに約半年かかり、最終的に認識モデルが成功し、このような高い認識率を達成したと語った。

もちろん、これは数学・情報学部の鄭伯川教授のチームのサポートと切り離せないものです。

1つはパンダのデータ収集を担当し、もう1つは識別技術を担当しています。私たちが今日の成果を達成できたのは、一致団結した努力があったからこそです。

[[322469]]

どうやってそれを達成するのでしょうか?

多くのディープラーニング技術モデルと同様に、この作業は主にデータ収集、モデルトレーニング、モデル検証の 3 つのステップに分かれています。

最初のステップも上記で説明しました。目標は、3つの基地から飼育されているジャイアントパンダ25頭の画像を収集することです。

写真を撮るときは、ジャイアントパンダの邪魔にならないように少なくとも5 メートル離れてから、携帯電話やカメラのズーム機能を使用してパンダの顔を撮影してください。

パンダの頭を上向き、下向き、または傾ける角度は 30 度を超えないようにしてください。このように撮影すると、写真の品質が低下します。これに気づいて、私たちは豊かな表情と特定の姿勢をとった写真をいくつかデータセットとして選びました。

2番目のステップはモデルをトレーニングすることです

この研究で使用した認識ネットワークは畳み込みニューラルネットワークであるVGGNetです。

VGGNet は、5 つの畳み込みモジュール、3 つの完全接続層、およびソフトマックス接続層で構成されています。

このデータセットには、 65,000 枚のジャイアントパンダの顔画像が含まれており、パンダ 1 頭あたり平均 4,300 枚になります。 39,000 枚の写真がトレーニング セットとして使用され、19,500 枚が検証に使用され、6,500 枚がモデルのキャリブレーションに使用されました。

モデルのトレーニングにはTensorflow ツールボックスを使用し、トレーニングには GPU NVIDIA Quadro P5000 (16GB) を利用しました。

認識ネットワークの収束を高速化し、ディープネットワークの不安定な勾配問題を解決するために、Xavier初期化法を採用しました。初期バッチ サイズは 128 に設定され、学習率は 0.001 に設定されています。

最終的に、 250,000 回の反復後にトレーニングは停止されました。

次に、最後のステップであるモデルの検証に進みます。

既存の 19,500 の検証セットに加えて、中国ジャイアントパンダ保護研究センター (CCRCGP) の臥龍基地から 10 頭の個体の画像 3,000 枚も収集し、モデルの未知の個体識別能力を検証しました。

最終的に、この実験では一般人の識別において95% の精度を達成しました。

なぜパンダの顔認識が必要なのでしょうか?

これにより、ジャイアントパンダを識別し監視する従来の方法も変わります。

例えば:

1. 経験に基づく人工視覚認識

実際、それはあなたの脚力、視力、そしてさまざまな感覚に依存します。私のような凡人には、視力だけでこれを実現するのは不可能です。

専門の研究者にとっては、この方法は単純かつ効果的ですが、長期にわたる研究やジャイアントパンダの大規模な個体群の研究となると、作業は複雑になります。

パンダの数が増えれば増えるほど、各パンダの特徴を覚える必要があり、エラー率が高くなります。

これは本当に難しすぎる、難しすぎる。

[[322470]]

さらに、比較的高度な方法もいくつかあります。

2. 距離結び目法

知識を増やしましょう!パンダの糞便中に見つかった竹の茎である咬み節には、パンダの生物学的特徴が残っていると考えられている。

研究者たちは、噛み合わせた部分の長さをまとめて測定することで、個々のジャイアントパンダを区別した。この方法はシンプルで実用的であり、ジャイアントパンダの個体群の時間的変動特性を反映することができます。しかし、ジャイアントパンダの移動距離は多くの要因の影響を受け、異なる個体を区別するための閾値を得ることは困難です。

3. 分子生物学的手法

つまり、ジャイアントパンダの糞からDNAを抽出し、個々のパンダを識別するのです。

しかし、効果を上げるには糞が新鮮でなければならないため、この方法を野生で実施するのは困難です。同時に、多くの人的資源と物的資源を消費することになります。

[[322471]]

4. GPS首輪追跡

名前が示すように、監視の対象となる個人は麻酔をかけられ、GPS 首輪を装着します。

このようにして、正確な追跡を実現し、必要な行動データをリアルタイムで取得することができます。

この首輪は寿命が短く、コストが高いことは言うまでもなく、多数のパンダの群れにとって優しいものではありません。さらに、パンダは捕獲されなければならず、その過程で何か問題が起きた場合、誰もその結果を負担できません。

[[322472]]

だから何!これらの方法にはいずれも一定の限界があり、張金東チームの本来の目的である野生のジャイアントパンダの保護に多大な困難をもたらしている。

これにより、正確な識別が可能となり、他の自然要因の影響を受けにくく、大規模なモニタリングにも使用できる手法が誕生しました。

張金東教授は「クマの顔認識」は2つの面で応用できると語った。

一方、飼育されているジャイアントパンダの場合、各パンダにIDが付けられるため、管理担当者による統一的な管理が容易になるだけでなく、観光客が各個体を識別して理解しやすくなります。

一方、私たちがより重視している野生パンダの保護という側面では、次のステップとして、現在フィールドモニタリングで広く使用されている赤外線カメラを組み合わせて、野生パンダの個体写真をさらに収集し、これらのデータを識別し、野生パンダの個体識別データベースを構築し、タイムリーなモニタリングとビッグデータ分析を実現することを検討する予定です。

ネットユーザーは何と言っているでしょうか?

この研究が発表された後、多くのネットユーザーが「もう二度と混乱することはないだろう!」と言った。

もちろん、興味深いコメントもありました。

実用的な友人向け:

有機的な精神的な観点:

新しい角度もあります:

もちろん、トゥアンジがついに人生のハイライトの瞬間に到達したことは否定できない。

この技術はパンダの生態管理者にとっても朗報であり、野生のジャイアントパンダの保護に強力な支援を提供します。

[[322477]]

もう一つ

もう一つだけ質問があります。

パンダの顔認識はクマの顔認識に分類されるべきでしょうか?それとも猫の顔認識?

つまり、パンダは猫ですか?それともクマ?

主流の意見によれば、パンダは「クマ」に分類されるべきなので、これはクマの顔認識の分野です。

しかし、ここには小さなエピソードがあります。

動物学者夏元宇が35年前に書いたエッセイ「50年の過ち パンダの名誉を回復するために」によると。

記事は、抗日戦争中の四川省の博物館で、右から左に読むべき標識を誤って読み、「パンダ」という本来の文字が「パンダ」と読み間違えられたという歴史的なエピソードに触れていた。

まあ、真面目に言うなら、国宝は「パンダ」と呼ぶべきでしょう...

<<:  トリソララン人は救われた!ディープラーニングは三体問題を解決する

>>:  深さ優先探索 (DFS) と幅優先探索 (BFS) の 2 つのアルゴリズムの詳細な説明

ブログ    

推薦する

4 つの主要ビジネス分野における業界に関するインテルの詳細な洞察、アプリケーション事例、革新的な製品とソリューションの解釈 | Intel Vision

ポストパンデミックの時代において、在宅勤務によって従業員の生産性を最大限に引き出すにはどうすればいい...

【コレクション】貢献度が最も高い GitHub コレクションとディープラーニング フレームワーク 16 選

ディープラーニングは、データの経験的学習に基づく機械学習手法であり、近年発展し、人気が高まっています...

...

人工知能:今優先すべき7つの役割

近年の退職者の急増は、労働力不足が現実であることを示している。セントルイス連邦準備銀行の調査によると...

AIチャットボット市場は2028年までに150億ドルに達する

AI チャットボットは、自然言語処理と機械学習を使用してユーザーとの人間の会話をシミュレートするソフ...

今後数年間の AI 求人市場はどのようになるでしょうか?

[[353999]] AI がもたらす自動化の脅威によって仕事が奪われる一方で、AI は新しい職種...

コードスイッチングに7億5000万ドル? Facebook TransCoder AI は 1 つで十分です。

コードの移行と言語の変換は困難で費用のかかる作業です。オーストラリア連邦銀行は、プラットフォームを ...

2024年には、AI PCが目を見張るほど登場するでしょう。企業や消費者はどのように選択すべきでしょうか?

先日開催されたCES 2024カンファレンスでは、AI PC(人工知能コンピュータ)のコンセプトや製...

...

世界錬金術時代が始まった? MIT、住宅や道路を無制限のバッテリーに変える「カーボンセメント」スーパーキャパシタを開発

おそらく今回、私たちは本当に人類の歴史における特異点に立っているのかもしれない。最近、MIT のカー...

AIはあらゆるブランドに影響を与えており、適応できないブランドは消滅するだろう

インテリジェントエージェントはブランドをスクリーニングし、商取引を再形成し、消費者の選択を導きます。...

人間の介入によってモデルのパフォーマンスをどのように向上できるでしょうか?この記事を読んでみてください

金融業界など、一部の業界は誤検知に非常に敏感です。クレジットカード詐欺を検出する際に、検出システムが...

...

EleutherAIが200億パラメータのGPT風モデルを発表: GPT-3とは異なり、無料でオープン

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...