わずか6秒で、AIはあなたの声を聞くだけであなたの外見を説明できる

わずか6秒で、AIはあなたの声を聞くだけであなたの外見を説明できる

信じられますか?人工知能は最近、あなたの声からわずか6秒で性別、年齢、人種を判別し、さらにはあなたの外見を説明できるまでに進化しました。

[[335498]]

この AI はマサチューセッツ工科大学 (MIT) によって作成されました。研究者は、何百万ものビデオ クリップで構成されたデータ セットを使用して、Speech2Face と呼ばれるニューラル ネットワーク モデルを自己トレーニングしました。このネットワークの動作は、大きく 2 つの部分に分かれています。1 つは音声エンコーダーで、主に入力された音声を分析し、関連する顔の特徴を予測する役割を担っています。もう 1 つは顔デコーダーで、主に入力された顔の特徴を統合して画像を生成する役割を担っています。最終結果から判断すると、音に基づいて人の顔を復元するのにたった 6 秒しかかからず、効果は満足のいくものでした。

研究チームは、話者の外見を正確に復元することが目的ではないと述べた。Speech2Faceモデルは主に、音声と外見の相関関係を研究するために使用される。現在、Speech2Faceは性別を認識でき、白人とアジア人を簡単に区別できます。年齢で言えば、30代、40代、70代の音声のヒット率が高くなります。

Speech2Faceは、基本的な性別、年齢、人種に加えて、鼻の構造、唇の厚さや形、噛み合わせなど、いくつかの顔の特徴も推測できます。また、おおよその顔の骨格を推測することもできます。基本的に、音声入力時間が長いほど、このAIの精度は高くなります。ただし、研究者はAIの聴覚が間違っている可能性もあることを認めています。このAIは、まだ声変わり期を経験していない小さな男の子を女性と間違えたり、話者のアクセントを誤って判断したり、年齢を間違えたりする可能性があります。研究者らは、Speech2Faceの限界はデータセット内の話者の間に人種的多様性が欠けていることに一部起因しており、異なる人種の人々の声を認識する能力が低いと述べた。

しかし、この技術の背後に隠れているプラ​​イバシーや差別の問題が懸念されると考える人もいます。これは純粋に学術的な調査ではあるものの、顔情報の潜在的な機密性については、倫理的要素についてさらに議論する必要があると彼らは考えています。厳格な技術テストを実施し、実際のデータが想定されるユーザー グループを代表できることを確認する必要があります。

<<:  人工知能の未来は人類にとって何を意味するのでしょうか?

>>:  F1カーがハッキングされた、人工知能技術が救世主となるのか?

ブログ    
ブログ    
ブログ    

推薦する

...

人工知能は核爆弾と同じくらい人類にとって脅威なのでしょうか? AI脅威理論の謎を解く

新たに世界一の富豪となり、テスラのCEO、そしてテクノロジー界の大物となったマスク氏は、ロボットが近...

K8S向け機械学習ツール「Kubeflow」の詳しい解説

[51CTO.com オリジナル記事] Kubeflowには多くのコンポーネントがあり、各コンポーネ...

初心者に適した機械学習アルゴリズムの選び方

この記事の主な対象読者は、機械学習の愛好家やデータサイエンスの初心者、そして機械学習アルゴリズムを学...

...

人工知能(AI)について知っておくべきことすべて

人工知能の進歩は前例のない機会をもたらすと同時に、経済的、政治的、社会的混乱ももたらします。専門家は...

...

プログラマーは30歳で転職すべきでしょうか?曲がるならどちらの方向がいいでしょうか?

最近、皆さんは次のような H5 に悩まされていると思います。広告ポスター500枚の予算は2,000元...

...

...

アルゴリズム推奨規制が実施されます。ユーザーはプラットフォームに「ノー」と言えるのでしょうか?

わが国のアルゴリズム推奨政策は明確に実施されており、アルゴリズム差別、「ビッグデータによる旧顧客殺し...

自動運転タクシー市場が急成長中。最初にこの市場を活用できるのは、Google、Uber、それともTeslaのどれでしょうか?

ウェイモは世界クラスのレベル4自動運転車工場を建設し、テスラは「世界クラスのチップ」を発表し、ウーバ...

私はAIとキングオブグローリーを6ラウンドプレイしましたが、精神が崩壊しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...