研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

このアイデアはプライバシー擁護者を怖がらせているが、スマートスピーカーの開発者は、ユーザーのウェイクワードを聞かなくてもデバイスを起動できるように取り組んでいる。 Google がすでにこの技術に取り組んでいることは知っていましたが、今ではカーネギーメロン大学の研究者たちがそれに追随し、人工知能の力を使って人の声がどの方向から来ているかを正確に判断する機械学習モデルを開発しました。

[[350720]]

一見、これはそれほど重要ではないように思えるかもしれないが、研究者たちは、IoT デバイスが家庭やオフィス全体で「ますます密集」する未来を計画している。 Alexa 搭載のスマートテレビ、スピーカー、スマートフォンがすべて 1 か所に集まっていると想像してください。ウェイクワードを言うと、これらの各デバイスでコマンド モードがアクティブになる可能性がありますが、これが必要になることはほとんどありません。

この場合、部屋全体のデバイスではなく、特定のスマート デバイスに話しかけたい場合があり、ここでこの研究が役立ちます。このコマンド不要のウェイクアップ方法が他の方法と異なるのは、顔認識技術を必要としないことです。 もちろん、このシステムの精度は、平均的なユーザーがその概念に適応できる能力に大きく依存します。たとえば、ユーザーは、家族や友人に質問するときに、誤ってスマート デバイスの方向に向かって大声で話さないようにする必要があります。しかし、この技術がすぐに一般の人々に利用可能になるとは思えません。

<<:  機械学習技術におけるアンサンブル学習とは何ですか?

>>:  指紋と顔は本当に生体認証を表現できるのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

このベクターニューラルスタイルのブラシを使用すると、GANなしで美しい絵画を生成できます

CVPR 2021で発表された論文の中で、NetEase Fuxiとミシガン大学の研究者は、制御可能...

...

顔認識がまた失敗しました。アクセス制御システムは引き続き使用できますか?

旅行がますます便利になるにつれ、旅行の際には携帯電話だけを持って行けばよくなります。これは、モバイル...

転換点までのカウントダウン:AI サーバーが市場を完全に支配するにはどれくらいの時間がかかるのでしょうか?

ハイパースケーラーとクラウド プロバイダーがインフラストラクチャの計画を検討する場合、まず全体的な動...

AIによって非効率と判断され、150人の労働者が解雇された。「労働者をコントロールできるのはまさに人工知能だ」

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

SAP の AI グローバル責任者、ウォルター・サン博士: ビジネスで AI を最大限に活用する

テクノロジーは私たちの世界を変えました。それは何十億もの人々に考え、アイデア、洞察を共有する機会を与...

...

教師なし機械学習は産業オートメーションにどのようなメリットをもたらすのでしょうか?

現代の産業環境にはセンサーやスマート コンポーネントが満載されており、それらすべてが組み合わさって大...

運転教習業界にも「AI」の波が吹き荒れる、普及規模に注目

[[422314]]近年、都市化と道路交通建設の加速により、自動車旅行の需要が継続的に増加しており、...

...

...

AIを活用した自動化が成果を上げる:自動化の破壊的イノベーションにより収益成長が1.5倍に増加

新型コロナウイルス感染症のパンデミックによって引き起こされた市場の混乱は、世界中の企業に引き続き重く...

Python+OpenCVを使用して顔追跡を実装するための50行のコード

こんにちは、親愛なる友人の皆さん、またお会いできて嬉しいです。私はただ興味本位でこのToutiaoア...

2018年のトップ10の技術開発トレンド:人工知能は応用の「爆発期」に入る

情報技術の調査およびコンサルティング会社であるガートナーは最近、2018 年の戦略的技術開発のトレン...