研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

このアイデアはプライバシー擁護者を怖がらせているが、スマートスピーカーの開発者は、ユーザーのウェイクワードを聞かなくてもデバイスを起動できるように取り組んでいる。 Google がすでにこの技術に取り組んでいることは知っていましたが、今ではカーネギーメロン大学の研究者たちがそれに追随し、人工知能の力を使って人の声がどの方向から来ているかを正確に判断する機械学習モデルを開発しました。

[[350720]]

一見、これはそれほど重要ではないように思えるかもしれないが、研究者たちは、IoT デバイスが家庭やオフィス全体で「ますます密集」する未来を計画している。 Alexa 搭載のスマートテレビ、スピーカー、スマートフォンがすべて 1 か所に集まっていると想像してください。ウェイクワードを言うと、これらの各デバイスでコマンド モードがアクティブになる可能性がありますが、これが必要になることはほとんどありません。

この場合、部屋全体のデバイスではなく、特定のスマート デバイスに話しかけたい場合があり、ここでこの研究が役立ちます。このコマンド不要のウェイクアップ方法が他の方法と異なるのは、顔認識技術を必要としないことです。 もちろん、このシステムの精度は、平均的なユーザーがその概念に適応できる能力に大きく依存します。たとえば、ユーザーは、家族や友人に質問するときに、誤ってスマート デバイスの方向に向かって大声で話さないようにする必要があります。しかし、この技術がすぐに一般の人々に利用可能になるとは思えません。

<<:  機械学習技術におけるアンサンブル学習とは何ですか?

>>:  指紋と顔は本当に生体認証を表現できるのでしょうか?

ブログ    

推薦する

人工知能による大量失業の懸念は根拠がない

[[256558]] AIが大量失業を引き起こすという懸念は根拠がない世界的な研究機関である羅漢研究...

南京科技大学とオックスフォード大学は、1行のコードでゼロショット学習法の効果を大幅に向上させるプラグアンドプレイ分類モジュールを提案した。

ゼロショット学習は、トレーニングプロセス中に出現しなかったカテゴリの分類に重点を置いています。意味記...

Spark機械学習APIの選び方

この記事では、主に統計アルゴリズム、分類アルゴリズム、クラスタリング アルゴリズム、協調フィルタリン...

AIが品質保証を向上させる6つのヒント

品質保証(QA)は多くの企業にとって重要な関心分野です。企業やサービスプロバイダーが高い品質を維持す...

人工知能がスマートファクトリーにもたらす力

現在、製造業における人工知能技術の応用が急成長しています。自社にとって適切な人工知能ツールをどのよう...

...

AIシステムのグレーディングを通じて企業のコスト管理を支援

翻訳者 | 張毅校正 | 梁哲、孫淑娟自動車技術協会(SAE)が自動運転車を分類しているのと同じよう...

人工知能によるテキスト検出の実践的有効性に関する議論

AI 支援による記事執筆は今やどこにでもあります。ChatGPT は多くの言語ベースの AI アプリ...

...

TPU v4 チップの計算能力が新たな高みに到達しました。 Googleが世界最大の機械学習センターを建設

最近、Google の I/O 開発者会議で、Google は魅力的な新しい携帯電話、AR グラス、...

ビデオ会議圧縮アルゴリズム

ビデオ会議 264 ビデオ圧縮 - SVC H.264 には、階層化されたエンコードを可能にする S...

...

2023 年のフィンテック業界における AI トレンド トップ 10

2023 年の FinTech 業界では、変革的な AI トレンドが見られます。機械学習、ロボティ...

...