[51CTO.com クイック翻訳] 音声アシスト技術は非常に人気があり、すでに25億台のデバイスが使用されており、この数は2023年までに3倍の80億台になると予想されています。主流の音声アシスト技術にはプライバシーとセキュリティの脆弱性があるにもかかわらず、この成長は止められないようです。 1 つは「開いている窓」の脆弱性です。たとえば、悪意のある人物が開いている窓の前を通り過ぎ、「おい、ドアを開けろ!」と叫んで家に入る可能性があります。研究者らはまた、AlexaとGoogle Assistantに何千もの誤検知ウェイクワードがあり、悪意のあるコマンドを挿入するための潜在的な攻撃ベクトルであることも発見した。テレビを通じて亜音速の指令を送信することのリスクを指摘する人もいる。 Amazonはすでに、Alexaがコマーシャル中に起動しないように周波数を操作している。また、インターネットに接続されたあらゆるコンピューティング デバイスと同様に、バックドアやその他の一般的な脆弱性が存在する可能性があります。 プライバシーとセキュリティのためのオープンソーステクノロジー Mycroft AI のようなオープンソースの音声アシスタントは、意図的にセキュリティとプライバシーへの道を提供します。オープンソース ソフトウェアでは、その性質上、脆弱性が明らかになるようにコードのレビューが推奨されます。 私が勤務する会社であるマイクロフトは、音声アシスト技術は安全であるという概念を推進しています。当社には、共通脆弱性識別子 (CVE) 開示を処理するためのプロセスがあります。開発ツールとして、私たちは SSH などのシステムに大きく依存しており、セットアップ ウィザード内のパスワードも含め、デバイスのデフォルト パスワードを変更することを常に推奨しています。また、意図解析、スキル、テキスト読み上げ (TTS) などの機能をデバイスに移行します。これは、他の大企業がクラウドで実行できる機能です。技術に精通したホーム ユーザー向けに、ファイアウォールの背後でエクスペリエンス全体を実行するために必要なコンポーネントを近日中にリリースする予定です。私たちは、ユーザーがソフトウェアを可能な限り制御できるようにしたいと考えています。 音声プリントにより、AI は声で人を区別できるようになり、ユーザーはロック、購入、その他の機密機能の権限を特定の人に割り当てることができるため、「ウィンドウイング」や誤検知のウェイクアップワードの脆弱性が軽減されます。これらには、ワンタイム音声パスワードまたはより高度な音声生体認証を使用した 2 要素認証を追加できます。 Google と Amazon はすでにアシスタントに何らかの音声プリントを導入しており、私たちはこの分野で大きな可能性を秘めたいくつかの企業と連携しています。ウェイクワード認識の改善により、使用可能な誤検知ウェイクワードのリストが制限されます。適切に設計されたフィードバック ループでは、Mycroft の Precise フラグ ツールなどのテクノロジを使用して誤検知がフラグ付けされるため、誤検知が効果的である可能性は低くなります。 オープンソースイノベーション かつては、実験を奨励する方法はオープンソースを通じてでした。これが真のイノベーションが生まれ、新しいテクノロジーが構築される方法です。 私たちは、イノベーターたちに、より少ない文字列で音声アシスタント技術を試す機会を提供します。オープンソースはソフトウェアをコミュニティの努力で実現します。たとえば、Mycroft には、数名の技術メンバーを含む 16 人のチームではなく、フィードバックを提供し、新機能を開発し、コア ソフトウェアに貢献する何千人もの開発者がいます。当社のライセンス モデルに基づいて、イノベーターは新しい革新的な実装からビジネスを簡単に構築できます。 もっと深く言えば、オープンとは、テクノロジーが、それを提供する企業だけでなく、ユーザーを完全に代表できることを意味します。音声アシスタントは、人々があらゆるテクノロジーと対話する方法を変える力を持っています。音声は、家庭、オフィス、モバイル デバイス、公共の場所を、これまで想像もできなかった方法で変革します。 私たちが皆さんに問いかけたいのは、「このテクノロジーが完全に自分の利益のために機能することを望みますか、それとも小売業者や検索・データ企業の利益のために機能することを望みますか?」ということです。ほとんどの人は前者を選ぶだろうと私たちは考えています。それを実現する唯一の方法は、オープンで透明性があり、コミュニティ主導であることを保証することだと私たちは知っています。 音声アシスタント機能 Mycroft は他の音声アシスタントと同じことを行いますが、やり方が異なります。ほとんどの音声アシスタントの音声システムは、デバイス側でウェイクワード認識を使用し、残りのやり取りをクラウドに送信して処理し、応答をスピーカーに送り返します。 Mycroft は、この作業の多くをソフトウェアを実行するデバイスに移行します。コマンドをリッスンするために、デバイス上のウェイクアップワード認識を使用します。ウェイクワードが検出されると、コマンドが記録され、音声からテキストへの転記のためにクラウドに送信されます。転記されると、テキスト ファイルはデバイスに送り返され、自然言語処理、スキル処理、音声合成が実行されます。 スキルはマイクロフトに能力を与えます。私たちは、社内チームとコミュニティの両方からのスキルを、新しい Mycroft スキル マーケットプレイスに着実に追加してきました。 Mycroft は、複数の音楽ソースを制御し、多数の IoT プラットフォームに接続し、Wikipedia や Wolfram|Alpha を含む 12 のソースから一般的な情報を取得し、ゲームをプレイし、サイコロを振り、物語を語り、速度テストを実行するなどの機能を備えています。 ユーザーが簡単にコンポーネントを交換できるように、Mycroft をモジュール式にしました。たとえば、現在 2 つのウェイクワードと 3 つの音声を提供しており、近日中にさらに多くの音声がサポートされる予定ですが、Mycroft では、任意のプロバイダー (クラウドまたはオンプレミス) からのカスタム ウェイクワードと TTS 音声も実行できます。 オープン AI 音声アシスタント Mycroft でプライバシーを保護する (Eric Jurgeson 著) [51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください] |
<<: GoogleとOpenAIがマシンビジョンアルゴリズムをより良く研究するための新しいツールを開発
>>: 過去1年間、世界は人工知能の倫理について次のような考えを抱いてきた。
大規模言語モデル (LLM) はさまざまな推論タスクで優れたパフォーマンスを発揮しますが、ブラックボ...
人工知能は徐々に私たちの生活に入り込み、さまざまな分野に応用され、多くの産業に莫大な経済的利益をもた...
8月7日のニュース、キーボードで入力した内容が他人に聞かれる可能性があることをご存知ですか?英国の...
[[412426]]今日は、Github 上の非常に強力な JavaScript アルゴリズムとデ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
導入ハードウェアの性能向上と顔データ量の増加に伴い、顔認識はますます成熟し、商業的な用途もますます増...
[[280027]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
[[378875]]この記事はWeChatの公開アカウント「Unorthodox Front-end...
テクノロジー業界ではレイオフの波が起こっているものの、IT 市場は依然として成長を続けています。ガー...
新興テクノロジーが世界を席巻し、前例のない革新、機会、脅威をもたらしています。これらの分野における専...
実際、ディープラーニングは多くの厄介な最適化問題を解決しています。ニューラル ネットワークは、問題に...
金融サービス業界は、特定の金融プロセスに不可欠なレガシー機器やシステムを使用しているため、他の業界に...
OpenAI の内部紛争が 1 年経っても解決されていないとは思いもしませんでした。またしても爆発メ...