オープンAI音声アシスタントMycroftでプライバシーを確​​保

オープンAI音声アシスタントMycroftでプライバシーを確​​保

[[258822]]

[51CTO.com クイック翻訳] 音声アシスト技術は非常に人気があり、すでに25億台のデバイスが使用されており、この数は2023年までに3倍の80億台になると予想されています。主流の音声アシスト技術にはプライバシーとセキュリティの脆弱性があるにもかかわらず、この成長は止められないようです。

1 つは「開いている窓」の脆弱性です。たとえば、悪意のある人物が開いている窓の前を通り過ぎ、「おい、ドアを開けろ!」と叫んで家に入る可能性があります。研究者らはまた、AlexaとGoogle Assistantに何千もの誤検知ウェイクワードがあり、悪意のあるコマンドを挿入するための潜在的な攻撃ベクトルであることも発見した。テレビを通じて亜音速の指令を送信することのリスクを指摘する人もいる。 Amazonはすでに、Alexaがコマーシャル中に起動しないように周波数を操作している。また、インターネットに接続されたあらゆるコンピューティング デバイスと同様に、バックドアやその他の一般的な脆弱性が存在する可能性があります。

プライバシーとセキュリティのためのオープンソーステクノロジー

Mycroft AI のようなオープンソースの音声アシスタントは、意図的にセキュリティとプライバシーへの道を提供します。オープンソース ソフトウェアでは、その性質上、脆弱性が明らかになるようにコードのレビューが推奨されます。

私が勤務する会社であるマイクロフトは、音声アシスト技術は安全であるという概念を推進しています。当社には、共通脆弱性識別子 (CVE) 開示を処理するためのプロセスがあります。開発ツールとして、私たちは SSH などのシステムに大きく依存しており、セットアップ ウィザード内のパスワードも含め、デバイスのデフォルト パスワードを変更することを常に推奨しています。また、意図解析、スキル、テキスト読み上げ (TTS) などの機能をデバイスに移行します。これは、他の大企業がクラウドで実行できる機能です。技術に精通したホーム ユーザー向けに、ファイアウォールの背後でエクスペリエンス全体を実行するために必要なコンポーネントを近日中にリリースする予定です。私たちは、ユーザーがソフトウェアを可能な限り制御できるようにしたいと考えています。

音声プリントにより、AI は声で人を区別できるようになり、ユーザーはロック、購入、その他の機密機能の権限を特定の人に割り当てることができるため、「ウィンドウイング」や誤検知のウェイクアップワードの脆弱性が軽減されます。これらには、ワンタイム音声パスワードまたはより高度な音声生体認証を使用した 2 要素認証を追加できます。 Google と Amazon はすでにアシスタントに何らかの音声プリントを導入しており、私たちはこの分野で大きな可能性を秘めたいくつかの企業と連携しています。ウェイクワード認識の改善により、使用可能な誤検知ウェイクワードのリストが制限されます。適切に設計されたフィードバック ループでは、Mycroft の Precise フラグ ツールなどのテクノロジを使用して誤検知がフラグ付けされるため、誤検知が効果的である可能性は低くなります。

オープンソースイノベーション

かつては、実験を奨励する方法はオープンソースを通じてでした。これが真のイノベーションが生まれ、新しいテクノロジーが構築される方法です。

私たちは、イノベーターたちに、より少ない文字列で音声アシスタント技術を試す機会を提供します。オープンソースはソフトウェアをコミュニティの努力で実現します。たとえば、Mycroft には、数名の技術メンバーを含む 16 人のチームではなく、フィードバックを提供し、新機能を開発し、コア ソフトウェアに貢献する何千人もの開発者がいます。当社のライセンス モデルに基づいて、イノベーターは新しい革新的な実装からビジネスを簡単に構築できます。

もっと深く言えば、オープンとは、テクノロジーが、それを提供する企業だけでなく、ユーザーを完全に代表できることを意味します。音声アシスタントは、人々があらゆるテクノロジーと対話する方法を変える力を持っています。音声は、家庭、オフィス、モバイル デバイス、公共の場所を、これまで想像もできなかった方法で変革します。

私たちが皆さんに問いかけたいのは、「このテクノロジーが完全に自分の利益のために機能することを望みますか、それとも小売業者や検索・データ企業の利益のために機能することを望みますか?」ということです。ほとんどの人は前者を選ぶだろうと私たちは考えています。それを実現する唯一の方法は、オープンで透明性があり、コミュニティ主導であることを保証することだと私たちは知っています。

音声アシスタント機能

Mycroft は他の音声アシスタントと同じことを行いますが、やり方が異なります。ほとんどの音声アシスタントの音声システムは、デバイス側でウェイクワード認識を使用し、残りのやり取りをクラウドに送信して処理し、応答をスピーカーに送り返します。

Mycroft は、この作業の多くをソフトウェアを実行するデバイスに移行します。コマンドをリッスンするために、デバイス上のウェイクアップワード認識を使用します。ウェイクワードが検出されると、コマンドが記録され、音声からテキストへの転記のためにクラウドに送信されます。転記されると、テキスト ファイルはデバイスに送り返され、自然言語処理、スキル処理、音声合成が実行されます。

スキルはマイクロフトに能力を与えます。私たちは、社内チームとコミュニティの両方からのスキルを、新しい Mycroft スキル マーケットプレイスに着実に追加してきました。 Mycroft は、複数の音楽ソースを制御し、多数の IoT プラットフォームに接続し、Wikipedia や Wolfram|Alpha を含む 12 のソースから一般的な情報を取得し、ゲームをプレイし、サイコロを振り、物語を語り、速度テストを実行するなどの機能を備えています。

ユーザーが簡単にコンポーネントを交換できるように、Mycroft をモジュール式にしました。たとえば、現在 2 つのウェイクワードと 3 つの音声を提供しており、近日中にさらに多くの音声がサポートされる予定ですが、Mycroft では、任意のプロバイダー (クラウドまたはオンプレミス) からのカスタム ウェイクワードと TTS 音声も実行できます。

オープン AI 音声アシスタント Mycroft でプライバシーを保護する (Eric Jurgeson 著)

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  GoogleとOpenAIがマシンビジョンアルゴリズムをより良く研究するための新しいツールを開発

>>:  過去1年間、世界は人工知能の倫理について次のような考えを抱いてきた。

ブログ    
ブログ    

推薦する

FFH—AI 詩作 HttpRequest 練習

オープンソースの詳細については、以下をご覧ください。 51CTO オープンソース基本ソフトウェアコミ...

「中関村スマートAIパートナープログラム」の登録受付が開始

「中関村スマート人工知能パートナープログラム」(以下、プログラム)の登録は2021年3月1日に正式に...

...

Google、一般的な皮膚疾患を識別するための新しいAIツールを発表

5月19日、海外メディアの報道によると、人工知能はヘルスケア分野で多くの用途があるため、Google...

産業分野におけるAIの重要な役割

人工知能 (AI) は、多くの保守および制御エンジニアにとって新しい概念ではありません。デジタル変革...

生成的敵対ネットワーク (GAN) の未解決の 7 つの謎

いくつかの指標によれば、生成的敵対的ネットワーク (GAN) の研究は過去 2 年間で大きな進歩を遂...

2019年に「AI+教育」分野で大手企業は何をしたのでしょうか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

非反復乱数列生成アルゴリズム

この記事では、ハッシュテーブルを使用して重複を排除する通常の方法よりもはるかに高速な、繰り返しのない...

あなたのキャリアはAIの影響を受けますか?

[[277927]] [51CTO.com クイック翻訳] 今日、私たちは日常生活や仕事を実現する...

LinkedIn が Dagli をオープンソース化し、Java 機械学習ライブラリをリリース

近年では、大規模データ向けのTensorFlow、PyTorch、Caffee、CNTK、Spark...

フォレスター:AIと5Gがエッジコンピューティングの発展を推進

Forrester は 2021 年の技術予測シリーズを発表しましたが、その中にはエッジ コンピュー...

...

おそらく2030年までに、量子コンピューティングのChatGPTの瞬間が到来するだろう

2030 年までに RSA 暗号を解読できるマシンが登場するでしょうが、まずは量子センシングやその他...

...

人工知能の今後の発展はどうなるのでしょうか?

汎用人工知能の任務は、ユビキタスな視覚と聴覚を制御することです。「認識」を例にとると、汎用人工知能の...