オープンAI音声アシスタントMycroftでプライバシーを確​​保

オープンAI音声アシスタントMycroftでプライバシーを確​​保

[[258822]]

[51CTO.com クイック翻訳] 音声アシスト技術は非常に人気があり、すでに25億台のデバイスが使用されており、この数は2023年までに3倍の80億台になると予想されています。主流の音声アシスト技術にはプライバシーとセキュリティの脆弱性があるにもかかわらず、この成長は止められないようです。

1 つは「開いている窓」の脆弱性です。たとえば、悪意のある人物が開いている窓の前を通り過ぎ、「おい、ドアを開けろ!」と叫んで家に入る可能性があります。研究者らはまた、AlexaとGoogle Assistantに何千もの誤検知ウェイクワードがあり、悪意のあるコマンドを挿入するための潜在的な攻撃ベクトルであることも発見した。テレビを通じて亜音速の指令を送信することのリスクを指摘する人もいる。 Amazonはすでに、Alexaがコマーシャル中に起動しないように周波数を操作している。また、インターネットに接続されたあらゆるコンピューティング デバイスと同様に、バックドアやその他の一般的な脆弱性が存在する可能性があります。

プライバシーとセキュリティのためのオープンソーステクノロジー

Mycroft AI のようなオープンソースの音声アシスタントは、意図的にセキュリティとプライバシーへの道を提供します。オープンソース ソフトウェアでは、その性質上、脆弱性が明らかになるようにコードのレビューが推奨されます。

私が勤務する会社であるマイクロフトは、音声アシスト技術は安全であるという概念を推進しています。当社には、共通脆弱性識別子 (CVE) 開示を処理するためのプロセスがあります。開発ツールとして、私たちは SSH などのシステムに大きく依存しており、セットアップ ウィザード内のパスワードも含め、デバイスのデフォルト パスワードを変更することを常に推奨しています。また、意図解析、スキル、テキスト読み上げ (TTS) などの機能をデバイスに移行します。これは、他の大企業がクラウドで実行できる機能です。技術に精通したホーム ユーザー向けに、ファイアウォールの背後でエクスペリエンス全体を実行するために必要なコンポーネントを近日中にリリースする予定です。私たちは、ユーザーがソフトウェアを可能な限り制御できるようにしたいと考えています。

音声プリントにより、AI は声で人を区別できるようになり、ユーザーはロック、購入、その他の機密機能の権限を特定の人に割り当てることができるため、「ウィンドウイング」や誤検知のウェイクアップワードの脆弱性が軽減されます。これらには、ワンタイム音声パスワードまたはより高度な音声生体認証を使用した 2 要素認証を追加できます。 Google と Amazon はすでにアシスタントに何らかの音声プリントを導入しており、私たちはこの分野で大きな可能性を秘めたいくつかの企業と連携しています。ウェイクワード認識の改善により、使用可能な誤検知ウェイクワードのリストが制限されます。適切に設計されたフィードバック ループでは、Mycroft の Precise フラグ ツールなどのテクノロジを使用して誤検知がフラグ付けされるため、誤検知が効果的である可能性は低くなります。

オープンソースイノベーション

かつては、実験を奨励する方法はオープンソースを通じてでした。これが真のイノベーションが生まれ、新しいテクノロジーが構築される方法です。

私たちは、イノベーターたちに、より少ない文字列で音声アシスタント技術を試す機会を提供します。オープンソースはソフトウェアをコミュニティの努力で実現します。たとえば、Mycroft には、数名の技術メンバーを含む 16 人のチームではなく、フィードバックを提供し、新機能を開発し、コア ソフトウェアに貢献する何千人もの開発者がいます。当社のライセンス モデルに基づいて、イノベーターは新しい革新的な実装からビジネスを簡単に構築できます。

もっと深く言えば、オープンとは、テクノロジーが、それを提供する企業だけでなく、ユーザーを完全に代表できることを意味します。音声アシスタントは、人々があらゆるテクノロジーと対話する方法を変える力を持っています。音声は、家庭、オフィス、モバイル デバイス、公共の場所を、これまで想像もできなかった方法で変革します。

私たちが皆さんに問いかけたいのは、「このテクノロジーが完全に自分の利益のために機能することを望みますか、それとも小売業者や検索・データ企業の利益のために機能することを望みますか?」ということです。ほとんどの人は前者を選ぶだろうと私たちは考えています。それを実現する唯一の方法は、オープンで透明性があり、コミュニティ主導であることを保証することだと私たちは知っています。

音声アシスタント機能

Mycroft は他の音声アシスタントと同じことを行いますが、やり方が異なります。ほとんどの音声アシスタントの音声システムは、デバイス側でウェイクワード認識を使用し、残りのやり取りをクラウドに送信して処理し、応答をスピーカーに送り返します。

Mycroft は、この作業の多くをソフトウェアを実行するデバイスに移行します。コマンドをリッスンするために、デバイス上のウェイクアップワード認識を使用します。ウェイクワードが検出されると、コマンドが記録され、音声からテキストへの転記のためにクラウドに送信されます。転記されると、テキスト ファイルはデバイスに送り返され、自然言語処理、スキル処理、音声合成が実行されます。

スキルはマイクロフトに能力を与えます。私たちは、社内チームとコミュニティの両方からのスキルを、新しい Mycroft スキル マーケットプレイスに着実に追加してきました。 Mycroft は、複数の音楽ソースを制御し、多数の IoT プラットフォームに接続し、Wikipedia や Wolfram|Alpha を含む 12 のソースから一般的な情報を取得し、ゲームをプレイし、サイコロを振り、物語を語り、速度テストを実行するなどの機能を備えています。

ユーザーが簡単にコンポーネントを交換できるように、Mycroft をモジュール式にしました。たとえば、現在 2 つのウェイクワードと 3 つの音声を提供しており、近日中にさらに多くの音声がサポートされる予定ですが、Mycroft では、任意のプロバイダー (クラウドまたはオンプレミス) からのカスタム ウェイクワードと TTS 音声も実行できます。

オープン AI 音声アシスタント Mycroft でプライバシーを保護する (Eric Jurgeson 著)

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  GoogleとOpenAIがマシンビジョンアルゴリズムをより良く研究するための新しいツールを開発

>>:  過去1年間、世界は人工知能の倫理について次のような考えを抱いてきた。

ブログ    
ブログ    
ブログ    

推薦する

...

普及モデルはどのようにして新しい世代の意思決定エージェントを構築するのでしょうか?自己回帰を超えて長いシーケンス計画軌道を生成する

部屋の中に立っていて、ドアに向かって歩こうとしていると想像してください。自己回帰を使用して、一歩ずつ...

責任ある AI 導入: IT 共生の青写真

AI ツールが合法化され、職場に導入されるようになると、人々は当然、その使用例や AI ツールに依存...

...

JavaScript によるデータ構造とアルゴリズムの実装と応用: Stack/Recursion/Hanno

まとめこの記事では、Stack データ構造の基本的な操作とそのいくつかの応用について紹介します。括弧...

5G+AI:将来的には1+1>2の効果は得られるのか?

情報産業革命以来、人々の生活は大きく変化しました。それぞれの新しいテクノロジーの出現は、さまざまなレ...

Keras または TensorFlow?プログラマーはディープラーニングフレームワークをどのように選択すべきでしょうか?

ディープラーニングは急速に発展していますが、過去 2 年間に登場した多くのディープラーニング フレー...

ロボットがIoTアプリケーションの範囲を拡大する方法

ロボットの学習能力と IoT アプリケーションの相互接続性は、実りある未来を約束します。モノのインタ...

ロボットは購入するよりもレンタルした方が良いのでしょうか?新モデルの普及には「4段階をクリア」する必要がある

ロボットの重要性は明らかです。ロボットは効率的で柔軟性があり、安定した動作特性を備えているため、人間...

科学研究だけでなく、水中ロボットの消費者への応用も有望である。

近年、政策、技術、資金の推進により、我が国のロボット開発は目覚ましい成果を上げています。「空の月まで...

AIはイスラエルとパレスチナの紛争の偽画像を生成し、それが非常にリアルであるためメディアで引用されている

イスラエルとパレスチナの紛争が続く中、関連ニュースが次々と報道され、中には虚偽の内容も混じり始め、真...

GPT-4は人間が92点取れる質問に対して15点しか取れない。テストがアップグレードされると、すべての大きなモデルが露呈する。

GPT-4は誕生以来、さまざまな試験(ベンチマーク)で高得点を獲得する「優秀な生徒」でした。しかし...

...

ソラは人間の代わりにはなれない!アマゾンのエンジニアは主張:実際の仕事上の対立はAIでは解決できない

今週、OpenAIのビデオAIツール「Sora」が登場するや否や大きな話題を呼んだ。 「仕事を失う」...

モバイルデバイスにディープラーニングを導入: モバイルデバイスにおける Mogujie のディープラーニング最適化の実践

[51CTO.com からのオリジナル記事] ディープラーニングは、データを表現する学習に基づいた機...