この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 これは今、Siriとコミュニケーションをとる最もファッショナブルな方法かもしれません—— 唇を動かすだけで、コントロールできます。 そうです、音を必要としないタイプです。 これはコーネル大学の中国チームの最新の研究結果である。 SpeeChin 、無音音声認識。 このような: 音がまったく聞こえない状態で、彼が何を言っているかわかりますか? (答えは記事の最後で明らかにされます) しかし、SpeeChinのおかげで、Siri、Alexaなどが認識できるようになり、中国語と英語もサポートされるようになりました。 「この瞬間、音よりも沈黙の方が良い」という感覚があります。 話さずに音声アシスタントを制御するにはどうすればいいですか?コーネル大学チームが開発したSpeeChinは、実は魔法のネックレスです。 このネックレスを身に着けると、サイレントボイスコントロールへの扉が開かれます。 たとえば、コンピューターに「次へ」と静かに言うと、音楽は自動的に次の曲に切り替わります。 単語が簡単すぎると思うかもしれませんが、心配しないでください。今度は難易度を上げてみましょう。 「テイラー・スウィフトに切り替えて。」 SpeeChinは完全な文章でも正確に認識できることがわかります。 この「サイレント識別」ネックレスの鍵は、ネックレスの下に設置された赤外線カメラにあります。 人の首や顔の皮膚の変形画像を撮影し、「口」からどのような命令が伝えられているかを分析して識別できる。 さらに、このネックレスは英語だけでなく中国語も認識できます (北京語)も我慢できます。 最初の実験では、20人がテストに参加し、そのうち10人は英語を話し、残りの10人は中国語を話しました。 研究者らは、テスト参加者に、数字、対話型コマンド、音声アシストコマンド、句読点コマンド、ナビゲーションコマンドなど、英語と中国語で数十のコマンドを発行するよう依頼した。 最終的な実験結果では、「サイレント認識」の精度はそれぞれ90.5%と91.6%に達したことが示されました。 コーネル大学の中国チームこの研究はコーネル大学からのもので、第一著者はRuidong Zhang氏です。 そのうち、Cheng Zhang氏が本研究の責任著者である。 彼はコーネル大学情報科学部の助教授です。彼の研究は、インタラクション、健康センシング、活動認識などのさまざまな応用分野における現実世界の課題に対処するために、人体とその周囲に関する情報を取得する方法に焦点を当てています。 この研究の第一著者は、清華大学で学士号を取得した張程教授の博士課程の学生、張瑞東氏である。 彼の研究対象は、人間とコンピュータのインタラクションとユビキタスコンピューティングで、特にインタラクティブな体験を促進し、人間の行動に対する理解を深めるための新しいタイプのウェアラブルデバイスの構築です。 なぜこの仕事をしたいのか、Ruidong Zhang さんは次のように説明した。
最後に、オープニング GIF の答えを明らかにしましょう。 正解でしたか? |
<<: 2022年にJAXを使うべきでしょうか? GitHubには16,000個のスターがあるが、この若いツールは完璧ではない
>>: ISPの廃止はテスラの「純粋なビジョン路線」にとって重要なステップ
[[328561]]今日、あらゆるタイプの企業が人工知能や機械学習のプロジェクトに取り組んでいますが...
アプリでの音声認識は単なる楽しい機能ではなく、重要なアクセシビリティ機能です。コンピュータの主な機能...
みなさんこんにちは。私の名前はティムです。 GPT モデルの誕生以来、そのパラメータスケールは継続的...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ビル・ゲイツ氏は7月12日、米国現地時間7月11日に自身のブログに記事を掲載し、人工知能の現在の発展...
少し前にAmazonはAIツール「Amazon Q」をリリースしましたが、その競合はMicrosof...
[[400873]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
[[421713]]人工知能(AI)がその発明に対して特許を申請できるかどうかに関して、米国連邦政府...
[[407925]]ビッグデータダイジェスト制作出典: Wiredパンデミックの間、出会い系アプリ...
企業は長年にわたり、業務と分析を手作業で処理してきましたが、その結果、人件費と事務処理が増加し、最適...
ガートナーが今年発表した技術成熟度曲線には、上昇段階にある新興技術が 16 個あります。これらの新興...
【51CTO.comオリジナル記事】 1. AI ビジネス異常検出システムが必要な理由企業は、業務...
[[201461]] 2016年の英国の電力構成は過去60年間で最もクリーンとなり、主に風力と太陽光...