言葉を発することなくSiriに命令しましょう！清華大学の卒業生が「無言言語認識」ネックレスを開発

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

これは今、Siriとコミュニケーションをとる最もファッショナブルな方法かもしれません——

唇を動かすだけで、コントロールできます。

そうです、音を必要としないタイプです。

これはコーネル大学の中国チームの最新の研究結果である。 SpeeChin 、無音音声認識。

このような：

音がまったく聞こえない状態で、彼が何を言っているかわかりますか？（答えは記事の最後で明らかにされます）

しかし、SpeeChinのおかげで、Siri、Alexaなどが認識できるようになり、中国語と英語もサポートされるようになりました。

「この瞬間、音よりも沈黙の方が良い」という感覚があります。

話さずに音声アシスタントを制御するにはどうすればいいですか?

コーネル大学チームが開発したSpeeChinは、実は魔法のネックレスです。

このネックレスを身に着けると、サイレントボイスコントロールへの扉が開かれます。

たとえば、コンピューターに「次へ」と静かに言うと、音楽は自動的に次の曲に切り替わります。

単語が簡単すぎると思うかもしれませんが、心配しないでください。今度は難易度を上げてみましょう。

「テイラー・スウィフトに切り替えて。」

SpeeChinは完全な文章でも正確に認識できることがわかります。

この「サイレント識別」ネックレスの鍵は、ネックレスの下に設置された赤外線カメラにあります。

人の首や顔の皮膚の変形画像を撮影し、「口」からどのような命令が伝えられているかを分析して識別できる。

さらに、このネックレスは英語だけでなく中国語も認識できます（北京語）も我慢できます。

最初の実験では、20人がテストに参加し、そのうち10人は英語を話し、残りの10人は中国語を話しました。

研究者らは、テスト参加者に、数字、対話型コマンド、音声アシストコマンド、句読点コマンド、ナビゲーションコマンドなど、英語と中国語で数十のコマンドを発行するよう依頼した。

最終的な実験結果では、「サイレント認識」の精度はそれぞれ90.5%と91.6%に達したことが示されました。

コーネル大学の中国チーム

この研究はコーネル大学からのもので、第一著者はRuidong Zhang氏です。

そのうち、Cheng Zhang氏が本研究の責任著者である。

彼はコーネル大学情報科学部の助教授です。彼の研究は、インタラクション、健康センシング、活動認識などのさまざまな応用分野における現実世界の課題に対処するために、人体とその周囲に関する情報を取得する方法に焦点を当てています。

この研究の第一著者は、清華大学で学士号を取得した張程教授の博士課程の学生、張瑞東氏である。

彼の研究対象は、人間とコンピュータのインタラクションとユビキタスコンピューティングで、特にインタラクティブな体験を促進し、人間の行動に対する理解を深めるための新しいタイプのウェアラブルデバイスの構築です。

なぜこの仕事をしたいのか、Ruidong Zhang さんは次のように説明した。

これは主に、特定の状況では、人々が音を出すことが適切ではない可能性があるという事実によるものです。また、話すことができない人もいるという事実によるものです。

最後に、オープニング GIF の答えを明らかにしましょう。

正解でしたか？

<<: 2022年にJAXを使うべきでしょうか？ GitHubには16,000個のスターがあるが、この若いツールは完璧ではない

>>: ISPの廃止はテスラの「純粋なビジョン路線」にとって重要なステップ

ブログ

言葉を発することなくSiriに命令しましょう！清華大学の卒業生が「無言言語認識」ネックレスを開発

話さずに音声アシスタントを制御するにはどうすればいいですか?

コーネル大学の中国チーム

スタンフォード大学の研究者がAIを活用してCOVID-19の治療薬の発見を加速

NTU Yu Yangによる徹底分析：「世界モデル」とは何か？

中国の自動運転はアメリカの自動運転と比べてどう劣っているのか？

世界初の3D AI合成キャスターがデビューし、2つのセッションの取材にも参加。ネットユーザー：キャスターは失業中

Amazon Lexについて

リアルタイムのテキストおよび画像処理の速度が 5 ～ 10 倍向上しました。Tsinghua LCM/LCM-LoRA は人気を博し、視聴回数は 100 万回を超えました。

ネットで熱い議論：感染拡大から半年でディープラーニングの求人数が激減

推薦する

グラフィックで説明する 10 個のグラフアルゴリズム

日本の女性型ロボットは人気があります。本物の人間のようで、「生殖」の機能も持っています。

フィンテック企業はリスク管理に AI をどのように活用しているのでしょうか?

ストリームPETRを超えて！ BEVNeXt: 高密度 BEV 認識のための新しいフレームワーク

人工知能 (AI): 2022 年に注目すべき 7 つのトレンド

機械学習入門メソッドの最も価値のあるコレクションを今日あなたと共有します

OpenAI は大規模なモデルストアを立ち上げる予定で、開発者は製品を棚に置くことができます。

GPT-4 スーパーデラックスパッケージがオンラインに、新型 32K モデルがリーク！ファイルアップロード分析、自動モデル選択、そして何千ものAI企業の中で究極のキラー

「人工太陽」が正確に放電します！ DeepMind、AI制御の核融合で新たなブレークスルーを達成

2.5 ～ 4 倍の深さで、より少ないパラメータと計算量で、DeLighT はどうやってそれを実現したのでしょうか?

スマートビルディングにおけるAIの活用

Google I/O 2018 に注目: AI に始まり、AI に終わる

AIは賢くなり、これらの新しい技術は流行の防止と生産の再開に役立つだろう