言葉を発することなくSiriに命令しましょう!清華大学の卒業生が「無言言語認識」ネックレスを開発

言葉を発することなくSiriに命令しましょう!清華大学の卒業生が「無言言語認識」ネックレスを開発

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

これは今、Siriとコミュニケーションをとる最もファッショナブルな方法かもしれません——

唇を動かすだけで、コントロールできます。

そうです、音を必要としないタイプです。

これはコーネル大学の中国チームの最新の研究結果である。   SpeeChin 、無音音声認識。

このような:

音がまったく聞こえない状態で、彼が何を言っているかわかりますか? (答えは記事の最後で明らかにされます)

しかし、SpeeChinのおかげで、Siri、Alexaなどが認識できるようになり、中国語と英語もサポートされるようになりました。

「この瞬間、音よりも沈黙の方が良い」という感覚があります。

話さずに音声アシスタントを制御するにはどうすればいいですか?

コーネル大学チームが開発したSpeeChinは、実は魔法のネックレスです。

このネックレスを身に着けると、サイレントボイスコントロールへの扉が開かれます。

たとえば、コンピューターに「次へ」と静かに言うと、音楽は自動的に次の曲に切り替わります。

単語が簡単すぎると思うかもしれませんが、心配しないでください。今度は難易度を上げてみましょう。

「テイラー・スウィフトに切り替えて。」

SpeeChinは完全な文章でも正確に認識できることがわかります。

この「サイレント識別」ネックレスの鍵は、ネックレスの下に設置された赤外線カメラにあります。

人の首や顔の皮膚の変形画像を撮影し、「口」からどのような命令が伝えられているかを分析して識別できる。

さらに、このネックレスは英語だけでなく中国語も認識できます  (北京語)も我慢できます。

最初の実験では、20人がテストに参加し、そのうち10人は英語を話し、残りの10人は中国語を話しました。

研究者らは、テスト参加者に、数字、対話型コマンド、音声アシストコマンド、句読点コマンド、ナビゲーションコマンドなど、英語と中国語で数十のコマンドを発行するよう依頼した。

最終的な実験結果では、「サイレント認識」の精度はそれぞれ90.5%91.6%に達したことが示されました。

コーネル大学の中国チーム

この研究はコーネル大学からのもので、第一著者はRuidong Zhang氏です。

そのうち、Cheng Zhang氏が本研究の責任著者である。

彼はコーネル大学情報科学部の助教授です。彼の研究は、インタラクション、健康センシング、活動認識などのさまざまな応用分野における現実世界の課題に対処するために、人体とその周囲に関する情報を取得する方法に焦点を当てています。

この研究の第一著者は、清華大学で学士号を取得した張程教授の博士課程の学生、張瑞東氏である。

彼の研究対象は、人間とコンピュータのインタラクションとユビキタスコンピューティングで、特にインタラクティブな体験を促進し、人間の行動に対する理解を深めるための新しいタイプのウェアラブルデバイスの構築です。

なぜこの仕事をしたいのか、Ruidong Zhang さんは次のように説明した。

これは主に、特定の状況では、人々が音を出すことが適切ではない可能性があるという事実によるものです。また、話すことができない人もいるという事実によるものです。

最後に、オープニング GIF の答えを明らかにしましょう。

正解でしたか?

<<:  2022年にJAXを使うべきでしょうか? GitHubには16,000個のスターがあるが、この若いツールは完璧ではない

>>:  ISPの廃止はテスラの「純粋なビジョン路線」にとって重要なステップ

ブログ    
ブログ    
ブログ    

推薦する

2024年の会話型AIの商用利用ガイド

会話型 AI と認知機能を現代のビジネス戦略に統合することは、特にそれが顧客体験をどのように変革する...

2019 年の 9 つの AI トレンド、準備はできていますか?

人工知能は成長して以来、絶え間ない混乱に悩まされてきましたが、特に近年は人工知能が発展の黄金期に入り...

再帰アルゴリズムと最適化アルゴリズムの比較

以前、「【インタビュー】 - 低速反応再帰」で 3 つの再帰アルゴリズムを読みました。フィボナッチ数...

コグニティブ時代のIBMの新しいカスタマーサービスセンターは、人間と機械のコラボレーションでより大きな価値を生み出します

これは厳しい試練となるだろう年初に突然発生した疫病は、世界に「一時停止ボタン」を押し、伝統的な運営モ...

倫理的な AI の今後はどうなるのでしょうか?

今日のデジタル時代では、人工知能 (AI) と機械学習 (ML) はあらゆるところに存在しています。...

...

人工知能の時代では、プログラマーは排除されるのでしょうか?

よく考えてみると、この質問は少し皮肉に思えます。将来、新しいクリエイター (AI) がクリエイター ...

ニューラルコンピュータAIモデルのブレークスルー!トレーニング時間は1秒あたり120万フレームに達し、新記録を樹立

[[326502]]今週、IBMは、同社のニューラル・コンピュータ・システムが1秒あたり120万フレ...

研究は、人工知能が手術後のオピオイド使用を減らすのにどのように役立つかを示している

ペンシルベニア大学医学部が最近実施した研究では、人工知能がオピオイド乱用と戦うためにどのように使用で...

PyTorch と TensorFlow のどちらが優れていますか?最前線の開発者の声

Theano、TensorFlow、Torch、MXNetから最近人気のPyTorchなど、ディープ...

フェイフェイ・リーのチームの新しい研究:脳制御ロボットが家事を行い、脳コンピューターインターフェースに少ないサンプルで学習する能力を与える

将来的には、考えただけでロボットに家事を任せることができるようになるかもしれません。スタンフォード大...

ワンクリックで動画をアニメーションに変換できるAIツールが人気。様々な格闘技の動きをスムーズに変換でき、無料でオンラインでプレイできます。

テキスト、画像、ビデオ、すべてをアニメーション化できます。見てください、ほんの少し前まで二人の男が格...

大きな論争の中、ニューヨーク警察はロボット犬をボストン・ダイナミクスに返却した

ニューヨーク市警察は、その「ユートピア的」技術に対する激しい批判を受け、米国企業ボストン・ダイナミク...

...