将来、音声認識はどのような商業シナリオに適用される可能性がありますか?

将来、音声認識はどのような商業シナリオに適用される可能性がありますか?

Companies and Markets の評価レポートでは、世界の音声認識市場は今後さらに多様化し、ソフトウェアの精度も大幅に向上すると述べられています。 2017 年までにこの市場は 1,330 億米ドルに達すると予測されています。

Companies and Markets の評価レポートでは、世界の音声認識市場は今後さらに多様化し、ソフトウェアの精度も大幅に向上すると述べられています。 2017 年までにこの市場は 1,330 億米ドルに達すると予測されています。映画「Her」を見た友人は、音声認識と制御のストーリーに間違いなく感銘を受けるでしょう。この技術を実現する難しさについては以前詳しく紹介しましたが、近い将来、音声認識技術はどのようなシナリオで使用されるのでしょうか。

音声認識に関して、まず頭に浮かぶのは、おそらくジョークを言うことができない Siri でしょう。 Siri の技術は、世界初の上場音声認識企業である Nuance 社が開発したものだ。数週間前、Baidu が音声アシスタント アプリケーションを強化するために Nuance を買収したいとの噂があったが、Baidu Deep Learning Laboratory (IDL) のディレクターである Yu Kai 氏はこれを否定した。昨年11月、サムスンがニュアンスとの買収交渉を行ったが、6カ月連続の赤字に怯んで断念したとの報道があった。一方、AppleはNuanceの技術に依存し続けることを望まず、一連の自主的な取り組みを実施し、これもNuanceに新たな販路を模索するきっかけとなった。

[[186259]]

直接的なキャッシュフローをほとんど生み出さない事業である音声認識は、Nuance に多大な問題を引き起こしました。同社の全体的な状況は楽観的ではありませんが、Nuance がさまざまな分野で事業化に取り組んでいることがわかります。

医療分野

少し前に、Nuance は公式ブログで医療分野に注力すると発表しました。スマートウォッチを通じて運動状況や心拍数を追跡するだけの単純なものではなく、適切なレストランや食事など、その人の身体状況に応じて対応するサービスを直接マッチングさせるものでもあります。もちろん、これらのほとんどはウェアラブルデバイスに基づいています。さらに、緊急時の音声支援、医師と患者の会話のアーカイブ化、コールセンターの会話のディクテーションなど、さらに多くのシナリオも検討しました。

医療分野の語彙データベースは専門性が高く、進化も少ないため、完全なデータベースが構築されていれば、病名や薬品名の比較的正確な識別が可能になります。 Medical Record FolderやZhenlipaiなどの既存の国内アプリケーションは、医療記録を安全に保存し、症例検索を容易にし、音声検索機能をサポートするクラウドスペースを医師に提供します。

スマートカー

運転の安全性の問題は常に大きな注目を集めています。昨年、タッチスクリーンを操作する際にドライバーが過度に気を取られる問題を解決するために、簡単な複数指のジェスチャーを使用できる車のスクリーンを設計した人がいました。実際、Nuance はすでに Dragon Drive と呼ばれるカスタマイズされた自動車グレードの音声プラットフォームを持っており、2015 CES イノベーション アワードを受賞しています。 Nuance は車載プラットフォームを携帯電話に接続することで、ユーザーが GPS ナビゲーション、メッセージの送受信、通話の発信と受信、ソーシャル ネットワークの更新などの音声制御を実現できるよう支援します。

スマートウェアラブル

北京の冬はますます寒くなってきました。携帯電話を使う必要があるのに、手に取りたくないと思うことが何度もあります。電話をかけたり、WeChatメッセージを送信したり、ルートを確認したり、タクシーを呼んだりすることが、すべてウェアラブルデバイスの音声制御によって可能になれば素晴らしいでしょう。現在、Mobvoiチームは、音声でDidiタクシーを直接制御できるMoto 360用のスマートウォッチオペレーティングシステムであるTicwearを開発しました。

[[186260]]

インテルは1年前に、耳に装着して携帯電話に接続し、所有者の指示を理解して音声フィードバックを返す、Siriに似たパーソナル音声アシスタントとして機能するウェアラブルデバイスのプロトタイプJarvisを開発しました。これは「her」のシーンではないでしょうか?

スマートホーム

以前、当社はさまざまなスマートホームを統合しながら、新たな方法でより多くの人体データを収集することを目指したスマートベッドカバー「Luna」を紹介しました。特にベッドに横になっていて画面をまったく見たくないときには、音声認識が最も適した統合方法かもしれません。さらに、Nuance はすでにテレビや携帯電話を音声で制御できる技術を開発しています。

「インターネットの考え方を使って自宅のバスルームを変革できる人はいますか? 毎回スピーカーを持ち歩くのは非常に面倒です。それに、曲を変えたり緊急電話に出たりするのは、単に非人道的です。」スマートホームバスルームはまだ聞いたことがありませんが、音声で制御できるスマートスピーカーはすでに利用可能です。

教育

先ほど、音声認識の難しさの 1 つは、多くの言語や方言の多様性にあると述べました。これは、教育の分野にも応用できます。データベースに標準を提供させることで、口頭評価をよりシンプルかつ効率的に行うことができます。

[[186261]]

学習支援という点では、1年前の「紫東通訳」というクラウド認識に基づく中国語と英語の同時翻訳アプリケーションを思い出します。音声翻訳、音声認識、音声合成の技術を統合しています。翻訳したい文章を携帯電話に話すだけで、中国語と英語の音声読み上げ結果と視覚的なテキスト結果が表示されます。連続音声入力をサポートし、声のトーンに基づいて句読点を自動的に追加することもできます。

つまり、話すことは人間にとって最も自然なコミュニケーション方法です。人工知能は疑似知能であり、機械が人間のように生きることは決してありませんが、機械はますます理解力を高めることができると言えます。

<<:  ディープラーニングにも欠陥があり、同質のAIスタートアップ間の競争は熾烈になるだろう

>>:  将来、仮想現実、人工知能、そして人体はどのように融合するのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

MarketsandMarkets: AI ロボット市場は 2026 年までに 353 億ドルに達する

MarketsandMarketsが発表した最新の市場調査レポートによると、人工知能ロボット市場は2...

中国移動のチーフサイエンティスト、馮俊蘭氏との独占インタビュー:AIビジネスアプリケーションは何度も融合する必要がある

「インテリジェンス」が本格的に到来!人工知能(AI)は、科学技術革命と産業変革の新たなラウンドにおけ...

強いAIと弱いAIの議論:人工知能の意識に関する興味深い理論

[[344692]]最近、私のお気に入りの新進思想家の一人と高性能 AI と低性能 AI について議...

ブロックチェーン技術における機械学習

近代化は世界を変える可能性のある新しい画期的なものをもたらしました。現実世界の問題は、単純な従来のア...

最新のMLPerfランキング:アリババのAIコンピューティングパワーが多くの分野で1位を獲得

4月7日、権威あるAIベンチマーク評価組織MLPerfが最新の推論パフォーマンスリストを公開した。 ...

LRU キャッシュ アルゴリズムの Java カスタム実装

背景LinkedHashMap は HashMap を継承し、内部的に removeEldestEn...

CreditEase の R&D ディレクター、張振氏: 運用・保守ロボットのタスク決定システムの進化

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...

人間は AI シミュレーションの中で生きられるのか?

人々が自らに問うべき実存的な問いは、自分たちがシミュレートされた宇宙に住んでいるかどうかだ。 [[3...

2019 年の AI、セキュリティ、IT 運用、IoT に関する主な予測

次の技術変化が始まる前に、将来の発展の方向を予測・判断し、技術変化に伴う可能性のある困難を軽減する必...

...

畳み込みニューラルネットワークの「修理工」のための「マニュアル」

[[242145]]ビッグデータダイジェスト制作編集者: Luo Ran、Xue Qing、Ail...

スマートエコノミーの時代において、人工知能技術をどのように活用して、より多くの技術的利益をもたらすことができるのでしょうか?

人工知能技術の急速な発展は、あらゆる分野で技術革新を推進し、多数の新興産業を生み出しました。今後 1...

ピュー研究所:アルゴリズム時代の7つの主要テーマとその主な影響

世界的に権威のある調査機関であるピュー研究所は最近、「アルゴリズムの時代」と題する報告書を発表し、1...

...

AI主導のサイバーセキュリティチームが人間の能力拡張に取り組む

サイバー脅威の範囲は、企業資産や選挙から健康データや物理インフラまで拡大しており、新興技術の予期せぬ...