タッチから音声へ: 音声テクノロジーが IoT 環境をどう変えるか

タッチから音声へ: 音声テクノロジーが IoT 環境をどう変えるか

猛威を振るう新型コロナウイルス感染症のパンデミックは、経済と社会に大きな打撃を与えている。この世界的な課題の長期的な影響はまだ分かりませんが、私たちの交流やビジネスのやり方にはすでに根本的な変化が見られます。社会的距離を保つことや表面に触れないようにすることなどの対策により、音声認識に新たな刺激が与えられ、非接触制御の開発が促進されました。

[[335194]]

音声認識技術は長い間存在してきました。 1950年代初頭に開発された最初のシステムは数字しか理解できなかったが、2017年までにその技術は人間レベルの精度を達成した。このレベルの進歩により、音声認識は業界全体に拡大し、接続されたデバイスの標準になることができます。最近の PwC の調査によると、回答者の 90% が音声アシスタントを認識しており、そのうち 72% がスマート音声アシスタントを使用したことがあることがわかりました。

音声テクノロジーは、ミレニアル世代や Z 世代に受け入れられ、徐々に主流になりつつあります。実際、世界の音声認識市場は2025年までに318億2000万ドルに達すると予想されています。

テクノロジー大手の一部が市場シェア拡大を競う中、音声技術がなぜこれほど人気が​​あるのか​​、音声への移行を推進しているのは何なのかを問う価値はある。

音声革命を推進するもの

パンデミックにより、非接触型システムをサポートするためにユーザーがコントローラーを操作する方法を再考する必要性が緊急に浮き彫りになりました。音声ファースト テクノロジーは、安全性の向上に加えて、入力するよりも話す方がはるかに速いため、コミュニケーションが容易になり、顧客体験も向上します。非接触制御システムに音声コマンドを適用することで、コミュニケーションがより自然で効率的になります。

ユーザーに低コストで快適な体験を提供することに加えて、音声への移行を推進する他の要因もあります。

  • モバイル音声検索のための音声対応デバイスのグローバルモビリティ
  • スマートスピーカーは現代の家庭に広く浸透している
  • 自然言語処理(NLP)の進歩により、感情分析や一般的な文脈理解が可能になった。
  • AIと機械学習の進歩がパーソナライズされた体験を推進
  • スマート音声IoTデバイスはどこにでもある

音声認識システムが成熟し、より洗練されるにつれて、音声技術は今後数年間で数十億人のユーザーを魅了すると予想されます。専門家は、今後 5 年以内にほぼすべてのアプリケーションが何らかの形で音声テクノロジーを統合すると予測しています。

音声技術の導入

ホームオートメーションから電子商取引、ヘルスケア、自動車まで、あらゆる業界で IoT 機能と音声認識テクノロジーを組み合わせて、進化する消費者の需要に応え、ビジネス上の優位性を獲得しています。

(1)スマートホーム

接続されたデバイスと機能のスマートホーム エコシステムにより、リモート アクセスとリアルタイムの監視が可能になりますが、音声制御システムはスマートホームの自動化を次のレベルに引き上げます。

Amazon Echo、Google Nest、Samsung SmartThings などのスマートホーム ハブを使用すると、ユーザーは単一のインターフェースから簡単な音声コマンドを使用して、接続されたデバイスを管理できます。

(2)デジタルワークプレイス

音声起動デバイスが活躍する場所は家庭だけではありません。音声テクノロジーは職場にも変革をもたらしています。ガートナーは、2023 年までに従業員によるアプリケーション操作の 25% が音声経由になると予測しています。

今日、音声対応の仮想アシスタントは、会議や面接のスケジュール設定、リマインダーの設定など、単純で時間のかかるタスクを実行することで、従業員の効率と生産性の向上に役立っています。音声テキスト変換機能を備えた音声インターフェースを使用すると、会議、講義、電話会議のメモを取り、ハイライトを生成し、参加者と共有して共同作業を効率化できます。

会話型販売プラットフォームである Tact.ai は、音声インテリジェンスを使用して販売者のワークフローを自動化し、合理化します。このプラットフォームにより、営業担当者はいつでも音声コマンドを使用して電子メールの送信、ドキュメントの検索、販売履歴の閲覧などを行うことができます。

(3)スマートエネルギーマネジメント

ホームオートメーション システムが普及するにつれて、音声ベースのアシスタントは接続されたデバイスから豊富なエネルギー データに簡単にアクセスし、制御をユーザーの手に取り戻すことができます。エネルギー会社は、Alexa、Google Assistant、Siriなどの仮想アシスタントを通じて住宅顧客と関わり、現在のエネルギー使用状況に関する情報を提供したり、パーソナライズされた省エネ提案を行ったり、エネルギー消費効率を改善したりし始めています。

顧客体験スタックに音声アシスタントを追加することは、セルフサービス チャネルを導入し、コール センターのコストを削減する優れた方法でもあります。会話型アシスタントは、ユーザーが口座残高にアクセスしたり、最適なレートに関する情報を見つけたり、停電やエネルギー使用傾向に関する最新情報を入手したりするのに役立ちます。

顧客にエネルギー管理ツールを提供する公益事業の好例は、Alexa と提携してリアルタイムのエネルギー価格と音声自動化を組み合わせたエネルギー会社 Octopus です。とりわけ、ユーザーは仮想アシスタントに電気代が最も安い時間帯を尋ね、その時間帯に最もエネルギーを消費するタスクをスケジュールして電気代を削減することができます。

(4)ヘルスケア

医療現場では、IoT 音声制御により患者の体験を向上させ、パーソナライズされたケアを提供できます。スマート音声アシスタントは、患者の医療記録をリアルタイムで更新したり、投薬や治療手順に関する情報などを提供したりできます。

医療テクノロジー企業 Orbita は、病院スタッフとのコミュニケーションを簡素化し、応答時間を大幅に短縮する音声対応の医療仮想アシスタントを提供しています。ボストン小児病院が立ち上げた小児疾患管理システム「KidsMD」により、保護者はAlexa対応デバイスで高品質の臨床情報や具体的な治療オプションにアクセスできるようになります。

(5)音声決済

音声テクノロジーは、顧客サービスの向上、金融体験のパーソナライズ、競争上の優位性の獲得に役立つ強力なツールとして金融業界で注目を集めています。 BankofAmerica や Ally Bank などの大企業は、テキストおよび音声ベースの会話エージェントを活用して、顧客が残高を確認したり、口座アラートを設定したり、支出を追跡したり、よくある質問への回答を得たりできるようにしています。さらに、Atom のようなチャレンジャーバンクは音声生体認証を使用して、銀行アプリにさらに一層のセキュリティを追加しています。

人々がテクノロジーへの信頼を高めるにつれて、音声決済も普及し始めています。最近の調査によると、ユーザーは低価格の商品、サブスクリプション、オンデマンドの映画、オーディオ、テレビ番組に対して音声で支払う意欲が高まっていることがわかりました。

銀行業務における音声テクノロジーのもう 1 つの潜在的な用途は、人々が毎日使用する ATM です。音声認識は、タッチベースのやり取りを必要とせずにユーザーを認証し、取引を実行するための代替手段として機能します。これは、パンデミック後の世界の新しい標準になる可能性があります。

産業用IoTに適していますか?

音声テクノロジーの熱気を感じている業界は、コンシューマー向け IoT だけではありません。柔軟性、効率性、持続可能性が重視される産業用 IoT 環境では、音声対応デバイスがゲームチェンジャーになる可能性があります。

製造工場、建設現場、生産ラインなど、これらすべての産業環境では、IoT 音声認識システムが提供するハンズフリーのモビリティが必要です。従業員が追加の指示を必要としたり、解決策を検索したりする場合、音声制御により、非接触で直感的な対話を通じて必要な情報に簡単にアクセスできます。

2022 年までに、インダストリー 4.0 エコシステムでコラボレーションするすべての人の 50% 以上が、仮想アシスタントまたはインテリジェント エージェントを使用して、周囲や他の人と自然かつ効率的にやり取りするようになります。

スマート ファクトリー環境では、音声ベースのアシスタントは次の機能も実行できます。

  • 作業指示書を作成し、資産データを記録する
  • 注文の配送状況を更新する
  • 統合ERPシステムからのデータにアクセスしてリソース計画を改善
  • 資産管理システムと統合します。

音声指示倉庫管理(VDW)も増加傾向にあります。集中的な倉庫環境では、音声ピッキング システムは音声認識を使用して、従業員が倉庫管理システムと対話し、音声で指示を受信できるようにすることで、生産性を向上させ、エラーを削減します。 ZeteMedia は、WMS、ERP、その他のエンタープライズ システムと簡単に統合して複雑な倉庫管理業務を最適化する音声ピッキング ソリューションのプロバイダーです。

実装の課題

しかし、音声テクノロジーを産業現場で活用するには課題がないわけではありません。 IoT の音声コントローラーが効果を発揮するには、音声が明瞭で、音声コマンドが理解しやすいものでなければなりませんが、これは騒がしい作業環境では必ずしも容易ではありません。音声対応アシスタントは、人間の声を背景の雑音から区別する必要があるだけでなく、真に役立つためにはさまざまな言語やアクセントをサポートする必要があります。

IoT における音声制御が直面するもう 1 つの課題は、すべての IoT デバイスがインターネットに接続されているわけではない、または常に接続されているわけではないことです。人間とコンピュータの信頼性の高いインタラクションを確保するには、強力なオフライン音声認識機能が必要です。 NXP は、最先端のマイクロコントローラを活用してデバイスメーカーが音声コマンドをより簡単に統合できるようにする長距離オフライン音声制御ソリューションで市場のニーズに対応しています。

テルアビブを拠点とするAIスタートアップ企業Onvegoも、オフラインでもIoTデバイスの音声起動を可能にする取り組みを進めている。多言語サポートに加えて、音声ソリューションは機械学習アルゴリズムに基づいており、企業の特定の状況での迅速なトレーニングを保証します。

要約する

音声起動テクノロジーは私たちの未来として歓迎されており、私たちが想像もできない方法で世界と関わる方法を再定義しています。音声対応 IoT は、スマート ホームを超えて産業用アプリケーションへとますます広がりつつあります。音声制御には一定の課題がありますが、そのスピード、利便性、ハンズフリー操作の利点(特に社会的距離が必要な場合)により、この技術は私たちの生活に欠かせないものになりつつあります。

<<:  一般的な機械学習アルゴリズム11種の紹介

>>:  ドローン技術を都市計画に活用

ブログ    
ブログ    

推薦する

情報フローシナリオにおけるAIGCの実践

1. パーソナライズされたタイトル生成パーソナライズされたタイトル生成とは、ユーザー コンテンツとパ...

マグロのように尾の弾力性を動的に調整する「ロボットマグロ」がサイエンス誌に掲載

バージニア大学のダン・クイン教授と博士研究員のゾン・チアン氏は、生体力学、流体力学、ロボット工学を組...

AIを使用してC++、Java、Pythonコードを翻訳し、最大成功率は80.9%です。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

データ分析に人工知能を取り入れる方法

生成型 AI の台頭は、インターネットの誕生と同様の影響を及ぼしています。新しいテクノロジーが私たち...

...

巨大企業間の今後の AI 戦争: マイクロソフトは左に進んで 2B、グーグルは右に進んで 2C

AI時代の到来非常にドラマチックなのは、Microsoft Build 開発者会議と Google...

2019 年に注目すべき 10 社のクールなロボット スタートアップ

[51CTO.com クイック翻訳] ロボットは登場しましたが、現在はほとんど世間の注目を浴びていま...

これらの「ブラックテクノロジー」は洪水対策をよりスマートにする

現在、我が国の南北はともに洪水の季節を迎え、大雨が頻繁に発生し、洪水の予防と制御は危機的な段階に達し...

AIがサイバーセキュリティに与える影響

人工知能(AI)は、人間の知能をシミュレート、拡張、拡大するための理論、方法、技術、アプリケーション...

ハリウッドのAIに対する攻撃は、AIの脚本の最新エピソードに書かれていた

今日まで、『ゲーム・オブ・スローンズ』の最終シーズンに失望していたかもしれません。しかし、AI にま...

2020年までに、iPhoneでは画面指紋認証と顔認証が共存するようになるかもしれない

数日後には、2019 年の新しい iPhone シリーズが登場します。iPhone が Face I...

Ctrip旅行言語モデルシステムの紹介と応用

著者についてCtrip の自然言語処理と大規模言語モデル アルゴリズムの専門家である Terry は...

GPT-3 の推論高速化は NVIDIA のソリューションを 50% 上回ります。大規模モデル推論システムEnergon-AIオープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Meili United が VALSE カンファレンスで「ファッションをグラフィックで説明」する画像アルゴリズムの体験を共有する方法

最近、第7回ビジョンと学習セミナー(VALSE)が厦門大学で成功裏に終了しました。 VALSE は ...