音声アシスタント業界はどこへ向かうのでしょうか?

音声アシスタント業界はどこへ向かうのでしょうか?

プログレス・パートナーズの創設者兼シニアマネージングディレクターのニック・マクシェーン氏は、「今後数年間で、既存の企業の能力を超える音声アシスタントの新たな市場、新たなアプリケーション、新たなプラットフォームが登場するだろう」と語った。 Progress Partners は、新興テクノロジー企業やメディア企業に M&A、資金調達、SPAC アドバイザリーを提供するマーチャント バンクです。

TechTalks とのインタビューで、MacShane 氏は音声アシスタント業界の展望と、この拡大する市場で革新的なスタートアップ企業がいかにして存在感を発揮できるかについて語りました。

音声アシスタントの大量導入

音声アシスタントは何十年も前から存在しています。しかし、Apple が Siri を導入した 2011 年までは、広く使用されることはありませんでした。それ以来、市場は急速に成長してきました。 Microsoft と Amazon はそれぞれ 2014 年に Cortana と Alexa をリリースしました。 Google は 2016 年にアシスタントをリリースしました。サムスンは2017年にBixbyをリリースしました。すべてが同じように成功したわけではありませんが、デバイスの使用方法に文化的な変化をもたらしました。

現在、アメリカの世帯の50%以上がスマートスピーカーを所有しています。米国では推定1億2,800万人が音声アシスタントを使用しています。音声はオンライン検索の大部分を占めており、ローカルビジネス検索の 50% 以上も占めています。音声アシスタントの使用は、車内や、ユーザーが画面を見たり操作したりすることを好まないその他の環境で増加しています。

さらに、これらの数字はすべて年々増加しており、デバイスやアプリケーションにおける音声機能の受容と期待が高まっていることを示しています。音声アシスタント市場の成長は、機械学習とディープラーニングの進歩により、音声テキスト変換技術の精度が向上したなど、いくつかの要因によるものです。自然言語処理 (NLP) と大規模言語モデルの進歩により、より複雑なコマンドを実行できるようになりました。 TinyML は音声推論をクラウドからエッジに移動しました。ユビキタスコンピューティングとインターネット接続により、音声アシスタントが私たちのポケット、手首、リビングルームにまで浸透しました。

現在の音声アシスタントの限界

しかし、音声アシスタント市場の拡大により、既存企業のいくつかの欠点も浮き彫りになってきました。

「音声アシスタントはこれまでで最も急速に成長している消費者向けテクノロジーの1つだが、現在の使用例は音楽を聴いたりタイマーを設定したりといった比較的単純なものだ」とマクシェーン氏は語った。 「時間の経過とともに、ユーザーが音声テクノロジーとやり取りする方法はより洗練されていくと予想しています。」

ユーザーが音声テクノロジーに慣れてくると、期待も高まります。ユーザーは、複数のやり取りや専門分野の知識を必要とするタスクを音声アシスタントに支援してもらいたいと考えています。例えば、ユーザーはテレビに、画面上で俳優が着ているシャツを買うように頼んだり、運転中にショッピングカートに商品を追加したりしたいかもしれない、とマクシェーン氏は述べた。この場合、アシスタントは音声コマンドをアクションにマッピングするだけでなく、複数のソースから情報を収集できる必要があります。

「音声分野で見られる技術の進歩により、人々は音声アシスタントをより活用できるようになり、会話をあるスマートスピーカーから別のスマートスピーカーに移すことができるようになる」とマクシェーン氏は語った。

プラットフォームに依存しない音声アシスタント

現在の音声アシスタントのもう 1 つの問題は、クロスプラットフォーム サポートが不足していることです。 Alexa は Amazon に、Siri は Apple に、そして Assistant は Google に関連付けられています。このため、開発者がユーザーが所有するさまざまなデバイスで動作する音声アプリケーションを作成することは困難です。

「現在、市場では音声アシスタントの多様性が増しつつある。新製品が人気を集めるにつれ、最大の市場シェアを持つリーダーとしてのアマゾンの地位は低下している」とマクシェーン氏は語った。 「現在、Amazon の市場シェアは 50% 未満であり、すべてのプラットフォームでサービスを提供するためにサードパーティのサポートの必要性がこれまで以上に高まっています。」

基本的に、これは、アプリを開発する場合、あらゆる種類の音声アシスタントでアプリを動作させる方法を考えなければならないことを意味します。 Alexa または Siri へのサポートを制限すると、一部のアプリ ユーザーは音声機能の利便性を失ってしまいます。これは、さまざまなオペレーティング システムで動作する、プラットフォームに依存しない音声アシスタントが埋めることができるギャップです。

「ブランドは、たった 1 つのスマート デバイスで広告や販売、消費者とのやり取りを行いたいとは思っていません。エコシステム全体に参加したいと考えており、それを可能にするのがサードパーティのテクノロジー プロバイダーです」とマクシェーン氏は語った。 「サードパーティのテクノロジープロバイダーを活用することで、ブランドは多様な音声アシスタントのポートフォリオを通じてメッセージを届けることができるようになります。音声テクノロジー市場において、インフラ、収益化、商取引、データと分析を優先することで、新たな機会が生まれます。」

今後注目すべき音声アシスタントプラットフォーム

「私たちは、コマース、広告、コネクテッドTVという3つの主要分野で音声サポートの将来にチャンスがあると確信しています」とマクシェーン氏は語った。

Progress Partners の投資部門である Progress Ventures は最近、音声アシスタントの未来を担うと MacShane 氏が考える音声技術の新興企業数社に投資した。

その1つが、2022年までに400億ドルに達すると見込まれる急成長産業である音声コマース向けのクラウドベースプラットフォームであるBlutagです。 Blutag は、ほとんどの主要な e コマース プラットフォームに対してコード不要の音声サポートと、カスタム統合のための豊富な API を提供します。オンライン ストアの所有者は、購入、クーポン、FAQ など、さまざまな音声対応機能を追加できます。このプラットフォームは、さまざまなデバイスタイプとマルチモーダルエクスペリエンスをサポートします。したがって、たとえば、ユーザーがディスプレイ付きのデバイス(スマートテレビやスマートフォンなど)を使用する場合、音声アシスタントは、ユーザーの音声データやディスプレイに表示されるコンテンツなど、さまざまなソースから情報を取得できるようになります。デバイス画面。 Blutag は音声コマース向けに設計されているため、複数ステップの購入やコンテキスト データの使用など、汎用の音声アシスタントでは対応できない複雑なオンライン ショッピングの問題を処理できます。

Progress Ventures の別のポートフォリオ企業である Instreamatic は、音声広告を提供しています。 Instreamatic を使用すると、企業はユーザーに話しかける会話型広告を配信できます。 Instreamatic の目標は、静的な広告から、ユーザーにパーソナライズされたエクスペリエンスを提供する動的な広告に移行することです。

Progress Ventures が投資した 3 番目の企業である Disruptel は、画面のコンテンツを理解して対話できる AI 音声アシスタントを提供しています。たとえば、映画を見ているときに、アシスタントに似た映画や、画面に映っている俳優、俳優が着ているジャケットなどの特定のアイテムに関する情報を尋ねることができます。スポーツの試合を観戦している場合は、お気に入りの賭けプラットフォームを通じて賭けをするようにアシスタントに指示できます。

これは音声体験の拡大のほんの始まりに過ぎず、MacShane 氏は今後数年間でさらに多くの便利なアプリケーションが開発されると考えています。

「音声は今後もモダリティとして成長し続けると私たちは考えています。あらゆる年齢層、人口統計、地域で音声アシスタントの利用が増加しています」と同氏は語った。 「音声アシスタントの利用が増え続け、テクノロジーも進化し続けているので、音声テクノロジーの分野に携わるのはとてもエキサイティングな時期です。」


<<:  人工知能の発展の特徴とその3つのタイプの現れについての簡単な分析

>>:  純粋な MLP は下流のタスクには適していませんか? Meta AIらは、トランスフォーマーを上回るスパースMLPを提案した。

ブログ    

推薦する

推薦システムに関する6つの衝撃的な「秘密」

1990年代にレコメンドシステムが誕生して以来、2024年時点で32年の開発の歴史があります。過去...

メタバース内の物に触れるために、ザッカーバーグは6ドルの電子スキンを新たに作った。

[[433039]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

YouTube 動画推奨アルゴリズムを破る方法

[[176814]]映画、ドラマ、テレビ番組、オンライン ビデオなどの配信チャネルのコンテンツ ワー...

博士号を取得したいですか?機械学習の博士課程5年生と強化学習の博士課程の学生が対決した

博士号取得のために勉強するべきか、しないべきか、それが問題だ。 [[354586]]博士号を取得すべ...

超大型モデルの登場でAIはゲームオーバーになるのか?ゲイリー・マーカス:道は狭くなっている

最近、人工知能技術は大規模モデルにおいて飛躍的な進歩を遂げています。昨日、Google が提案した ...

コードを超高速で変更! GPT-3に編集機能とテキスト挿入機能が追加され、AIがあなたに代わって詩を書くことができる

いつもトラブルを起こしているAI分野の花形研究機関OpenAIが最近また別のことをしました。GPT-...

人工知能のルーツを解読する

[[384631]] ◇コンピューティングパワーアルゴリズムの重要な基盤として、人工知能チップと人...

...

モデルの過剰適合を防ぐにはどうすればよいですか?この記事では6つの重要な方法を紹介します

バフェット氏は「正確に間違っているよりも、おおよそ正しい方が良い」と述べています。機械学習では、過剰...

自動運転の簡単な分析 - 衝突防止警報システム

朝起きると、自分が遅く起きたことに気づきます。時間通りに会社に着いて出勤記録を残さないようにし、勤怠...

2021 年に検討すべき 15 のデータ サイエンス ツール

企業データの量と複雑さは増大しており、ビジネス上の意思決定や戦略計画においてデータが果たす中心的な役...

人工知能チュートリアル (V): Anaconda とさらなる確率理論

このシリーズの前回の記事では、まず TensorFlow の使い方を紹介しました。これは、人工知能お...

コンピュータビジョンが日常生活をどう改善するか

機械学習の力を活用して日常のさまざまなタスクを処理するテクノロジーである人工知能は、すでに私たちの仕...

...

自動運転分野における機械学習アルゴリズムの応用に関する包括的なレビュー

機械学習は、車内外のセンサーからのデータを融合して、運転者の状態を評価し、運転シナリオを分類するため...