コンピューターやその他の機械は、生産性を高め、より多くのことを学び、お互いのつながりを保つことを可能にする素晴らしいツールです。しかし、それらを使用するには、何らかの方法でそれらと「通信」する必要があります。歴史的には、これはマウスとキーボード (またはタッチスクリーン) を使用した手動入力であり、コンピューターから返される内容を画面で読み取っていました。
過去 10 年ほどの間に、音声認識と音声認識という、機械と対話する新しい方法が登場しました。しかし、この「機械と会話する」というモデルは将来も続くのでしょうか? もしそうなら、どのように発展していくのでしょうか? 技術ステータス まず、現代のテクノロジーの現状を見てみましょう。人々は日常のほとんどのやり取りに依然としてキーボード、マウス、タッチスクリーンを使用していますが、音声ベースのやり取りに切り替える人が増えています。簡単なフレーズを使用して、一般的な検索エンジンで検索を実行できます。入力したい内容を声に出して話すと、携帯電話がそれをテキストに変換してくれます。顧客と直接コミュニケーションしたり対話したりできるデジタルサイネージを設置することもできます。 音声ベースのインタラクションは長年にわたって信じられないほど洗練されてきました。この技術の初期の頃は、基本的には運任せのゲームでした。ほとんどの場合、システムはあなたの話を正しく「聞き取れない」か、あなたが言おうとしていることを誤って解釈します。しかし、今日では、最も人気のあるデジタルアシスタントや音声認識プログラムは、人間の音声を人間と同じくらい正確に検出し、理解することができます。 これに伴い、人間は音声ベースの対話に徐々に慣れてきています。 2010 年には、デバイスに向かって「OK Google」や「Hey Alexa」などと言うのは馬鹿げていると思ったかもしれません。しかし、2020年には、それは当たり前のことになっています。実際、何らかの方法で定期的にマシンとやり取りしない人を見かけると、奇妙に感じます。 なぜ声が乗っ取られたのか 近年、音声認識がなぜこれほど目覚ましい成長と発展を遂げてきたのでしょうか? 考えられる説明はいくつかあります。まず第一に、音声は手で何かをするよりも便利です。運転中にハンドルから手を離さずに情報を入力したい場合は、単に「声に出して」考えて処理するだけで済みます。一日中タイピングして指が痛くなったら、音声ベースの入力に切り替えて手を休めることができます。リビングルームにいて、近くにデバイスがなくても、今見た番組の俳優の名前を知る必要がある場合は、質問を声に出して話すだけで、数秒で答えを得ることができます。 技術開発に関して言えば、音も簡単に実現できる分野です。これからわかるように、人間とコンピューターのインタラクションには、はるかに複雑で、完全に開発されるまでに数十年かかる可能性のある他のモードもありますが、実際には、音声検索はわずか数年ですでに習得されています。 消費者はメリットを認識し、テクノロジーは改善し続けています。したがって、音声ベースの機械との対話が新しい標準になったのは当然のことです。 スピーチに関する潜在的な問題 そうは言っても、長期的に見ても、音声ベースの機械対話にはいくつかの潜在的な問題があります。
音質を改善する方法 テクノロジー企業は、音声によるインタラクションを改善し、競合他社より抜きん出る方法を常に模索しています。最も重要な焦点領域は次のとおりです。
音声置換 では、音声は機械とやりとりする手段としてはもう終わりなのでしょうか? それはまだわかりませんが、完全に開発されるまでにはまだ何年もかかるかもしれませんが、いつか音声と手動入力の両方に取って代わる可能性のある候補がいくつかあります。
現在、音声ベースの制御と通信は、機械と情報を交換する方法において依然として主流となっています。この技術は非常に洗練されているため、ほとんどの人がその潜在能力を簡単に活用できます。プライバシーに関する懸念や予測機能の限界など、その使用にはいくつかの問題がありますが、さらなる開発によってこれらを軽減(または排除)できる可能性があります。 |
<<: 機械学習プロジェクトでオプティマイザーを選択する方法
>>: Raspberry Pi でボストン ロボット ドッグを DIY すれば、50 万ドル節約できます。オープンソースのチュートリアルで誰でも始められます。
テクノロジー業界は歴史的に平均給与が最も高い業界の一つであり、リストのトップにランクされることも少な...
5月26日、チューリング賞受賞者で米国工学アカデミー会員のジョン・ヘネシー氏が、2021年中国国際ビ...
スマートホームコントロールの開発の鍵は、設計コンセプトとオペレーターの考え方にあります。市場のターゲ...
[[208505]]強固な経済基盤がなければ、豊かな国と強い国民は実現できません。中国共産党第19回...
アドリアン・トゥルイユ翻訳者 | ブガッティ校正 | Chonglou制作:51CTO テクノロジー...
工業情報化部が発表したデータによると、2020年1月から12月まで、全国の産業用ロボットの生産台数は...
2019年には目を見張るようなAIイノベーションが数多く見られ、今後も金融業界におけるAIの影響は深...
人工知能産業が台頭から急速な発展へと進む過程において、AIトップ人材の主導的役割は特に重要です。国か...
企業は、画像認識、音声認識、チャットボット、自然言語生成、感情分析がビジネスの運営方法にどのような変...
1. 生産性の向上多くの組織がリモートワークに移行するにつれて、効率性を維持することが重要になります...
産業用 IoT は、企業の神経系と考えることができます。つまり、生産工場のあらゆる場所から貴重な情報...
あなたの周りの物体が知性に満ちていると想像してください。包帯、バナナの皮、ボトルなどはすべて知性を持...