[51CTO.comより引用] 2017年12月1日~2日、51CTO主催のWOTDグローバルソフトウェア開発技術サミットが深セン中州マリオットホテルで開催されます。このサミットのテーマはソフトウェア開発であり、数十名の専門家ゲストが多くの素晴らしい技術コンテンツを共有します。同時に、MobvoiのテクニカルディレクターであるGuo Xiao氏が、ディープラーニングとインテリジェントアプリケーション開発特別セッションで基調講演「車載インタラクションにおける人工知能の応用」をゲストと共有し、音声認識、意味理解、コンピュータービジョン、インテリジェント推奨アプリケーション、将来の無人インタラクティブ体験など、車両のインターネットにおける人工知能の応用と将来の車載インタラクションの設計アーキテクチャについて詳しく説明します。 51CTO は、皆様がこのカンファレンスにご参加いただき、テクノロジーがもたらす喜びを私たちと共有していただくことを心より願っております。
Mobvoiのテクニカルディレクター、Guo Xiao氏 私の国における人工知能開発の現状と動向インターネット企業は、LinkedIn のホームページの推奨、Uber の食品配達の到着予定時刻、価格設定システムなど、初期の頃から多くの AI 関連のアプリケーションを導入してきました。 Alpha Go Zeroは自己学習によって人間のプレイヤーのレベルを超えましたが、AIはまだ超知能の時代に到達していません。 自動運転の分野では、複雑なシナリオにおける物体の識別、判断、予測などに依然として問題が残っています。自然言語処理の面では、ディープラーニングによって音声認識率は大幅に向上しましたが、自然言語処理で遭遇する問題をすべて解決できるわけではありません。同時に、複数ラウンドの会話も困難です。現時点では、機械は6歳児の会話能力を完全には達成できません。 2017 年には、ディープラーニングの進歩により、コンピューター ビジョンと音声認識も大きく進歩し、自動運転認識システムや実用的な音声対話体験など、いくつかの新しい分野に AI を適用できるようになりました。 郭暁氏は、今回の人工知能の発展がインターネット上での情報の急速な流通の時代を背景に行われていることは幸運であり、中国は人工知能の分野で大きく遅れをとっていないと述べた。 一方、中国はビジネスモデルの最前線にあり、AIを中核とする多くの大企業、中堅企業、中小企業も生み出しています。
もう一つの側面は、ハードウェアとソフトウェアの組み合わせです。現在の AI ブームは、ディープラーニングとニューラル ネットワークによって代表されます。ニューラル ネットワークとバックプロパゲーション アルゴリズムに関する理論的研究は 1970 年代に始まりました。過去数年間で、コンピューティング能力、特に GPU の使用は大きく進歩し、ニューラル ネットワークで実用的な問題を解決できるようになりました。 GPU はニューラル ネットワークに必要な行列演算では CPU よりも効率的ですが、人工知能専用に設計されていないため、多くの企業が新しいハードウェア ソリューションを模索しています。国内企業もこの点で追随している。例えば、GoogleのTPU、AppleのA11 Bionic、HuaweiのKirin 970はいずれもAIハードウェアの新たな代表例だ。 CPUとGPUの時代には、中国には国際的な大手企業と競争できるチップ企業は存在しませんでした。人工知能チップの時代には、このようなことは起こらないことを願っています。 自動運転を真に実現するための核心要素自動運転は、AI の価値が最も際立つ分野の 1 つです。自動運転技術と AI を組み合わせることで、さらに多くのハイライトがもたらされます。これが、よくスマートカーと呼ばれるものです。郭暁氏は、自動運転車の開発を始めるのは簡単だと述べた。実践的なスキルに長けたエンジニアなら、自分で自動運転車を作ることもできる(https://comma.ai/)。例えば、百度のオープンソースアプリシステムの助けを借りれば、自動運転システムはわずか3日で構築できる。しかし、これらはあくまでもデモであり、実際に使える自動運転車を作るには、まだ多くのエンジニアリング作業が必要です。 自動運転車を真に実現するための中核となる要素は次のとおりです。
自動運転車は参入障壁が非常に高い産業です。現在、研究開発に携わるメーカーは、大きく分けて以下の4つのカテゴリーに分けられます。
一般的に言えば、自動運転技術の商業化と収益化は、まず制限のあるシナリオで見られることになるでしょう。公園や高速道路などの制限されたシナリオの環境はより標準化されており、自動運転の難しさが大幅に軽減されます。同時に、限定されたシナリオでの無人運転車の商用利用は、無人運転関連の法律制定や社会受容を促進し、真の無人運転車の時代に向けた準備にもなります。 車内インタラクションとAIアプリケーションの現状無人運転車について語るとき、車内でのやり取りという側面を必然的に考慮しなければなりません。郭暁氏は、車載インタラクションが過去数年間にスマートフォンほど急速に発展しなかった主な理由は、プリインストールされたシステムが車両の開発サイクルに従って完成され、車両モデルの開発には通常約5年かかるためだと述べた。さらに、自動車には高い安全性の要件があり、検証に長い時間が必要です。 車内インタラクションの現状 現在の自動車モデルのほとんどは、6、7年前に使用していた携帯電話に匹敵するものだと考えてください。たとえ対話型システムが搭載されていたとしても、ある程度は制限されるでしょう。さらに、アフターマーケットメーカーはさまざまな車種への適応に多くのエネルギーを注いでおり、車載インタラクティブイノベーションにはあまり注意を払っていません。 長い間、タッチ技術をインタラクションの手段として使用する車載コンピューターは、操作があまり便利ではなく、使用目的というよりは装飾目的のものとなっていました。 4G ネットワークの普及と音声技術の発展により、車載ソフトウェアの破壊的変革が急務となっています。ユーザーもスマートデバイスを欲しており、車を購入する際にはスマートかどうかを考慮するでしょう。 自動車のインテリジェンスは、車外の自動運転だけではなく、車内の体験を向上させることにもつながります。非常に長いバッテリー寿命、より優れたハードウェア、より大きな画面、より広いプライベート空間など、これらは自動車独自の利点であり、自動車をテクノロジープラットフォームとして最適にします。 最近、自動車とインテリジェンスについて話すとき、多くの人が自動運転車と複雑なアルゴリズムを思い浮かべます。実際には、車内での体験とインタラクションの向上も同様に重要です。 マウスとグラフィカル インターフェースにより、パーソナル コンピュータのユーザー層が専門家から一般大衆にまで広がり、マルチタッチによりスマートフォン時代全体が始まりました。車内では、音声によるやり取りはより安全で、より自然なやり取りとなります。 Guo Xiao 氏は、自然で使いやすい音声対話モードが導入され、多くのアプリケーション シナリオでユーザー エクスペリエンスが向上することを期待していると述べました。現在、国内外の多くの企業がスマートスピーカーやスマートアシスタントなど、さまざまな試みを行っています。現在のマルチラウンド会話、音声対話、表示方法はまだ完璧ではありませんが、車内での音声ユーザーの粘着性は、他のシナリオに比べてすでにはるかに高くなっています。今日の車内でのやり取りは、依然として主に運転手と助手席のドライバーの経験に基づいています。将来の自動運転車の時代では、乗客の経験がより多くのアプリケーションを生み出すでしょう。 車内インタラクション分野におけるAIの応用 車の使用シナリオには、ナビゲーション、通信、メディア、車両制御など多くの問題点がありますが、人工知能を使用するとインタラクティブなエクスペリエンスを強化できます。これまで何度も述べてきたように、音声は車内でのインタラクションの基盤です。人工知能は、言語を認識し、意味を理解した後、検索の並べ替え、車の位置、その日の天気、交通状況、所有者の好みを組み合わせて、同じ文字どおりの要求に対して異なる結果を生成するなど、他の多くの応用シナリオを持っています。さらに、人工知能はさらに最適化することができます。ユーザーのニーズを予測できるのであれば、ユーザーが積極的に検索を開始する必要があるのはなぜでしょうか?より高度な AI アプリケーションは、適切なタイミングで直接推奨事項を作成できます。たとえば、自動運転ツアーのシナリオでは、旅行ルートを計画し、景勝地で自動的にリマインダーを受け取ることもできます。 インタビューの最後に郭暁氏は、車載インタラクションのコア技術における最大の課題は、自然言語をより深く理解し、多段階の対話とインタラクションモードをさらに探求し、改善することであると述べた。さらに、現在の車内インタラクションのほとんどは依然として従来の自動車メーカーとの協力を必要としており、インターネットと従来の自動車メーカーの間には間違いなく大きな衝突が起こるでしょう。インターネットでは迅速な反復も必要であり、自動車では極めて厳しい安全性と開発サイクルが求められます。この 2 つをいかにうまく組み合わせるかが、現在、開発者の効率性にとっての課題となっています。開発効率の向上と開発者エコシステムの発展は、アプリケーション エクスペリエンスの好循環をもたらすことができます。また、より多くのサービス プロバイダーとコンテンツ プロバイダーがアクセスできるようになることで、より多くの人材が車載環境向けの高品質なアプリケーションを開発できるようになります。 Double Eleven 特別割引コード[B310BD20D337F914]を使用すると、200 元の即時割引が受けられ、私と一緒に WOTD グローバル ソフトウェア開発テクノロジー サミットに参加できます。詳細については、wot..comをご覧ください。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: 第16回(2017年)中国政府ウェブサイトパフォーマンス評価結果発表および経験交流会議が北京で成功裏に開催されました。
>>: コンピュータービジョンを例に、AIを仕事に導入する方法を説明します。
OpenAI ChatGPT Plus サブスクリプション支払いには強力な機能があり、高度な「データ...
背景と概要Taobao プラットフォームには、検索、推奨、広告など、多くのサブシナリオがあります。各...
恒生銀行とその子会社である恒生聚源は6月28日、金融インテリジェントアシスタントPhotonや新しく...
世界人工知能会議の最高賞であるSAIL賞(スーパーAIリーダー)は、「卓越性を追求し、未来をリードす...
2019 年新興テクノロジー ハイプ サイクルでは、今後 5 ~ 10 年でビジネス、社会、人々の生...
北京市人民政府弁公庁はこのほど、「北京市ロボット産業革新発展行動計画(2023~2025年)」を発表...
数日前、TikTokで、ある親がTikTokの特殊効果を使って子供の年齢と容姿を計測する動画を見まし...
まずは大学院入試から始めましょう。大学院入試の重要性は大学入試の重要性に匹敵します。数字で言うと、2...
[[264978]]ビッグデータダイジェスト制作出典: towardml編纂者:劉嘉偉、王元元、ウ...
Meta は、Meta AI と呼ばれる人工知能チャットボットをリリースしました。ザッカーバーグ氏は...
今日は、非常に有名な Python の簡潔で効率的かつ便利なコードを見てみましょう。そのスタイルを見...