視線追跡は無視できない、視覚制御車はもうすぐ登場する

視線追跡は無視できない、視覚制御車はもうすぐ登場する

正直に言ってみましょう。ジョブズが2007年に初めてiPhoneをリリースしたとき、革命的な新時代が到来したと本当に気づいた人はいたでしょうか。その翌年ジョブズがApp Storeを立ち上げたときはどうだったでしょうか。

iPhone と App Store が融合したことで、テクノロジー業界のほぼすべてが変わりました。ジョブズが自身のビジョンがビジネス界の本質を変えることになるとは、誰も予見できなかっただろう。私たちが実際に目にしているのは、無数のソフトウェア開発者が既存のテクノロジーの可能性の力をすぐに察知し、想像力と創造力を駆使して自由に行動している姿です。

アプリケーションの開発は、大まかに次の 3 つのフェーズに分けられます。

実験段階:この段階では、開発者は携帯電話のフラッシュを懐中電灯に変えたり、実用的な意味がほとんどない他のアプリケーションを起動したりします。これらのアプリ自体は特別なものではなく、開発者の学習プロセスを表しているだけです。

商業化:メッセージング アプリを開発し、WhatsApp と名付けて、Facebook に 190 億ドルで販売してみてはいかがでしょうか。あるいは、Angry Birds、Candy Crush Saga、Farmville などのゲームを開発してみてはいかがでしょうか。開発者がアプリから収益を得る方法をより深く理解するにつれて、アプリ内購入オプションを備えた「無料」のビジネスモデルが登場し始めました。

プラットフォーム:私たちが知っている今日の世界はすでにプラットフォーム上で動いており、Airbnb、Grubhub、Spotify、Uber など、多くの企業のビジネス全体がプラットフォーム上に根ざしています。

[[344625]]

ここで自問してみてください。自動運転革命の真っ只中、私たちは自動車における視線追跡やドライバー監視システム (DMS) の役割を無視していませんか? iPhone や App Store を無視したのと同じように、DMS も無視していませんか? なぜなら、数え切れないほどの基調講演で、レベル 4 の自動運転、TOPS (1 秒あたりの操作数)、人工知能、さらにはニューラル ネットワークがある中で、DMS の目的は何なのかが強調されているからです。

しかし、疑問が解消された後、視線追跡のような論理的な技術が、視線制御の車載インフォテインメント システムに実際に変換されていないのはなぜでしょうか。

没入型自動車体験

Nuance という名前は知らないかもしれませんが、同社の Dragon 音声認識ソフトウェアについては、おそらく聞いたことがあるでしょう。 Cerence は、2019 年 10 月に Nuance からスピンアウトしたスタートアップ企業であり、現在、非常に興味深いさまざまな自動車技術に取り組んでいます。

Cerence は、車に乗っているときに人々がより幸せで、より安全で、より充実感と楽しさを感じられるような没入型体験を提供します。音声、タッチ、ジェスチャー、感情、視線の革新を組み合わせることで、ドライバー、車、そして周囲のデジタル世界の間に、より深いつながりを生み出します。 Cerenceは現在、ほぼすべての主要自動車メーカーをカバーし、70以上の言語で世界中の2億8,000万台以上の車両にAIベースのサポートサービスを提供しています。

セレンスは、この技術が「視線検出や音声などの複数のモードと連携する」と主張しており、これはまさに、自然な発話、ジェスチャー認識、視線制御機能を統合した2021年型BMW i4車の設計実態と一致している。

Cerence は Nuance の一員として BMW と長期にわたるパートナーシップを維持しており、Seeing Machines も今年 1 月の CES Interaction EAS デモで BMW と協力しました。この観点から見ると、i4モデルに搭載されている音声認識や視線検出技術は、まさに彼らの手によるものである可能性が高い。

視線制御の Android Automotive OS?

現在、ほぼすべての企業が自動運転 AI の開発に注力していますが、人間の自動車運転体験をどのように向上させるかに注目し続けている企業はほとんどありません。 NVIDIAとIntel/Mobileyeの共同開発プロジェクトに加え、QualcommはGoogleとの協力を自動車分野にも拡大し、次世代の車載インフォテインメントシステムの構築を目指している。

Google の Android Automotive OS を搭載した最初の車である Polestar 2 が、今年初めに生産ラインから出荷されたばかりです。しかし、Google は、FCA、ゼネラルモーターズ、グループ PSA、ルノー・日産・三菱アライアンス、ボルボなど、他の自動車メーカー数社と Android Automotive OS の提携を発表している。契約を締結したティア1サプライヤーには、Aptiv、Harman(サムスンの子会社)、パナソニックなどがある。

8月に、QualcommはSeeing Machinesが提供する視線追跡技術の共有を含むVeoneerとのADAS提携を発表した。最近、Qualcomm と Seeing Machines は、インフォテインメント システム SDK の共同開発という形で、両社のコラボレーションに関する詳細も発表しました。

この情報とBMW/Cerenceのデモ結果を組み合わせると、QualcommとGoogleが次世代のAndroid Automotive OSを開発しており、Seeing Machinesが提供する技術を使用して視線制御機能を統合し、2023年に量産に入ると結論付けることができます。

Cerence は、同社の自動車メーカーの顧客には「Audi、BMW、Daimler、Ford、Geely、GM、SAIC、Toyota など」が含まれると発表しましたが、その多くは Android Automotive OS の採用をまだ正式に発表していません。したがって、今後数年間で、ほとんどの大手自動車メーカーが一部またはすべてのモデルに視線制御のユーザー インターフェースを導入する可能性が高いと考えられます。

App Store と同様に、視線追跡が自動車の使用にもたらすメリットはすぐには現れないかもしれません。インテルやNVIDIAは、自動運転技術のためのより高性能なプロセッサやAIソリューションの開発に注力する一方、セレンス、グーグル、クアルコム、Seeing Machinesも、車内体験を一変させ、スマートフォン操作による自動車運転への干渉を根本的に減らすことを目指し、独自の視点から技術開発を積極的に進めているようだ。

Waymo と Google の親会社 Alphabet が最も賢い企業のようです。 Waymo と Android Automotive OS があれば、将来の自動運転革命がどのようなものであっても、大きな恩恵を受けることができるでしょう。このように、この二本柱の戦略は、Apple、Amazon、さらにはMicrosoftなどの最も強力な競合他社を総合的に打ち負かすことができる可能性があります。

一方、自動車用プロセッサの分野では長らくインテルやNVIDIAに制約されてきたクアルコムも、独自の黄金時代を迎えるかもしれない。クアルコムは、ADAS分野でのVeoneerとの協力、インフォテインメントシステム分野でのGoogleとの協力を通じて、静かに財を成すことが人生で最も重要な経験であることを実際の行動で証明できそうだ。

<<:  人工知能は標的の照準を加速し、人間と機械の統合を支援して即時攻撃を可能にします。

>>:  AIIA2020人工知能開発者会議が成功裏に開催され、オープンソースを採用してAIの新たな勢いが生まれました。

推薦する

MLCommonsがAI安全ワーキンググループを発表

人工知能ベンチマーク組織 MLCommons は、人工知能安全性 (AIS) ワーキング グループの...

機械学習の4つの異なるカテゴリの概要

[[420892]]学習の実行方法に基づいて、アルゴリズムをさまざまなカテゴリに分類できます。教師あ...

科学者:大規模なAIモデルは小さなAIツールを自動的に生成できる

12月18日、Businessinsiderによると、大規模なAIモデルは現在、人間の介入なしに完全...

KServe、Kubernetes環境に基づく高度にスケーラブルな機械学習デプロイメントツール

ChatGPT のリリースにより、機械学習技術の活用を避けることがますます難しくなってきています。メ...

AIはIoTベースのDDoS攻撃を阻止できる

研究者らによると、人工知能はインターネットサービスプロバイダー(IPS)がDDoS攻撃に先手を打つの...

AI専門家の李牧氏の「5年間の仕事の反省」が人気に、ネットユーザー「また感動した」

[[401713]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

スマート街灯は明るく光るが、スマート街灯柱には隠された秘密があることが判明

[51CTO.comよりオリジナル記事] 近年、都市化の急速な発展に伴い、中国の都市の街灯の数はます...

...

GPT-4 の補完精度はわずか 6% です。北京大学などが、初の「マルチラウンド、マルチモーダル」PPTタスク完了ベンチマークPPTCを提案

大規模言語モデル(ChatGPT や GPT-4 など)に関する最近の評価作業は、主に基本的な自然言...

...

データが限られている場合にディープラーニングモデルを最適化する方法

[[198229]]転移学習転移学習とは、ある問題で訓練したモデルを、簡単な調整で新しい問題に適した...

ドローンが上海の歴史的建造物の保護を主導

[[418446]]上海のピースホテルはかつて「極東第一のビル」として知られていました。1929年に...

これらの10の機械学習手法をマスターすれば、あなたはサークルで最も人気のある人になるでしょう

科学研究でも産業界でも、機械学習はホットな話題であり、新しい機械学習手法が次々と登場しています。機械...

...

スケッチが本物の顔に変わる? AI: はい、草はいくらでも大丈夫です。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...