[51CTO.com からのオリジナル記事] 2015 年 1 月、Microsoft は長年「革新性の欠如」を批判されてきた中、ついに Windows 10 をリリースし、それと同時に Hololens と呼ばれる仮想現実拡張ヘルメットもリリースしました。記者会見では、デモ参加者がホロレンズを装着し、空中の指で物体を操作しました。ライブデモは大画面に表示され、ヘルメットが生成した画像はライブ環境に完璧に統合されていました。まさにSFが現実になったかのようでした。これは、マイクロソフト ワールド カンファレンスで仮想現実製品のデモンストレーションが初めて公開されたときでした。それまで、Hololens について誰も知りませんでした。一夜にして、メディアは Hololens について集中的に報道しました。Microsoft が革新的かどうかを疑問視する人は誰もいませんでしたが、Hololens に関するあらゆることについて質問しました。 Hololensの突然の登場は、マイクロソフトの衰退を一掃しただけでなく、技術開発の雰囲気全体を盛り上げました。一夜にして仮想現実の春風が世界中に吹き荒れ、「仮想現実が現実に近づく」時代が到来したと誰もが信じた。 実際、Hololens がリリースされる前には、別の中国のスタートアップ企業も同じ技術を積極的に開発していました。この会社はuSensと呼ばれ、その製品はHololensが発売される2年前に開発されました。 Ma Gengyu 氏は、uSens の技術担当副社長です。Alex Kipman 氏のオタクっぽい逸話は聞いたことがあるかもしれませんが、Ma Gengyu 氏が誰なのかは気にしないかもしれません。しかし、彼が参加したプロジェクト、Samsung Gear VR については聞いたことがあるはずです。 uSens に入社する前は、Samsung Institute of Technology に勤務し、Samsung Gear VR の技術的実装に携わっていました。現在、Samsung の Gear VR は業界で最も高く評価されているエントリーレベルのモバイル VR です。 2015年から2016年はバーチャルリアリティ技術が大いに求められた2年間であり、バーチャルリアリティの発展の方向性にも違いが見られました。 Google の VR グラス ボックス Cardboard の登場により、これまで手の届かなかった場所でも消費者が VR を即座に利用できるようになりました。かつて中国で流行したさまざまないわゆる「マジックミラー」は、すべて段ボールの原理に基づいています。正確に言うと、このタイプの製品はVRを視聴できるもので、インタラクションはまったくありません。これらはすべてエントリーレベルの VR 製品と見なすことができ、Samsung の Gear VR も例外ではありませんが、Samsung は特別な最適化を行うために自費で多大な労力を費やしてきました。もうひとつは、HTC VIVEに代表されるハイエンドのヘッドマウントディスプレイ製品です。その中でもOculus RiftとPS VRは傑出しています。その最大の特徴は、仮想画像がよりリアルで体験が良く、ハンドルに頼ることでインタラクティブな体験が強化されることです。しかし、価格が高いため消費者は遠ざかり、一般の人が購入するのは困難です。 しかし、馬源宇氏の意見では、上記の 2 つの方法はどちらも、仮想現実インタラクションの究極の目標である自然への没入感を実現していない。仮想現実の核心は、人間とコンピューターのインタラクションを自然に没入させる方法にある。 Cardboard の視覚体験は貧弱で、HTC VIVE の背後にあるハードウェア、ケーブル、ハンドルのかさばりは、自然な没入感の基準を満たすことができません。ハンドルケーブルを外し、メガネをかければ、コマンドを覚える必要はなく、インタラクティブな操作も簡単です... 馬源宇氏の意見では、これがバーチャルリアリティヘルメットのあるべき姿です。 uSens は 2014 年に Kickstarter クラウドファンディング プラットフォームに参入し、2016 年に Impression Pi を発売して大成功を収めました。これは Hololens で示された効果のようなもので、ハンドルやケーブルがなくても、メガネをかけるだけで空中で制御できます。 しかし、バーチャルリアリティ市場は2016年に冷え込み始めました。グーグルやアリババなど多くのテクノロジー大手から投資を受けている世界的に有名な仮想現実の新興企業、マジックリープが詐欺容疑で告発された。これは当時、まだ未成熟だった仮想現実分野にとって耐え難い打撃となった。そして人工知能の声が出始めました… 2017 年の初めには仮想現実も軽視されており、Google の IO カンファレンスは過去 1 年間のテクノロジー界の方向性を反映したものとなっていました。 VRはもはや主役ではなく、単に触れられるだけの存在。人工知能が主役となった。これはuSensに新たな機会をもたらすようです。 人工知能の時代において、顔認識、音声認識、ジェスチャー制御は人間とコンピュータのインタラクションの重要な手段であり、馬源宇はまさにこれを仮想現実の分野で実現しようと努力してきた。しかし、理想的な没入感と自然なインタラクションを実現するには、依然として困難が残ります。 主な難点は2点あります。1つは認識アルゴリズムです。これは主にディープラーニングに基づくジェスチャー認識アルゴリズムを指し、計算量を減らしながら高精度の認識を確保する必要があり、この技術がブレークスルーを達成するのは容易ではありません。 2つ目は、ハードウェアの移植とアルゴリズムの最適化です。この分野全体で画期的な先導的ソリューションを持っている人はいません。 そして、まさにここにuSensのチャンスがあるのです。 馬庸宇氏は、uSensには現在40名近くのソフトウェアおよびハードウェアのエンジニアと研究者がおり、その全員が国内外のトップ大学の出身者で、その中には北京大学、清華大学、スタンフォード大学の博士号取得者20名以上も含まれていると紹介した。馬 恒宇氏は、人材がuSensの現在そして将来における中核的な競争力であることをよく理解しています。 人工知能の登場により、VR/AR 本来の光輪は消え去りましたが、今日の予測不可能な新興市場では、誰が優れた予言者なのかは誰にもわかりません。資本は市場動向の重要な原動力です。テクノロジー中心の企業の利点は、初期の市場の混乱によって簡単に絶望に陥らないことです。テクノロジーは、危険な状況でも常に新しい機会を見つけることを可能にします。また、uSens のようなスタートアップ企業が前進する上で、困難を切り抜けるのに役立つ剣でもあります。 今日のテクノロジー市場は、新時代の剣闘士競技場のようなものです。身分に関係なく、競技場にいる全員が剣を手に持ち、競技場の後半まで生き残りたいと熱望しています。おそらく、人工知能と仮想現実はまったく競合するものではなく、むしろ互いに助け合い、依存し合うべきものなのでしょう。 馬庸宇博士は、***との独占インタビューで、記者団に対し、WOTI2017グローバルイノベーションテクノロジーサミットのゲストスピーカーとして、***フォーラムのメイン会場で「ヒューマンコンピューターインタラクションテクノロジーの将来の発展」をテーマに講演すると語った。博士はまた、講演内容の一部を明らかにし、「ヒューマンコンピューターインタラクションテクノロジーの発展は、2つの要素によって決定されます。一方では、ユーザーはより自然なインタラクション方法を望んでいます。他方では、技術の進歩により、インタラクションはより自然で便利になっています。VR、自動運転、ドローンなどの新興分野では、従来のインタラクション方法ではもはやユーザーのニーズを満たすことができません。ディープラーニング、コンピュータービジョンなどの分野でのブレークスルーにより、いくつかの新しいインタラクション方法が可能になりました。将来のヒューマンコンピューターインタラクション方法には、自然なジェスチャー理解と環境認識という2つのコア機能が含まれると考えています。この講演では、この2つの分野の最先端技術の紹介、研究結果のデモンストレーション、および将来の発展方向の予測が含まれます。」と述べた。 2017年7月21日から22日まで、51CTO主催のWOTIグローバルイノベーションテクノロジーサミットが北京フラマルネッサンスホテルで開催されます。サミットでは、機械学習、人間とコンピュータの相互作用、インテリジェンス + アプリケーションという 3 つの主要テーマに焦点を当てます。数十名の専門家ゲストが、多くの興味深い技術コンテンツを共有します。その時は、馬庚宇先生とより深く詳しい交流ができますので、ぜひご参加ください。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
>>: ディープラーニングのトレーニング中に GPU の温度が高すぎますか?すぐにクールダウンするには、以下の数行のコマンドを入力してください
海外メディアの報道によると、2月2日の正式発売前に、AppleのVision Proはすでに20万台...
私の国が2019年に5Gを正式に開始してから2年以上が経ちました。 2021年に入り、わが国の5G開...
誰もがこのような経験をしたことがあると思います。道路を運転しているとき、携帯電話は位置情報と速度を送...
経営幹部は長い間、より高度な意思決定にデータ分析を使用することに抵抗し、AI 支援による意思決定より...
人工知能(AI)は数十年前から存在しています。しかし、最近では「ビッグデータ」の登場により注目が高ま...
2023年杭州雲奇大会において、アリババクラウド最高技術責任者の周景仁氏は、数千億のパラメータを持つ...
ChatGPTは今年9月末に音声チャットと画像認識機能を追加しました。テキスト駆動型と比較して、C...
[51CTO.com からのオリジナル記事] 現在、機械学習テクノロジーをめぐっては多くの誇大宣伝が...
近年、ロボット産業は急速に発展しており、工業、農業、サービスなど多くの分野でロボットが見られるように...
C# アルゴリズムは、バイナリ ツリーの定義、既知のバイナリ ツリーの構築方法、および C# でバイ...
金融サービス業界は、特定の金融プロセスに不可欠なレガシー機器やシステムを使用しているため、他の業界に...
[[339715]]テキスト分割、品詞タグ付け、固有表現認識は、自然言語処理の分野では非常に基本的な...
マイクロソフト(アジア)インターネットエンジニアリングアカデミーは、新世代の音声インタラクション技術...
Google は最近、エンドツーエンドのニューラル オーディオ コーデックである SoundStre...