ザッカーバーグの最新VRプロトタイプが登場。仮想と現実を混同させるようなものだ

ザッカーバーグの最新VRプロトタイプが登場。仮想と現実を混同させるようなものだ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

目の前の仮想シーンが現実であるかのように脳を騙すことができる VR グラスとはどのようなものでしょうか?

ザッカーバーグ氏は最近のインタビューで、仮想現実と現実を混同するプロトタイプを提示した。

そして、このプロトタイプの背後にあるすべての技術的なプロトタイプハードウェアも公開されました。

ズームを解決するハーフドムシリーズ:

網膜レベルのピクセルを備えたプロトタイプのヘッドセット:バタースコッチ:

また、HDU がユーザー エクスペリエンスにもたらす違いを検証するプロトタイプである Starburst もあります

上記の 3 つのツールを統合することで、仮想現実の最終テストに合格できると言われています。

視覚的なチューリングテストは、あなたが見ている仮想現実が「現実」であるとあなたの目に確信させます。

どのような VR メガネが人々に仮想と現実を混同させるのでしょうか?

脳を騙せるザッカーバーグのVRメガネはこんな感じです。

見た目は他の VR グラスと変わりませんが、実はたくさんの秘密が隠されています。このプロトタイプは、VR が現実のシーンに限りなく近づくことを妨げる 4 つの大きな障壁を解決します。

まず、VR 仮想状況における人間の目のズームの問題があります。

一般的に言えば、人間の目は物体の距離に応じて調整します。物体が近くにある場合、目は自然に焦点を合わせます。物体が遠ざかると、焦点は自然に離れます。このプロセスでは、適切な焦点を形成するために目を再調整する必要があります。

このプロセスは、視覚輻輳調節と呼ばれます。

しかし、人間の目のこの自動調整能力は、VR の仮想シーンに遭遇すると崩壊する可能性があります。

仮想現実の原理は、簡単に言えば、左右の目にわずかにずれた画像を表示して 3D 効果を生み出すことです。偏差が大きいほど、見える物体は近くなりますが、実際には目の焦点はより遠い距離にあります。

この目の「欺瞞」によって引き起こされる矛盾は、視覚の輻輳と適応調節の長期的な障害につながります。

VR メガネをかけると、めまいや疲労感を感じますが、これは視覚の輻輳と適応調節の障害によって引き起こされます。

2つ目は歪みの問題です。

いわゆる歪みは、単に画像の歪みとして理解されます。たとえば、通常の画像は水平方向と垂直方向のグリッドです。

歪みの後、2 つの相対的な形式が現れます。

樽型歪みは次のようになります。

糸巻き型歪みは次のようになります。

歪みが発生する理由は、VR グラスの表示システムの原理に関係しています。一般的に言えば、VRグラスの表示システムは「ディスプレイ画面-曲面レンズ-人間の目」の組み合わせと思われます。ディスプレイ画面上の画像はレンズを通過して、目で見るものになります。

しかし、画像がレンズを通過すると、光の屈折により糸巻き型歪みが発生します。この問題を解決するには、通常の画像の樽型の歪んだ画像をディスプレイ画面に投影する必要があり、これはいわゆる歪み防止処理です。

ここで難しいのは、歪み防止の度合いをどのように調整するかということです。

繰り返しますが、これは網膜解像度の問題です。

仮想現実で脳を騙したい場合、まず最初に必要なのは、目で見る画像をリアルかつ十分に鮮明にすることです。

具体的には、目に表示される画像のピクセルと目の画像のピクセルは近いか、まったく同じです。問題は、本物と区別がつかないほどの網膜解像度に達するには、どの程度の基準に達する必要があるかということです。

現在の業界の主流の見解では、60 PPD(視野角1度あたりのピクセル数)が基本基準となっていますが、これは厳密なシナリオにおける閾値です。動的な画像の場合、30 PPD程度の画像では、人間がピクセル粒子を見ることは不可能になり、リアルな効果が得られます。

最後に、HDR (ハイダイナミックレンジ) があります。これは、人間の目が実際に体験できる明るさの範囲であり、仮想現実で実際のシーンをシミュレートするために不可欠です。

4 つの大きなハードルがここにあります。簡単に言えば、解決策は、技術的手段を使用して、人間の目を標的にして欺くことです。

ザッカーバーグ氏と彼を支える Meta チームはどのようなトリックを使ったのでしょうか?

背後にある技術サポートは何ですか?

上記の 4 つの閾値をターゲットとする 4 つのコア テクノロジーはすべて、偽物を本物らしく見せるという 1 つの目的を達成するためにあります。

ズームの問題に対処するため、ザッカーバーグ氏のチームは以前開発したハーフドームのプロトタイプを取り出しました。このハーフドーム技術プロトタイプの第3世代が現在発売されています。

技術的な観点から見ると、Half Dome は偏光依存レンズを使用しており、偏光状態に応じて焦点距離が変わります。スイッチングプレートに印加される電圧を変更することで、異なる焦点距離を柔軟に切り替えることができます。

一連の偏光依存レンズと切り替え可能な半波長板を積み重ねることで、現実世界のスムーズなズームを実現します。

シミュレーションのパフォーマンスは次のとおりです。

歪みの問題を解決するために、Meta チームは、3DTV を使用して VR ヘッドセットをシミュレートし、ソフトウェア内でレンズをシミュレートして歪み補正アルゴリズムを迅速に反復し、適切な歪み防止画像を検証する「歪みシミュレーター」を特別に開発しました。

視覚解像度の問題に対処するため、ザッカーバーグ氏は、網膜解像度20/20視力を可能にする60PPDの解像度を持つ新しいヘッドセットのプロトタイプ「Butterscotch」を実演した。

このデータは、VR デバイスの網膜ピクセルの業界標準に達しています。

このヘッドセットのプロトタイプでは、非常に高いピクセル数を持つディスプレイを使用しながら、視野を向上および縮小することで、最終的にはピクセルを小さな領域に集中させることができるようになると報告されています。

この視野角の縮小は、最終的には、Meta の現在の量産製品である Quest 2 の約 45 度の半分程度になります。

もちろん、効果も明らかです。Butterscotch、Rift 1、Quest 2のグラフィックは以下のとおりです。

誰がより明確であるかは明らかです。

最後に、MetaチームがHDUがVR体験に与える影響を検証するために開発したプロトタイプであるStarburstがあります。このプロトタイプの明るさは20,000nits(単位面積あたりに放射できる明るさ)を実現できます。

もちろん、このプロトタイプの目的は明るさを競うことではなく、爆発、花火、ガラスの反射など、現実世界のさまざまな光源をこのような高輝度の範囲内でシミュレートすることです。

最後の質問は、おそらくあなたも気付いたと思いますが、問題を解決するために開発された非常に多くのプロトタイプとデバイスが、最終的に小さなウェアラブル プロトタイプ Holocake 2 にどのように統合されるのでしょうか?

現在、VR ヘッドセットのサイズに影響を与える主な要素は、光路長とレンズ幅の 2 つです。

光路の長さを短くするには、光路を折り曲げます

具体的には、Holocake 2 は折り畳まれた光学素子を使用して偏光を通じて光を前後に反射し、光の経路を折り畳んでレンズとディスプレイ間の距離を短くします。

レンズ幅はホログラフィックレンズに任せます。

いわゆるホログラフィックレンズは、機能的にはレンズと同じ効果が得られるホログラフィックフィルムであり、その最大の特徴は十分に「薄い」ことである。

これにより、目からディスプレイまでの距離を大幅に短縮することができ、小型化の目的を達成することができます。

ただし、このプロトタイプが商品化されるまでにはまだまだ時間がかかるということに留意する必要があります。

この距離はどれくらいですか?

ザッカーバーグ氏は何も言わなかったが、少なくとも今年はそれは起こらないだろう。

公式声明によると、現在Holocake 2で実証されているプロトタイプ技術はまだ成熟していない。Metaが今年発売するハイエンドヘッドセットCambriaは、折り畳み式光学システムを採用する可能性がある。

しかし、多くの技術の統合を完全に実現するには、まだ長い道のりが残っています。

ビデオリンク:

https://www.youtube.com/watch?v=IMpWH6vDZ8E&t=5s

<<:  リチャード・サットン:経験はAIの究極のデータであり、4つの段階が真のAIの開発につながる

>>:  AI は独自のコードを記述して、インテリジェント エージェントの進化を可能にします。 OpenAIの大規模モデルには「人間の思考」の風味がある

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Jenkins 独自のユーザー データベース暗号化アルゴリズムの簡単な分析

Jenkins のアクセス制御は、セキュリティ ドメイン (認証) と承認戦略に分かれています。その...

MetaMath: 逆思考で大規模モデルをトレーニングする新しい数学的推論言語モデル

複雑な数学的推論は、大規模言語モデルの推論能力を評価するための重要な指標です。現在、一般的に使用され...

GPT-3は創造性に欠けるにもかかわらず、わずか20分で合格できる大学論文を書いた。

GPT-3で書かれた論文は通過したのでしょうか?教育リソースウェブサイトEduRefがこれに関する...

...

...

初心者のためのディープラーニングの10,000語レビュー

論文: ディープラーニングの最近の進歩: 概要論文アドレス: https://arxiv.org/p...

Apple、新しいGPUアクセラレーションツールCreate MLをリリース

Appleは本日、カリフォルニア州サンノゼで2018年ワールドワイド開発者会議を開催し、4つの主要な...

...

...

アマゾンは40億ドルを投資し、グーグルや他の企業もさらに20億ドルを投資する予定で、アントロピックの評価額は急上昇中

テクノロジーニュースサイト「The Information」によると、人工知能の新興企業Anthro...

AIと建物の運用: 人、データ、信頼の基盤の構築

最近では、人工知能とそのサブセットである機械学習が注目のキーワードになっています。ディープフェイク、...

AI 対応スマート ビルディングの利点は何ですか?

世界が人工知能(AI)を採用し続けるにつれて、AIを使用したスマートビルディングの人気が高まっていま...

AIを活用したスト​​レージ施設は、企業がデータを最大限に活用するのに役立ちます

AI を活用したスト​​レージにより、企業はデータを迅速かつインテリジェントに分析し、ほぼ瞬時に洞察...

Googleは、携帯電話で0.2秒で画像を生成できる超高速拡散モデルMobileDiffusionを開発、現在最速

Stable Diffusionなどの大規模なAIモデルを携帯電話などのモバイルデバイスで実行するこ...

AMD: Meta はクラウド チップを使用して新しい AI 戦略をサポートします

米国現地時間6月14日火曜日、半導体大手AMDは、市場リーダーのNvidiaに挑戦するため、第4四半...