この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 目の前の仮想シーンが現実であるかのように脳を騙すことができる VR グラスとはどのようなものでしょうか? ザッカーバーグ氏は最近のインタビューで、仮想現実と現実を混同するプロトタイプを提示した。 そして、このプロトタイプの背後にあるすべての技術的なプロトタイプハードウェアも公開されました。 ズームを解決するハーフドムシリーズ: 網膜レベルのピクセルを備えたプロトタイプのヘッドセット:バタースコッチ: また、HDU がユーザー エクスペリエンスにもたらす違いを検証するプロトタイプである Starburst もあります。 上記の 3 つのツールを統合することで、仮想現実の最終テストに合格できると言われています。 視覚的なチューリングテストは、あなたが見ている仮想現実が「現実」であるとあなたの目に確信させます。 どのような VR メガネが人々に仮想と現実を混同させるのでしょうか?脳を騙せるザッカーバーグのVRメガネはこんな感じです。 見た目は他の VR グラスと変わりませんが、実はたくさんの秘密が隠されています。このプロトタイプは、VR が現実のシーンに限りなく近づくことを妨げる 4 つの大きな障壁を解決します。 まず、VR 仮想状況における人間の目のズームの問題があります。 一般的に言えば、人間の目は物体の距離に応じて調整します。物体が近くにある場合、目は自然に焦点を合わせます。物体が遠ざかると、焦点は自然に離れます。このプロセスでは、適切な焦点を形成するために目を再調整する必要があります。 このプロセスは、視覚輻輳調節と呼ばれます。 しかし、人間の目のこの自動調整能力は、VR の仮想シーンに遭遇すると崩壊する可能性があります。 仮想現実の原理は、簡単に言えば、左右の目にわずかにずれた画像を表示して 3D 効果を生み出すことです。偏差が大きいほど、見える物体は近くなりますが、実際には目の焦点はより遠い距離にあります。 この目の「欺瞞」によって引き起こされる矛盾は、視覚の輻輳と適応調節の長期的な障害につながります。 VR メガネをかけると、めまいや疲労感を感じますが、これは視覚の輻輳と適応調節の障害によって引き起こされます。 2つ目は歪みの問題です。 いわゆる歪みは、単に画像の歪みとして理解されます。たとえば、通常の画像は水平方向と垂直方向のグリッドです。 歪みの後、2 つの相対的な形式が現れます。 樽型歪みは次のようになります。 糸巻き型歪みは次のようになります。 歪みが発生する理由は、VR グラスの表示システムの原理に関係しています。一般的に言えば、VRグラスの表示システムは「ディスプレイ画面-曲面レンズ-人間の目」の組み合わせと思われます。ディスプレイ画面上の画像はレンズを通過して、目で見るものになります。 しかし、画像がレンズを通過すると、光の屈折により糸巻き型歪みが発生します。この問題を解決するには、通常の画像の樽型の歪んだ画像をディスプレイ画面に投影する必要があり、これはいわゆる歪み防止処理です。 ここで難しいのは、歪み防止の度合いをどのように調整するかということです。 繰り返しますが、これは網膜解像度の問題です。 仮想現実で脳を騙したい場合、まず最初に必要なのは、目で見る画像をリアルかつ十分に鮮明にすることです。 具体的には、目に表示される画像のピクセルと目の画像のピクセルは近いか、まったく同じです。問題は、本物と区別がつかないほどの網膜解像度に達するには、どの程度の基準に達する必要があるかということです。 現在の業界の主流の見解では、60 PPD(視野角1度あたりのピクセル数)が基本基準となっていますが、これは厳密なシナリオにおける閾値です。動的な画像の場合、30 PPD程度の画像では、人間がピクセル粒子を見ることは不可能になり、リアルな効果が得られます。 最後に、HDR (ハイダイナミックレンジ) があります。これは、人間の目が実際に体験できる明るさの範囲であり、仮想現実で実際のシーンをシミュレートするために不可欠です。 4 つの大きなハードルがここにあります。簡単に言えば、解決策は、技術的手段を使用して、人間の目を標的にして欺くことです。 ザッカーバーグ氏と彼を支える Meta チームはどのようなトリックを使ったのでしょうか? 背後にある技術サポートは何ですか?上記の 4 つの閾値をターゲットとする 4 つのコア テクノロジーはすべて、偽物を本物らしく見せるという 1 つの目的を達成するためにあります。 ズームの問題に対処するため、ザッカーバーグ氏のチームは以前開発したハーフドームのプロトタイプを取り出しました。このハーフドーム技術プロトタイプの第3世代が現在発売されています。 技術的な観点から見ると、Half Dome は偏光依存レンズを使用しており、偏光状態に応じて焦点距離が変わります。スイッチングプレートに印加される電圧を変更することで、異なる焦点距離を柔軟に切り替えることができます。 一連の偏光依存レンズと切り替え可能な半波長板を積み重ねることで、現実世界のスムーズなズームを実現します。 シミュレーションのパフォーマンスは次のとおりです。 歪みの問題を解決するために、Meta チームは、3DTV を使用して VR ヘッドセットをシミュレートし、ソフトウェア内でレンズをシミュレートして歪み補正アルゴリズムを迅速に反復し、適切な歪み防止画像を検証する「歪みシミュレーター」を特別に開発しました。 視覚解像度の問題に対処するため、ザッカーバーグ氏は、網膜解像度20/20視力を可能にする60PPDの解像度を持つ新しいヘッドセットのプロトタイプ「Butterscotch」を実演した。 このデータは、VR デバイスの網膜ピクセルの業界標準に達しています。 このヘッドセットのプロトタイプでは、非常に高いピクセル数を持つディスプレイを使用しながら、視野を向上および縮小することで、最終的にはピクセルを小さな領域に集中させることができるようになると報告されています。 この視野角の縮小は、最終的には、Meta の現在の量産製品である Quest 2 の約 45 度の半分程度になります。 もちろん、効果も明らかです。Butterscotch、Rift 1、Quest 2のグラフィックは以下のとおりです。 誰がより明確であるかは明らかです。 最後に、MetaチームがHDUがVR体験に与える影響を検証するために開発したプロトタイプであるStarburstがあります。このプロトタイプの明るさは20,000nits(単位面積あたりに放射できる明るさ)を実現できます。 もちろん、このプロトタイプの目的は明るさを競うことではなく、爆発、花火、ガラスの反射など、現実世界のさまざまな光源をこのような高輝度の範囲内でシミュレートすることです。 最後の質問は、おそらくあなたも気付いたと思いますが、問題を解決するために開発された非常に多くのプロトタイプとデバイスが、最終的に小さなウェアラブル プロトタイプ Holocake 2 にどのように統合されるのでしょうか? 現在、VR ヘッドセットのサイズに影響を与える主な要素は、光路長とレンズ幅の 2 つです。 光路の長さを短くするには、光路を折り曲げます。 具体的には、Holocake 2 は折り畳まれた光学素子を使用して偏光を通じて光を前後に反射し、光の経路を折り畳んでレンズとディスプレイ間の距離を短くします。 レンズ幅はホログラフィックレンズに任せます。 いわゆるホログラフィックレンズは、機能的にはレンズと同じ効果が得られるホログラフィックフィルムであり、その最大の特徴は十分に「薄い」ことである。 これにより、目からディスプレイまでの距離を大幅に短縮することができ、小型化の目的を達成することができます。 ただし、このプロトタイプが商品化されるまでにはまだまだ時間がかかるということに留意する必要があります。 この距離はどれくらいですか? ザッカーバーグ氏は何も言わなかったが、少なくとも今年はそれは起こらないだろう。 公式声明によると、現在Holocake 2で実証されているプロトタイプ技術はまだ成熟していない。Metaが今年発売するハイエンドヘッドセットCambriaは、折り畳み式光学システムを採用する可能性がある。 しかし、多くの技術の統合を完全に実現するには、まだ長い道のりが残っています。 ビデオリンク: https://www.youtube.com/watch?v=IMpWH6vDZ8E&t=5s |
<<: リチャード・サットン:経験はAIの究極のデータであり、4つの段階が真のAIの開発につながる
>>: AI は独自のコードを記述して、インテリジェント エージェントの進化を可能にします。 OpenAIの大規模モデルには「人間の思考」の風味がある
[[321983]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
春節の時期にOpenAIのSoraが大人気でした。私も見てみましたが、正直GPT4が出た時ほどの衝撃...
端末側での大規模言語モデルの適用により、コンピューティング性能とエネルギー効率の需要が「引き出され」...
さまざまなアルゴリズムの実装やソフトウェア パッケージがオープン ソースで利用できる世界において、ア...
人工知能の急速な発展により、「ブラックテクノロジー」という言葉が人々の心に深く根付いている。目もくら...
2月7日、アメリカの外交政策ウェブサイトは「米中人工知能競争は東南アジアにとって何を意味するのか?...
大規模言語モデル (LLM) は今年非常に人気がありました。しかし、その驚異的な効果の背後には、巨大...
1956 年に大学の研究分野として取り入れられて以来、AI は楽観的な時期と悲観的な時期を同程度に...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
数日前、テンセントの製品に違反があり、合計4回に分けて報告されました。工業情報化部はテンセントに対し...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
現在、世界の健康は大きな課題に直面しています。2020年以降の新型コロナウイルスの蔓延は、世界的な公...
翻訳者 | 李睿レビュー | Chonglou人工知能は現在、定量的研究などの分野におけるソフトウェ...