ザッカーバーグ氏が深夜に登場し、世界初のMRヘッドセットがVision Proに勝利! ChatGPTのメタバージョンが「メタバース」に移動し、インターネットセレブのアーティファクトグラスが高エネルギーで登場

ザッカーバーグ氏が深夜に登場し、世界初のMRヘッドセットがVision Proに勝利! ChatGPTのメタバージョンが「メタバース」に移動し、インターネットセレブのアーティファクトグラスが高エネルギーで登場

さあ、ザッカーバーグがMeta Quest 3とともに帰ってくる!

これまでの比較的静かな Meta Connect 開発者会議と比べると、昨夜遅くに行われたこの会議は非常に衝撃的でした。

最初に登場したのは、今年6月に発表されたQuest 3でした。 3ヶ月待ちに待った、ついに詳細が発表されました!

第2世代メガネの強力な機能にも、デモンストレーション中に観客から驚きの声が上がりました。

昨年、高額なMeta Quest Proの売上は惨憺たるものでした。そして6月、AppleはVision ProでVR業界の新たなベンチマークを打ち立てました。

現在、Meta は絶望的な状況に追い込まれている。年間 300 万ドルが無駄にならず、シリコンバレーの仮想現実の世界にまだ居場所があることを証明できる何かを考え出さなければならないのだ。

スピーチの最後に、ザッカーバーグ氏はこう締めくくった。「MR+AI+スマートグラス、この組み合わせこそが未来だ。」

彼の意見では、スマートグラスは最終目的であり、AIとヘッドマウントディスプレイを組み合わせることで、ハードウェアの問題が最終的に解決されたという。

クエスト3: 初のMRヘッドセットが発表

世界初の複合現実ヘッドセット「Meta Quest 3」がついに発売!

Quest 3は10月10日に正式に発売され、現在予約注文が開始されています。

125GB バージョンの価格は 499.99 ドルから、512GB バージョンの価格は 649.99 ドルから始まります。

最も安いものはたったの3,600元で、20,000元以上するVision Proをはるかに上回っています。

言うまでもなく、Quest 3 には外部バッテリー パックのようなものは必要ありません。

VR がもたらす没入感は、私たちを一瞬にして物理法則に反するファンタジーの世界へと連れて行ってくれます。

MR が私たちにもたらすのは、物理的な世界とのつながりです。

Quest 3では、VRとMRを自由に切り替えることができます。

また、Quest 3 の側面をダブルクリックすると、VR 体験と混合 MR 環境間をシームレスに移行でき、完全に没入型にするか、周囲の物理環境に仮想要素を重ねるかを選択できます。

「ウォーキング・デッド」の比較動画でもわかるように、Quest 2に比べて視覚解像度が30%高く、音域が40%高くなっています。また、Quest 2よりも薄く、重量配分もよりバランスが取れているため、最大限の快適性を備えています。

コーヒーテーブルで仮想ピアノを演奏できます。

大型のレゴを目の前で遊べます。

友達と一緒にゲームをすることができます。

リビングルームのドアを開けて別の世界に入ることもできます。

Quest 2 と比較すると、Quest 3 は高忠実度のフルカラー パススルー ピクセルが 10 倍以上あり、物理的な環境を常に視界内に収めることができます。

自宅の他の場所にいる友達と一緒にNBAを観戦できます。

リビングルームに、任意の VR オブジェクトを配置できます。

たとえば、ザッカーバーグ氏のリビングルームの写真壁には、彼がサーフィンをしているGIF画像が飾られている。

リビングルームのこの角を通り過ぎるたびに、屋外の鮮やかな景色が見えます。


プロセッサ: クアルコムの最高性能

Quest 3 は、Meta と Snapdragon が共同で開発した新しい Snapdragon XR2 Gen 2 プラットフォームを搭載した世界初のデバイスです。

グラフィック処理能力はQuest 2の2倍です。

なお、クアルコムがVRヘッドセットチップに特徴検出機能と6DoFトラッキング機能を組み込んだのは今回が初めてとなる。

これにより、Quest 3 などのヘッドセットは、最も負荷の高いタスクの 1 つを専用チップにオフロードできるようになり、ユーザーが 3D 環境で常に方向を維持できるだけでなく、電力消費と遅延が半分以上削減されます。

遅延について言えば、Qualcomm によれば、ヘッドセットは平均遅延がわずか 12 ミリ秒でフルカラーのパススルー ビデオを配信できるようになったとのことです。これは、Apple の Vision Pro に搭載されているカスタム R1 チップと同等の速度です。

その結果、Quest 3 の読み込み時間は非常に速くなり、没入感のあるゲームが信じられないほど高解像度の詳細で表示されます。

『アサシン クリード ネクサス VR』を紹介した際、ザッカーバーグ氏は興奮を隠し切れず、「ついにここまで来ました。皆さんがこれを待ち望んでいたのは分かっています。本当に待った甲斐がありました!」と語った。

より薄いレンズ、より高い解像度

Quest 3では、Metaは最先端のディスプレイと光学系を採用しました。

Quest 2 と比較すると、Quest 3 の 4K+ 無限ディスプレイは解像度が約 30% 向上しています。

Quest 3 は、1 度あたり 25 ピクセル、1 インチあたり 1,218 ピクセルで、Quest シリーズ全体の中で最高の解像度を誇ります。

これにより、Quest 3 の視覚効果は非常に素晴らしくなり、装着すると、手を伸ばして周囲の世界に触れたくなるでしょう。

さらに、新世代のパンケーキ テクノロジーのサポートにより、Quest 3 は光学プロファイルが Quest 2 よりも 40% 薄くなっただけでなく、視覚的な没入感にも影響を与えません。

快適性の面でも、Quest 3 は Quest 2 よりも向上しています。

より薄いフォームファクタ、カスタマイズ可能なフィット感、よりバランスの取れた重量配分により、ゲームをプレイするときに最も快適な体験を得ることができます。

100以上のXboxゲームをプレイできます

さらに、ザッカーバーグ氏は朗報も発表した。12月にXbox Cloud GamingがQuest 3で開始され、100以上のゲームがアンロックされるという。

これらには、Minecraft、Roblox、Rumble、XTADIU などが含まれ、月額運用コストは約 16.99 米ドルです。

オフィスをメタバースへ移行

Quest 3 を使用すると、仮想世界で作業できるようになります。

Word、Excelなどのオフィスソフトが使えます。

仕事に行くのももっと「面白く」なります。

オープンソースの Llama2 が Meta ファミリーのバケットを再構築

次は、最も重要な AI の瞬間です。

今年、Meta は AI に関する公式の記者会見は開催していませんが、独自のオープンソース モデルをひっそりとリリースしています。

まず、2月にLLaMA大型モデルがオープンソース化され、大きな波紋を呼びました。AIコミュニティモデルの火が完全に燃え上がり、「アルパカファミリー」が強化されました。

その後すぐに、セグメンテーションモデルSAM、音声モデルSeamlessM4T、マルチモーダルAIモデルImageBind、Code llama、Llama 2が次々とオープンソース化され、強固な基盤が築かれました。

ザッカーバーグ氏は「これはまだ始まりに過ぎない」と語った。

次のステップは、Meta ファミリーに AI を導入して、異なるエクスペリエンスを生み出すことです。

「絵文字ジェネレーター」Emu、5秒で絵文字を生成

数日前、OpenAI は DALL·E 3 をリリースしたばかりで、Vincent のアルゴリズムは再び新しい段階に昇格しました。一部のネットユーザーからは「MidJourney はもうダメだ」という声も上がっています。

本日、ザッカーバーグ氏は独自の人工知能画像生成モデル「Emu (Expressive Media Universe)」も発表した。

Emuの最大の特徴は、シンプルなテキストのみを使用して5秒で画像を生成できることです。

たとえば、「虹の森の妖精猫」などです。

「ハイカーとホッキョクグマ」

「水中宇宙飛行士」。

「花の中の貴婦人」。

「もし恐竜が猫だったら。」

他のグラフィック モデルと比較して、Emu の最も興味深い点は、ワンクリックで絵文字を生成できることです。

誰かとチャットしているときに、頭を悩ませたり、適切な絵文字パッケージを探したりする必要はありません。

たとえば、友達とバックパッキング旅行に行く約束をした場合、旅行に行く準備をしている鮮明な絵文字を送信する必要があります。

「バイクに乗っている幸せなハリネズミ」

気に入ったものを選んで送信してください。

もちろん、いくつかの簡単な単語を入力するだけで、あらゆる種類の絵文字を生成することができます。

まもなく、Emu とセグメンテーション モデル SAM を活用して、誰でも Instagram で画像を編集し、スタイルや背景を変更できるようになります。

スタイルを再変更すると、記述したスタイルに従って想像上の出力イメージを再構築できます。

下図のように、「水彩」と入力すると、写真がすぐに水彩画になります。

あるいは、ザッカーバーグの子供時代の写真を「ロックパンク風」に変えてみるのもいいだろう。

あるいは、ゴールデン レトリバーに「長毛」を与えると、次のようになります。

写真の背景を変更することもできます。

芝生に横たわっている自分の写真を見つけて、「子犬に囲まれて」と入力すると、かわいい子犬の群れがあなたの周りに集まります。

また、家族写真の場合は背景を自由に変更することもできます。

ChatGPTのメタバージョンがついに登場

「私たちは毎日、さまざまな AI を使用してさまざまなことを行っています。」

文生の写真に加えて、ザッカーバーグはMeta独自の人工知能チャットボットであるMeta AIを正式に発表しました。これはMeta版ChatGPTとも言えます。

Meta AI はオープンソース モデル Llama2 に基づいて構築されており、Microsoft Bing 検索にも接続されてリアルタイムの情報を取得します。

直接会話したり、独自に開発したEmuを使ってチャットしたり写真を撮ったりすることもできます。

あなたと友達がグループチャットでサンタクルーズに行くにはどの道を通ればよいか話し合っているところを想像してください。 Meta AI がチャットで素早く回答します。

ハイキングの後に、創造的な方法でその日を記念したい場合はどうすればよいでしょうか?

Meta AIがお手伝いします。

@MetaAI /imagine + 「ハイカーとセコイアの木のバッジを作成する」などの説明的なテキストプロンプトを入力すれば完了です。

ザッカーバーグ氏は、Meta AIがまもなくWhatsApp、Messenger、Instagramで利用可能になると発表しました。

最も重要なのは、新しくリリースされたハードウェア製品 Quest 3 と第 2 世代のメガネが Meta AI と統合されることです。

キャラクターユニバース

さらに、Meta AIではさまざまな役割を果たすこともできます。

つまり、それぞれに役割が定義された 28 種類の AI「スター アシスタント」を入手できます。

たとえば、今日何を食べるか、どのように料理するかなどについてチャットしたいとき。

ロサンゼルスで最も人気のある韓国人シェフ、ロイ・チョイが演じる経験豊富なシェフ、マックスが登場します。

あるいは、AIキャラクターの物語を書きたい場合は、クリエイティブライティングが得意なLilyさんを探してみてください。

旅行の際には、旅行の専門家ロレーナが人気のチェックインスポットに関するアドバイスを提供します。

アメリカのラッパー「スヌープ・ドッグ」がダンジョンマスターを演じ、観客の笑いを誘った。

ザッカーバーグ氏も現場に赴き、自らデモンストレーションを行った。

彼が本当に楽しい時間を過ごしているのがわかります!

AIスタジオでは誰でも独自のAIを開発できる

デモンストレーションの後、ザッカーバーグ氏は、コーディングできる人だけでなくできない人でも使用できる人工知能の作成をサポートする「AI Studio」というプラットフォームを立ち上げた。

この点で、企業はこのプラットフォームを使用して、顧客サービスのエクスペリエンスを向上させる AI を作成できます。

クリエイターにとっては、メタバース専用に設計された AI アプリケーションを構築できるようになります。

これとは別に、Meta は、誰でも独自の AI を作成できるサンドボックスも構築しており、来年リリースされる予定です。

AI ユニバースが成長し発展し続けるにつれて、Meta はこのサンドボックスを Metaverse に導入し、誰もがより高度な AI を作成する機会を得られることを期待しています。

Ray-Ban Meta: Meta AIを搭載した初のスマートグラス

このカンファレンスのもう一つのハイライトは、新しい Ray-Ban Meta スマート グラスです。

毎日着用すれば、携帯電話を取り出さずに友達に電話をかけることができます。

これを装着すれば一人称視点の動画も簡単に撮影できます。

いつでもどこでもファンに自分の生活を見せるというのは、ネットセレブにとって必須のことです!

さらに、メガネのボタンをダブルクリックするだけで、携帯電話のカメラとメガネをシームレスに切り替えることができます。

現在ライブ放送を視聴している人の数や最新のコメントも知ることができます。

このような強力な機能を備えた製品はいくらですか?

価格は 299 ドルから、10 月 17 日より発売されます。

今回、Meta はカメラ、マイク、スピーカーに大幅なアップグレードを加えました。

5メガピクセルのRay-Ban Storiesから12メガピクセルのRay-Ban Metaの超ワイドスクリーンカメラへのアップグレードは、非常に明らかな改善であると言えます。

結局のところ、5メガピクセルの背面カメラを搭載した最後のApple製携帯電話は、2010年に発売されたiPhone 4でした...

撮影に関しては、写真の解像度が第 1 世代の 2592 x 1984 ピクセルから 3024 x 4032 ピクセルに一気に向上しました。同時に、1080p 30フレームのビデオ録画も実現できます。

それだけでなく、Meta は Qualcomm の最新の Snapdragon AR1 Gen 1 チップもこのメガネに搭載しました。

AR1 Gen 1 はパフォーマンス面で最も強力というわけではありませんが、過熱して顔が火傷するリスクがなく、スタイリッシュで軽量なスマート グラスとして特に最適化されています。

具体的には、このチップはデュアル ISP 設計を採用しており、写真とビデオの同時撮影や、ソーシャル メディア アカウントへの直接ライブ ストリーミングも可能になります。

Wi-Fi 7 と Bluetooth 5.3 のサポートにより、ユーザーはオンラインで資料を簡単に共有できるようになります。

さらに、AR1 Gen 1 には、画像と音声の品質を向上させるだけでなく、ビジュアル検索やリアルタイム翻訳を可能にするオンデバイス AI 機能も搭載されています。

チップ自体に関しては、AR1 Gen 1 は理論的には最大 1280 x 1280 の解像度の組み込み画面をサポートできます。

残念ながら、Meta のスマート グラスには AR テクノロジーが組み込まれていません。録画されたビデオは 3D ではなく、AR 効果を追加することはできず、グラスにはディスプレイがありません。

しかし、デザイン面では、新しいレイバン メタは確かにより豊かです。ウェイファーラーとヘッドライナーの 2 つのフレームがあるだけでなく、自由に組み合わせることができる一連のカラーもあります。

その中で、透明な青、黄、黒のフレームは、テンプル上の回路の形状も表示できます。

その他のアップグレードには以下が含まれます:

最大 5 つのマイク (鼻梁に 1 つを含む) の配列により、通話や音声コマンドがより明瞭になるだけでなく、ビデオ クリップに空間オーディオを録音することもできます。

テンプルのオープンスピーカーも、第 1 世代よりも音量と低音が向上しています。

フレームはより薄く、より軽く、IPX4の防水性能を備え、充電後4時間連続使用可能です。付属のレザーケースで充電すると、さらに32時間の使用、または約8回の充電が可能です。

Meta AIを使えば何でもできる

しかし、Meta は AI のアップグレードについて大きな約束をしただけだと言えるでしょう。

つまり、新しくリリースされた Meta AI は来年までコンピューターで利用できなくなります。

その頃には、マルチモーダル機能を備えた Ray-Ban Meta は、完全なスマートグラスとしてみなされるようになるでしょう。

レンズで捉えた物体を認識し、目の前のテキストを読み取ったり、写真やビデオにテキストを追加したりすることもできます。

猫の写真を上手に撮って公開したいけれど、文章を書くのが苦手な場合はどうすればいいでしょうか?

Meta AIもカバーされています!

旅行中に目の前の景色が何なのかわからなくなったら、Meta AIに聞いてみましょう。

メガネに表示されるリアルタイム画像に基づいて、目の前に何があるのか​​を教えてくれます。

しかし、Ray-Ban Meta メガネが完全に AI 対応になった後、インテリジェントなアシスタントとして機能できるかどうかは明らかではありません。

同時に、それがどのようにして「スクリーンなし」のAR製品になるのかは謎のままです。

しかし、生成 AI が爆発的に普及したこの年、Meta は遅れをとることはありませんでした。

この記者会見の結果は非常にエキサイティングなものと言え、Apple の Vision Pro に劣るものではなく、後者はまだ正式には販売されていません。

これにより、シリコンバレーの大手企業間の VR 戦争がさらに盛り上がることになります。

<<: 

>>:  Ma Yiチームの新作!大規模なマルチモーダルモデルを微調整すると、「壊滅的な忘却」につながり、パフォーマンスが大幅に低下する可能性があります。

ブログ    
ブログ    

推薦する

2021 年を総合的に振り返ると、これら 10 社の AI スタートアップには「材料」がある!

今年の AI スタートアップ リストには、AI 音声アシスタントを構築するためのコード不要の Web...

これはボストンダイナミクスのロボットエンジニアの一日です

[[401177]]ボストン・ダイナミクスは誰もが知っていますが、同社の従業員の仕事や生活について知...

...

チャット記録をアップロードして自分自身を「複製」する。このスタートアップは「ブラックミラー」の第 1 話を現実のものにしました

10年前に放映されたアメリカのテレビシリーズ「ブラックミラー」の第1話のタイトルは「Be Right...

TensorFlow 2 入門ガイド。初心者必見です!

Tensorflow とは何ですか? TensorFlow は Google が立ち上げたディープ...

AIモデリングはもはや困難ではない:Jiuzhang Yunji DataCanvasが2つのオープンソース成果をリリース

[51CTO.comより] 「ソフトウェアインフラは大幅なアップグレードを受け、AIの実装はソフトウ...

1つのモデルが12種類のAI詐欺を打ち破り、あらゆる種類のGANとディープフェイクを打ち破り、オープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

データは今日のビジネスに競争上の優位性をもたらすことができるのでしょうか?

データは今やさまざまな産業に統合され、世界市場のハイライトとなっています。現在の経済成長はデータと切...

核酸の結果を数えるのは難しいですか?復旦大学の博士課程の学生の活動が人気に

核酸レポートの手動検証は時間がかかり、面倒で、エラーが発生しやすくなります。どうすればよいでしょうか...

...

エンタープライズレベルの AI を実装するにはどうすればよいでしょうか? Watson なら問題ありません!

[51CTO.com からのオリジナル記事] 人工知能は間違いなく、今日最も注目されている技術の ...

開発に重点を置き、革新を追求します。 LeaTech Global CTO Leadership Summit が始まりました!

[51CTO.comより]デジタル経済時代の到来が加速し、「第14次5カ年計画」が発表されるにつれ...

ボストン・ダイナミクスCEO:軍の命令は否定しないが、ロボット犬を粗雑に扱っていると思う

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ニューロモルフィックコンピューティングを理解する: 基本原理から実験的検証まで

人間の脳は、効率的な生体エネルギーによって計算能力を部分的にサポートし、ニューロンを基本的な発火単位...

...