Meta CTO との独占インタビュー: AI はすでに XR のキラー アプリケーションであり、LLM オープンソース コミュニティの競争には敗者なし

Meta CTO との独占インタビュー: AI はすでに XR のキラー アプリケーションであり、LLM オープンソース コミュニティの競争には敗者なし

最近、Meta の CTO である Andrew Bosworths 氏が記者に独占インタビューに応じました。

彼は、Meta が AI と XR 産業をどのように統合しているか、オープンソース AI コミュニティにおける Meta の競争と発展、AI 人材の流れなどについて多くを語りました。

XR と AI が出会うと、どのような火花が散るのでしょうか?

質問: 複合現実ハードウェアと生成 AI を組み合わせると、1+1 以上の結果が得られるように思えます。そうではありませんか?

マイケル・アブラッシュ氏は7年前のConnectでのスピーチで、大規模ARの将来に対するビジョンを語り、人工知能が中核的な要素であることを強調しました。

しかし、より優れた AI システムを実現するには、大規模で限定的なデータ セットが必要であるという考えは、誤解を招く可能性があります。しかし、この考え方は徐々に変化しつつあります。

アイウェア製品が市場に長期にわたって存在し、人工知能を応用することで、アイウェアの実用性が大幅に向上します。

大規模言語モデルが登場する前は、機械学習は常に価値を生み出すアプリケーションを中心に展開されていました。

たとえば、Facebook はニュースフィードランキングメカニズムが導入される前から存在していましたが、そのランキングメカニズムは時間の経過とともに改善されてきました。

同様に、すべての AI システムは通常、非 AI 要素に基づいて開始され、データセットを取得し、それが AI システムの継続的な進歩をサポートします。

しかし、大規模言語モデルは、すでに非常に汎用性が高いという点で、過去とは異なります。これは、正確または完璧なトレーニング データが不要になり、既存の AI テクノロジーが将来の Meta デバイスの基礎となることを意味します。

Meta が最近 Ray Ban と共同で発売したメガネがその一例です。カメラビデオ、ライブストリーミング、プレミアム音楽の再生、電話通話などを備えたこのメガネは優れた製品です。

最初にリリースしたとき、ユーザーがこれらの機能を使用するために「スマート アシスタント」が必要だと感じていましたが、6 か月後には、スマート アシスタント自体がメガネの最も人気のある機能になりました。

同氏は、ハードウェア製品の主要機能が短期間で変化することは非常にまれだが、メガネの場合はそれが起こり、技術開発の急速かつ予測不可能な性質を示していると強調した。

Q: 人工知能は Quest でどのような役割を果たすと思いますか?

Quest で実際に有効にしたかった機能の中には、優れたトレーニング データセットがなかったものもありました。

テキストについては、インターネット全体がリソースとして利用できます。写真、Facebook、Instagram の巨大なギャラリー。しかし、3D オブジェクト、特に 4 次元空間でアニメーション化された 3D オブジェクトについては、大規模で信頼できるデータベースが存在しません。

まさにこれが私たちが望んでいることです。私たちは、より多くの 3D コンテンツをエクスポートできるようにするなど、この MOD に関するあらゆる点を改善するために懸命に取り組んでいます。

つまり、複合現実と仮想現実は、すべてを別の次元空間に実装しようとするため、実現が非常に困難です。

しかし一方で、XR と VR には常時オンのセンサーが搭載されているという大きな利点があることは明らかです。これらのセンサーは常に空間をスキャンして感知しています。

Meta は現在も研究を続けており、3D および 4D 空間に非常に有望なものを見出しています。

Q: 実現したいキラーユースケースは何ですか?

A: 短期的には、同社はクリエイターに焦点を当て、アバターのデザイン、世界やゲームの作成などの機能を提供しています。

Meta の長期的な目標は、ユーザーとマシンのインタラクションの効率を向上させ、ユーザーがコンテンツ レベルとシステム レベルの両方でインタラクションできるようにすることです。

たとえば、ユーザーは簡単なコマンドを使用してゲームを起動し、友達をゲームに直接招待することができます。

これは非常に複雑なプロセスになる可能性があり、システム上でゲームを起動し、友人を招待し、同じアプリ内の同じ場所に集める必要があります。

オープンソースAI、Meta、そしてコミュニティが共に繁栄する

Q: Llama をオープンソース化する Meta の戦略は何ですか?

同社は 2006 年以来、オープンソースのリーダーとして活躍しています。同社は、PHP、Memcached、MySQL などの複数のオープンソース プロジェクトを活用し、より少ない従業員で効率的に業務を運営できるようになりました。彼らはまた、主要な機械学習エンジニアリング システムである PyTorch プロジェクトを推進し、それをオープンソース化しました。

オープンソース プロジェクトの大きな利点の 1 つは、その周りにコミュニティを構築できるため、プロジェクトが自己強化されることです。たとえば、業界の他のメンバーが PyTorch を使用して構築したツールも、同社で使用されています。同社はまた、大規模なビルダーコミュニティと1億回のダウンロード記録を持つLlamaプロジェクトの成功も経験しており、さまざまなプロジェクトやビジネスプログラムの成功につながっています。

同社はオープンソースソフトウェアの価値も強調した。彼らの研究室は、オープンソース ソフトウェアは独立した第三者による検証結果を迅速に得ることができ、さらなる開発を促進できることを発見しました。データセットの使用やセキュリティ上の懸念などにより、すべてがオープンソースに適しているわけではありませんが、オープンソースは、自分たちを含めたすべての人にとってメリットがあるため、可能な場合はオープンソースにする傾向があります。

Q: AI モデル ファミリーである Llama についてお話ししましょう。 Llama をオープンソース化する戦略は何ですか?

A: 2006 年に私が Facebook に入社して以来、Facebook はオープンソースのリーダーであり続けています。

PHP はオープンソースです。もし Facebook が Memcached プロジェクトを引き継いでいなかったら、私たちは崩壊していたでしょう。

MySQL はオープンソースです。これが、Facebook が少数の従業員で多くのことを達成し、小規模ながらも非常に効率的な企業になることができた理由の 1 つです。

Meta は現在、これらのプロジェクトだけでなく、機械学習エンジニアリングを完了するためのナンバーワンのシステムである PyTorch も推進しています。私たちはそれを構築し、オープンソース化しました。

オープンソース プロジェクトの重要な利点は、その周りにコミュニティを構築できることと、Meta がこのコミュニティ内のすべてのリソースを最大限に活用できることです。

たとえば、他のメンバーが PyTorch を使用して構築したツールは、Meta 自体でも使用されます。

ラマの場合、多くの人が恩恵を受けました。 1 億ダウンロードを達成したことで、さまざまなプロジェクトが生まれ、Llama をベースに成功を収めている商用プログラムも数多くあります。

Llama が現在のように成長を続け、大規模な開発者コミュニティの絶対的な中心的存在になれば、Meta も大きな恩恵を受け、Meta に多大な貢献を果たすことになるでしょう。

また、ちょうど10年前に設立されたFAIRを見ると、私たちの研究室は常にオープンソースのコンセプトを貫いてきました。ソフトウェアがオープンソース化されると、FAIR は直ちに独立した第三者による検証結果を取得し、その後誰かがその上で開発を続けます。

その結果を利用して、次の論文を作成したり、次のプログラムを開発したりすることができます。

すべてをオープンソース化することはできません。たとえば、私たちの研究の一部は、使用されているデータセットやセキュリティ上の理由でオープンソース化できません。

しかし、他の条件が同じであれば、私たちはオープンソース化に取り組んでおり、それが私たちを含めたすべての人に役立つと信じています。それは双方にとって有利な状況です。

質問: オープンソース戦略は採用にどのような影響を与えますか?オープンソースを愛するエンジニアがいる一方で、このような強力な技術をオープンソース化するのは無責任だと考える AI 研究者もいることを私は知っています。

A: より多くの人がモデルとそのトレーニング方法に精通しているので、採用基盤の拡大に間違いなく役立つと思います。 PyTorch の使い方を知っているエンジニアをさらに雇用することができます。

ですから、これは、会社で素晴らしい仕事をするのに一歩近づいた、より多くの人材を採用するのに非常に良いことだと私は思います。

オープンソースは無責任であるという考えに関しては、これらの大規模な言語モデルに関する多くの不安は見当違いであると思います。

ヤン・ルカンはそれをとてもうまく言ったと思います。オープンソース モデルは非常に興味深く、重要なツールです。リレーショナルデータベースだと思います。

推論したり計画したりする能力がなければ、世界を理解することはできません。そして、どうやら将来的にはこれらの能力は失われるようです。

テクノロジーは今後も進歩し続けるでしょう。これはとても興奮する瞬間です。これは素晴らしい、重要な技術です。

構築コストや実行コストが下がり、レイテンシが低くなり、効率性が向上し、低電力の小型デバイスで非常に強力なモデルを実行できるようになるのが待ちきれません。これらはすべて非常に重要なことです。しかし、それには多くの時間と労力がかかります。

また、大規模なモデルは AGI ではありません。限界まで開発された大規模モデルだけでは、AGI は実現できません。フォン・ノイマンはオッペンハイマーについて何と言ったでしょうか?

「時には、名誉を得るために罪を認める人もいます。」シリコンバレーでは時々そういうことが起こると思います。

人々がそれを信じていないと言っているのではありません。たぶん、信じる人もいるだろうが、私は信じない。

AI人材が黄金時代を迎える

Q: 次世代の優秀な AI 研究者を採用するためのマーケティング戦略は何ですか? OpenAI や Google DeepMind ではなく Meta に参加してもらうにはどうすればよいでしょうか?

A: 研究者には現在多くの選択肢があります。今こそこの業界に参入する良い時期です。これらの企業は多岐にわたります。 Google に入社して 1,000 人のチームの一員になりたい方は、ぜひご連絡ください。

しかし、Meta にはさまざまな規模のチームがあり、各個人が達成できる個人的な影響力はまったく異なります。 OpenAI は 3 つ目の異なる組織です。彼らは非常に珍しいガバナンス構造を持っており、株式ユニットも異なっているようです。

Q: 採用活動は順調に進んでいますか?

A: 順調に進んでいます。先ほど挙げた 3 つの企業からは、確かに多くの優秀な人材が退職しています。その才能の一部は他の企業に移るでしょう。

この才能の一部は新たな場所に行くでしょう。フランスのミストラルはラマを開発した才能のグループで構成されています。

シリコンバレーの基準からすると、私は長いキャリアを積んできたので、これは何も新しいことではありません。

新しい技術が登場すると、人々の熱意は爆発します。この才能の一部は新興企業に行き、一部は既存企業に行きます。しかし、この業界には間違いなくもっと多くの才能ある人材が参入してくるでしょう。

才能の総数がどんどん増えていく時代です。おそらく、ディープラーニングの研究者の数は 1 年前と比べて 10 倍に増えています。人々はこの需要を認識しているため、ますます多くの人々がこれらの技術を学び、研究し始めています。

Q: ミストラルについてお話がありました。先週開始された Mixtral モデルは、複数の専門家を組み合わせて使用​​しており、Meta で皆さんが行っていることと競合しているようです。そう思われますか?

回答:いいえ。コミュニティ全体が何らかのオープンソース モデルを中心に団結し、それが事実上の標準になると、それは興味深い出来事の 1 つです。

このモデルを使用できます。 Memcached が必ずしも私たちから提供されるわけではないのと同じように、これは必ずしも私たちから提供されるわけではありません。

MySQL は当社製ではありません。これらは素晴らしいものです。喜んで使わせていただきます。したがって、オープンソースと競合したくない場合は、オープンソースが適しています。

互いに競争し、異なる戦略を使用し、さまざまな方法で互いに競い合うモデルを作りましょう。 「

私のビジネスモデルは、他の人がこのテクノロジーを使用することを妨げるものではありません。 「

誤解のないように言うと、Llama チームは他のすべてのモデルに勝つことを絶対に望んでいます。こうした競争は良いことであり健全なことです。

これは善意と善意による人々の間の競争であり、生存のための競争ではありません。

ゲームに負けた場合、ペナルティとして、より優れたモデルを使用できるようになります。

<<:  OCRの終焉? Megvii は、ドキュメントレベルの OCR をサポートし、中国語と英語をサポートし、オープンソース化されたマルチモーダル大規模モデルを提案しています。

>>: 

ブログ    
ブログ    

推薦する

OpenAI の公式チュートリアル: GPT-4 で議事録生成 AI を作成する方法

このチュートリアルでは、OpenAI の Whisper と GPT-4 モデルを使用して自動会議議...

データセンターにおける人工知能: 知っておくべき 7 つのこと

人工知能と機械学習は、日常的なタスクと高度なタスクの両方を徐々に引き継いでいます。管理者と従業員は解...

...

人工知能の時代において、ロボットを超える子どもたちが身につけるべき能力とは何でしょうか?

[[428042]]今後予測できることは、人工知能の時代が徐々に深まり、私たちの生活がSF映画のリ...

AI+医療がさらに一歩前進:免疫療法と精密医療の推進

免疫療法はがんの診断と治療に革命をもたらしていますが、まだ少数の患者(20%~30%)にしか効果があ...

...

ICRA 2022 優秀論文: 自動運転用 2D 画像を鳥瞰図に変換し、モデル認識精度を 15% 向上

自動運転における多くのタスクは、トップダウン、マップ、または鳥瞰図 (BEV) の観点から見ると、よ...

Zookeeper の選出アルゴリズムとスプリットブレイン問題の詳細な説明

ZKの紹介ZK = 動物園の飼育係ZK は、マイクロサービス ソリューションにおけるサービス登録と検...

AIがコンテンツ業界に力を与える: 確実に勝利するのは誰か、流れを変えるのは誰か

[51CTO.comより引用] 近年、AI技術は徐々にコンテンツ業界に浸透し、さまざまなコンテンツプ...

少し手を加えるだけで、GPT-3 の精度が 61% 向上します。グーグルと東京大学の研究は皆を驚かせた

私たちが目を覚ましたとき、機械学習コミュニティは大騒ぎしていました。最新の研究により、GPT-3 に...

28歳で普通のエンジニアからAIに転職すべきか?

[[275552]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

...

人工知能企業が利益を上げるのは難しいと言われていますが、具体的に何が難しいのでしょうか?

[[272155]] 2016年にAlphaGoが「人間対機械」の競争に勝利して以来、人工知能への...

国産ディープラーニングフレームワーク「MegEngine」が3月末にオープンソース化

2020 年にどのディープラーニング フレームワークを選択すべきでしょうか?今、新たな選択肢がありま...