Google DeepMindの中核責任者が、AIエージェントを目指して自身のビジネスを立ち上げるために辞職したことが明らかになりました。ジェミニの元責任者

Google からもう 1 人の中核社員が退職することが明らかになりました。

今回逃亡したのは、DeepMindの中核技術責任者であり、Geminiプロジェクトの主要開発者4人のうちの1人であるイオアニス・アントノグルー氏だ。

上の写真の左半分には、ジェミニプロジェクトのリーダー 36 名がリストされています。昨年 9 月以降、イオアニスアントノグル氏を含む主要メンバー 4 名が脱退しました。

イオアニス・アントノグル

OpenAIとMicrosoftからの圧力を受けて、Googleは苦戦しているようだ。

同社は昨年、1万2000人以上の従業員を解雇し、退職金だけで数十億ドルを費やした。ピチャイ氏は今年も1年間にわたり従業員の解雇を続けると発表し、 OpenAIもGoogleから上級の人材を引き抜こうとしている。

一方、AI 業界のリーダーたちは、AI エージェントなどの大規模なモデルがもたらす変化の中に新たな機会を発見しました。

この分野で名を上げようとするスタートアップ企業はますます増えています。アントノグル氏が今回退社する目的は、独自の人工知能企業を立ち上げ、エージェント市場をターゲットにすることです。

アントノグルー氏の現在の2人のパートナー、シェルジル・オザイル氏とミシャ・ラスキン氏も、かつてジェミニ計画で働いていた同僚である。事情に詳しい人物によると、彼らはすでにスタートアップ企業のために資金調達を開始している。

——Google のテクノロジー帝国は拡大しています...それは悪いことではないのでしょうか?

もちろん、新会社がインテリジェントエージェントの分野に参入することを決定した場合、多くの競合企業に直面することになるだろう。

General Catalystが支援するAdept（4億3000万ドルを調達）やNvidiaが支援するImbue（2億ドル以上を調達）など、最近のスタートアップ企業はインテリジェントエージェントの開発に取り組んでいる。

他のスタートアップとしてはHyperWriteやLindyなどがあり、大企業も参入する可能性があります。

アントノグルー氏は2012年にDeepMindに入社した。

2013 年、アントノグルー氏は、人間の介入なしに Atari のビデオゲームを学習し習得できる深層強化学習に関する論文を発表した 7 人の著者の 1 人でした。

この研究はNIPS 2013のディープラーニングワークショップで発表され、その画期的な成果はGoogleとFacebookのリーダーたちの注目を集め、彼らはこの技術が自社の広告事業の強化に利用できることに気付きました。

2014年、Googleは従業員がわずか75人ほどだったDeepMindを5億ドル以上で買収した。アントノグルー氏はその後、囲碁のトッププレイヤーに勝利した AI の開発に貢献しました。

興味深いことに、OpenAI チームもこれに影響を受け、同様の技術を使用して Dota 2 をプレイできる AI システムを開発しました。

前述のアントノグルー氏のパートナーであるシェルジル・オザイル氏も業界の大物だ。

オザイル氏は昨年の夏、ディープマインドを離れ、テスラに入社した。同氏は以前にもアントノグル氏と共同でいくつかの記事を執筆しており、その一例としてはPMLR'2021の以下の記事が挙げられる。

彼の最も有名な作品の 1 つは、ほとんどの人がよく知っている「GAN (Generative Adversarial Network)」です。

この画期的な研究は、その後の生成 AI モデルの開発の基礎を築きました。

「分岐」

上記で紹介した大物以外にも、過去2年間でDeepMindやGoogle Brainの社員が辞職し、自ら新しい会社を立ち上げた例もある。

これらには、オープンソースの AI モデルを開発している Mistral AI や、生成 AI モデルの開発に取り組んでいる Sakana AI および Reka AI が含まれます。

最近、グーグルで画像と音楽を担当していたAI研究者3人が同社を去った。事情に詳しい関係者によると、彼らは独自のAIスタートアップ企業、アンチャーテッド・ラボを設立したという。

これはまた、Google 内部の構造的な問題の可能性も明らかにしており、同社が立ち上げた AI 製品は的を外した一方で、同社のトップ研究者は外部の機会を捉え、AI 分野の新興企業に対するベンチャー投資家の熱意を利用することを決定した。

提出書類によると、創業者３人は８５０万ドルを調達しており、ここ数カ月間にアンドリーセン・ホロウィッツを含む潜在的投資家らと会談した。

3人からなるチームの代表は、以前はGoogle DeepMindのテクニカルディレクターを務めていたDavid Ding氏です。

残りの2人、チャーリー・ナッシュ氏とヤロスラフ・ガニン氏は、ディン氏が以前所属していたディープマインド社のチームのメンバーだった。ディン氏とガニン氏は5年以上Googleで勤務しています。

ディン氏の以前のチームのもう一人のメンバー、コナー・ダーカン氏も昨年チームを去った。

ディープマインドでは、4人はユーザーからの簡単な説明に基づいてAIがオリジナルの画像や音楽を作成できるようにするプロジェクトに取り組んでいました。

昨年11月、DeepMindは、チャーリー・プースやジョン・レジェンドなどのアーティストのボーカルを使用するなど、ゼロから曲を作成できる生成音楽モデル「Lyria」を発表した。

これらの人々は、Midjourney や DALL·E 3 (OpenAI) の競合製品である Imagen 2 の開発にも参加しました。

この悲惨な土壌浸食状況に直面して、Google は歯を食いしばって、特別な株式インセンティブを使用してトップクラスの AI 研究者の給与を引き上げざるを得ませんでした。

しかし、生成AIに取り組むスタートアップにとって、ベンチャーキャピタルへの容易なアクセスは大きな魅力です。

PitchBookと全米ベンチャーキャピタル協会のデータによると、2023年には米国のベンチャーキャピタルの3分の1以上がAI分野に投入されることになる。

AIエージェントは期待に応えられなかった

AI エージェントの概念は、生成 AI モデルの開発により普及してきました。エージェントは、人間がオンラインショッピング、チケットの予約、会議などを処理するのを自動的に支援できます。

たとえば、AutoGPT と BabyAGI は、フライトの予約からテキストメッセージへの返信まで、あらゆることを自動化することを約束しています。しかし、すぐに技術的な限界が露呈しました。

OpenAI が立ち上げた関連製品を含め、これまでのところ大きな進展はありません。

既存のエージェントはタスクを実行する能力が異なり、同じ行動パターンを繰り返す傾向があります。研究者は、既成のモデルに頼るのではなく、インテリジェントなタスクに適した専用のソフトウェアを開発するなど、これらの問題に対処するための新しい方法も試みています。

HyperWrite の共同創設者兼 CEO である Matt Shumer 氏は、AI エージェントが期待通りに発展していない理由はいくつかあると述べています。

現在のエージェントは、目標を計画し、サブタスクに細分化することができますが (例: 競合他社の調査から管理の評価、売上の予測、コストの計算まで)、これらのサブタスクを実行するのが難しいことがよくあります。

自動運転と同様に、インテリジェントエージェントはこれまで遭遇したことのない「エッジケース」に苦労することが多く、そのような失敗は消費者の信頼を損なう可能性があります。

さらに、業界は大規模な言語モデル開発者と同じ問題に直面しているようです。彼らはベンチャーキャピタルで長年の研究上の問題を解決しようとしている一方で、投資家はできるだけ早く完成した製品と投資収益を見たいと考えています。

解決

従来の AI エージェントは通常、次の 3 つの部分で構成されます。

1 つ目は GPT-4 のような大規模な言語モデルで、目標を達成するために必要なタスクを計画する役割を担います。2 つ目はベクトルデータベースで、インテリジェントエージェントが過去のアクションや目標に関連する重要な背景情報を記憶するのに役立ちます。3 つ目は LangChain などのツールで、これらのコンポーネントを接続する役割を担っています。

HyperWrite はまったく異なる構造を試みています。リクエストの複雑さに応じて、HyperWrite はクライアントのリクエストを処理のために異なるモデルに割り当てることができます。

シュマー氏は、GPT などの従来の大規模言語モデルは単純な Web 検索しか処理できないが、HyperWrite のカスタマイズされたモデルは Web ページのコンテンツを分析し、さまざまなボタンをクリックするなど、コンテンツと対話することに優れていると述べた。 HyperWrite には現在、何千人もの有料顧客がいます。

同様に、Imbue は、AI エージェントがソフトウェアコーディングなどの問題を解決できるように、大規模言語モデルやマルチモーダルモデルなど、さまざまなモデルを開発しています。

この目的のために、Imbue チームは、モデルがブログ投稿やソフトウェアコードの背後にあるロジックを理解できるように、トレーニングデータに特別な注釈を付けました。

Imbue の開発者は、モデルのトレーニングデータ内のコード行に注釈を付け、それがより大きなソフトウェアプロジェクトにどのように貢献するかを説明します。このようにして、モデルは、より広範な目標を達成するために個々のコード行がどのように連携するかを学習します。

インテリジェントエージェントの開発のもう一つの方向性は、特定のタスクに焦点を当てることです。

たとえば、Imbue は、コードフォーマットエラーの修正から AI ポリシーの傾向の分析まで、特定の問題の解決に特化した複数のエージェントを使用します。このドメインに重点を置いたアプローチにより、エージェントが遭遇する問題のあるエッジケースの数が削減されます。

シューマー氏は、時間が経てば、汎用モデルが特定のタスクに特化したモデルよりも優れた性能を発揮するようになると考えています。しかし、CRV のビビアン・チェン氏は、この技術はまだ初期段階にあるため、短期から中期的には信頼性の高い汎用エージェントを開発するのは難しいと考えています。

——もしかしたら、「普遍性」と「専用性」が将来どこかの時点で出会うことになるかもしれません。楽しみに待ちましょう。

<<:

>>: 追跡すべきマルチモーダル LLM が多すぎますか?まずは26のSOTAモデルを見てみましょう

マイクロソフトがAIコンテンツレビューツール「Azure AI Content Safety」を正式にリリース

ブログ

エラー分析を正しく行う方法、NLP研究者は学ぶ必要がある

ブログ

チップ大手がCESで新年の幕開けを飾る戦いを繰り広げる！ AMD、インテル、NVIDIA、クアルコムの衝撃的な対決

ブログ

Google DeepMindの中核責任者が、AIエージェントを目指して自身のビジネスを立ち上げるために辞職したことが明らかになりました。ジェミニの元責任者

「分岐」

AIエージェントは期待に応えられなかった

解決

マイクロソフトがAIコンテンツレビューツール「Azure AI Content Safety」を正式にリリース

AI製品化の鍵はアルゴリズムではなくインフラとデータ

無料の機械学習ベンチマークツール：主要なデータセットを統合し、GitHubに接続して使用する

エラー分析を正しく行う方法、NLP研究者は学ぶ必要がある

チップ大手がCESで新年の幕開けを飾る戦いを繰り広げる！ AMD、インテル、NVIDIA、クアルコムの衝撃的な対決

推薦する

分析技術は、2019-nCoVの潜在的な感染を追跡し予測するのに役立っています。

AIを活用して企業に利益をもたらすにはどうすればいいでしょうか?答えはすべてあなたのためにあります

私の国のロボット市場は活況を呈しているが、人材と技術的な問題はまだ解決する必要がある。

2020年のAI技術のブレークスルーをすべて見る

LeCunがまた人気です！ 1993年に公開された初のテキスト認識技術を実演したCNNのビデオがRedditのホットリストでトップに

AIが建物をスマートにする5つの方法

Baidu WorldがAI応用レポートカードを発表、国民経済の3大産業に進出

5GとAIの強力な組み合わせは、どのような新たな機会をもたらすのでしょうか?

これらの 8 冊の本を読んでいないのに、コンピュータービジョンの分野で働いていると言える勇気がありますか?

Alibaba Cloud 第2回インタビュー: Zookeeper 一貫性アルゴリズム