Google DeepMindの中核責任者が、AIエージェントを目指して自身のビジネスを立ち上げるために辞職したことが明らかになりました。ジェミニの元責任者

Google DeepMindの中核責任者が、AIエージェントを目指して自身のビジネスを立ち上げるために辞職したことが明らかになりました。ジェミニの元責任者

Google からもう 1 人の中核社員が退職することが明らかになりました。

今回逃亡したのは、DeepMindの中核技術責任者であり、Geminiプロジェクトの主要開発者4人のうちの1人であるイオアニス・アントノグルー氏だ。

上の写真の左半分には、ジェミニ プロジェクトのリーダー 36 名がリストされています。昨年 9 月以降、イオアニス アントノグル氏を含む主要メンバー 4 名が脱退しました。

イオアニス・アントノグル

OpenAIとMicrosoftからの圧力を受けて、Googleは苦戦しているようだ。

同社は昨年、1万2000人以上の従業員を解雇し、退職金だけで数十億ドルを費やした。ピチャイ氏は今年も1年間にわたり従業員の解雇を続けると発表し、 OpenAIもGoogleから上級の人材を引き抜こうとしている。

一方、AI 業界のリーダーたちは、AI エージェントなどの大規模なモデルがもたらす変化の中に新たな機会を発見しました。

この分野で名を上げようとするスタートアップ企業はますます増えています。アントノグル氏が今回退社する目的は、独自の人工知能企業を立ち上げ、エージェント市場をターゲットにすることです。

アントノグルー氏の現在の2人のパートナー、シェルジル・オザイル氏とミシャ・ラスキン氏も、かつてジェミニ計画で働いていた同僚である。事情に詳しい人物によると、彼らはすでにスタートアップ企業のために資金調達を開始している。

——Google のテクノロジー帝国は拡大しています...それは悪いことではないのでしょうか?

もちろん、新会社がインテリジェントエージェントの分野に参入することを決定した場合、多くの競合企業に直面することになるだろう。

General Catalystが支援するAdept(4億3000万ドルを調達)やNvidiaが支援するImbue(2億ドル以上を調達)など、最近のスタートアップ企業はインテリジェントエージェントの開発に取り組んでいる。

他のスタートアップとしてはHyperWriteやLindyなどがあり、大企業も参入する可能性があります。

アントノグルー氏は2012年にDeepMindに入社した。

2013 年、アントノグルー氏は、人間の介入なしに Atari のビデオ ゲームを学習し習得できる深層強化学習に関する論文を発表した 7 人の著者の 1 人でした。

この研究はNIPS 2013のディープラーニングワークショップで発表され、その画期的な成果はGoogleとFacebookのリーダーたちの注目を集め、彼らはこの技術が自社の広告事業の強化に利用できることに気付きました。

2014年、Googleは従業員がわずか75人ほどだったDeepMindを5億ドル以上で買収した。アントノグルー氏はその後、囲碁のトッププレイヤーに勝利した AI の開発に貢献しました。

興味深いことに、OpenAI チームもこれに影響を受け、同様の技術を使用して Dota 2 をプレイできる AI システムを開発しました。

前述のアントノグルー氏のパートナーであるシェルジル・オザイル氏も業界の大物だ。

オザイル氏は昨年の夏、ディープマインドを離れ、テスラに入社した。同氏は以前にもアントノグル氏と共同でいくつかの記事を執筆しており、その一例としてはPMLR'2021の以下の記事が挙げられる。

彼の最も有名な作品の 1 つは、ほとんどの人がよく知っている「GAN (Generative Adversarial Network)」です。

この画期的な研究は、その後の生成 AI モデルの開発の基礎を築きました。

「分岐」

上記で紹介した大物以外にも、過去2年間でDeepMindやGoogle Brainの社員が辞職し、自ら新しい会社を立ち上げた例もある。

これらには、オープンソースの AI モデルを開発している Mistral AI や、生成 AI モデルの開発に取り組んでいる Sakana AI および Reka AI が含まれます。

最近、グーグルで画像と音楽を担当していたAI研究者3人が同社を去った。事情に詳しい関係者によると、彼らは独自のAIスタートアップ企業、アンチャーテッド・ラボを設立したという。

これはまた、Google 内部の構造的な問題の可能性も明らかにしており、同社が立ち上げた AI 製品は的を外した一方で、同社のトップ研究者は外部の機会を捉え、AI 分野の新興企業に対するベンチャー投資家の熱意を利用することを決定した。

提出書類によると、創業者3人は850万ドルを調達しており、ここ数カ月間にアンドリーセン・ホロウィッツを含む潜在的投資家らと会談した。

3人からなるチームの代表は、以前はGoogle DeepMindのテクニカルディレクターを務めていたDavid Ding氏です。

残りの2人、チャーリー・ナッシュ氏とヤロスラフ・ガニン氏は、ディン氏が以前所属していたディープマインド社のチームのメンバーだった。ディン氏とガニン氏は5年以上Googleで勤務しています。

ディン氏の以前のチームのもう一人のメンバー、コナー・ダーカン氏も昨年チームを去った。

ディープマインドでは、4人はユーザーからの簡単な説明に基づいてAIがオリジナルの画像や音楽を作成できるようにするプロジェクトに取り組んでいました。

昨年11月、DeepMindは、チャーリー・プースやジョン・レジェンドなどのアーティストのボーカルを使用するなど、ゼロから曲を作成できる生成音楽モデル「Lyria」を発表した。

これらの人々は、Midjourney や DALL·E 3 (OpenAI) の競合製品である Imagen 2 の開発にも参加しました。

この悲惨な土壌浸食状況に直面して、Google は歯を食いしばって、特別な株式インセンティブを使用してトップクラスの AI 研究者の給与を引き上げざるを得ませんでした。

しかし、生成AIに取り組むスタートアップにとって、ベンチャーキャピタルへの容易なアクセスは大きな魅力です。

PitchBookと全米ベンチャーキャピタル協会のデータによると、2023年には米国のベンチャーキャピタルの3分の1以上がAI分野に投入されることになる。

AIエージェントは期待に応えられなかった

AI エージェントの概念は、生成 AI モデルの開発により普及してきました。エージェントは、人間がオンライン ショッピング、チケットの予約、会議などを処理するのを自動的に支援できます。

たとえば、AutoGPT と BabyAGI は、フライトの予約からテキスト メッセージへの返信まで、あらゆることを自動化することを約束しています。しかし、すぐに技術的な限界が露呈しました。

OpenAI が立ち上げた関連製品を含め、これまでのところ大きな進展はありません。

既存のエージェントはタスクを実行する能力が異なり、同じ行動パターンを繰り返す傾向があります。研究者は、既成のモデルに頼るのではなく、インテリジェントなタスクに適した専用のソフトウェアを開発するなど、これらの問題に対処するための新しい方法も試みています。

HyperWrite の共同創設者兼 CEO である Matt Shumer 氏は、AI エージェントが期待通りに発展していない理由はいくつかあると述べています。

現在のエージェントは、目標を計画し、サブタスクに細分化することができますが (例: 競合他社の調査から管理の評価、売上の予測、コストの計算まで)、これらのサブタスクを実行するのが難しいことがよくあります。

自動運転と同様に、インテリジェントエージェントはこれまで遭遇したことのない「エッジケース」に苦労することが多く、そのような失敗は消費者の信頼を損なう可能性があります。

さらに、業界は大規模な言語モデル開発者と同じ問題に直面しているようです。彼らはベンチャーキャピタルで長年の研究上の問題を解決しようとしている一方で、投資家はできるだけ早く完成した製品と投資収益を見たいと考えています。

解決

従来の AI エージェントは通常、次の 3 つの部分で構成されます。

1 つ目は GPT-4 のような大規模な言語モデルで、目標を達成するために必要なタスクを計画する役割を担います。2 つ目はベクトル データベースで、インテリジェント エージェントが過去のアクションや目標に関連する重要な背景情報を記憶するのに役立ちます。3 つ目は LangChain などのツールで、これらのコンポーネントを接続する役割を担っています。

HyperWrite はまったく異なる構造を試みています。リクエストの複雑さに応じて、HyperWrite はクライアントのリクエストを処理のために異なるモデルに割り当てることができます。

シュマー氏は、GPT などの従来の大規模言語モデルは単純な Web 検索しか処理できないが、HyperWrite のカスタマイズされたモデルは Web ページのコンテンツを分析し、さまざまなボタンをクリックするなど、コンテンツと対話することに優れていると述べた。 HyperWrite には現在、何千人もの有料顧客がいます。

同様に、Imbue は、AI エージェントがソフトウェア コーディングなどの問題を解決できるように、大規模言語モデルやマルチモーダル モデルなど、さまざまなモデルを開発しています。

この目的のために、Imbue チームは、モデルがブログ投稿やソフトウェア コードの背後にあるロジックを理解できるように、トレーニング データに特別な注釈を付けました。

Imbue の開発者は、モデルのトレーニング データ内のコード行に注釈を付け、それがより大きなソフトウェア プロジェクトにどのように貢献するかを説明します。このようにして、モデルは、より広範な目標を達成するために個々のコード行がどのように連携するかを学習します。

インテリジェントエージェントの開発のもう一つの方向性は、特定のタスクに焦点を当てることです。

たとえば、Imbue は、コードフォーマットエラーの修正から AI ポリシーの傾向の分析まで、特定の問題の解決に特化した複数のエージェントを使用します。このドメインに重点を置いたアプローチにより、エージェントが遭遇する問題のあるエッジ ケースの数が削減されます。

シューマー氏は、時間が経てば、汎用モデルが特定のタスクに特化したモデルよりも優れた性能を発揮するようになると考えています。しかし、CRV のビビアン・チェン氏は、この技術はまだ初期段階にあるため、短期から中期的には信頼性の高い汎用エージェントを開発するのは難しいと考えています。

——もしかしたら、「普遍性」と「専用性」が将来どこかの時点で出会うことになるかもしれません。楽しみに待ちましょう。

<<: 

>>:  追跡すべきマルチモーダル LLM が多すぎますか?まずは26のSOTAモデルを見てみましょう

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

GPT-4はMITの学位を取得できない、MITの研究チームは「不正行為」と反応したが、ネットユーザーはそれを信じない

数日前、「大規模言語モデルを使用した MIT 数学および EECS カリキュラムの調査」と題された論...

機械学習エンジニアが知っておくべきアルゴリズムトップ10

機械学習/人工知能のサブフィールドがここ数年で人気が高まってきたことは間違いありません。ビッグデータ...

新しいテクノロジー、古い問題: NLP における聞こえない「声」

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

他社がまだ「大型モデル」衛星を打ち上げている一方で、マイクロソフトはすでに開発者にその使い方を教えている。

春から夏へと移り変わる季節は、世界のトップテクノロジー企業が毎年恒例のイベントを開催する季節です。 ...

最大の効率: AIがソースコードを読み取って教えてくれる

みなさんこんにちは、カソンです。テクノロジー系のブログをよく読む友人なら、 Webpilot [1]...

...

AI 音声ジェネレーターとは何ですか? どのように機能しますか?

近年、AI 音声ジェネレーターは、人々が機械と対話し、デジタル コンテンツを受け取る方法を変える強力...

マスク氏も騙された。AIの虚偽の内容が「リアル」すぎる

イスラエルとパレスチナの紛争が深刻化するにつれ、ソーシャルメディアのプラットフォーム上には現地の情景...

MLOps 実装を成功させるためのベストプラクティス

翻訳者 | ブガッティ企画 | 梁策、孫淑娟機械学習と今日の世界におけるその応用については、すでにご...

NvidiaとGenentechがAIを活用して新薬発見を加速させる提携

Nvidia はバイオテクノロジー大手の Genentech と提携し、生成 AI を含む最先端の人...

...

...

Java プログラミング スキル - データ構造とアルゴリズム「ソート アルゴリズムの分類と紹介」

導入ソートとは、データのセットを指定された順序で並べるプロセスです。分類カテゴリ内部ソート: ソート...