Googleがこれまでで最も強力なAIモデル「Gemini」を発表

グーグルは水曜日、AIを収益化する方法に対する回答を求める圧力が高まる中、同社がこれまでで最も強力だと考える人工知能モデルを発表した。

大規模言語モデル Gemini には、最大かつ最も強力なカテゴリである Gemini Ultra、さまざまなタスクに拡張可能な Gemini Pro、特定のタスクやモバイルデバイスで使用される Gemini Nano の 3 つの異なるキットが含まれます。

同社は現在、Google Cloud を通じて顧客に Gemini のライセンスを供与し、顧客独自のアプリケーションで使用してもらうことを計画している。 12 月 13 日より、開発者および企業顧客は、Google AI Studio または Google Cloud Vertex AI の Gemini API を通じて Gemini Pro にアクセスできるようになります。 Android 開発者も Gemini Nano を使用してビルドできるようになります。 Gemini は、Bard チャットボットや、会話形式のテキストで検索クエリに回答する Search Generated Experience などの Google 製品にも使用される予定です (SGE はまだ広く利用可能ではありません)。

企業は、チャットボットや製品の推奨を通じてより高度な顧客サービスを提供したり、製品の宣伝を希望する企業のトレンドを特定したりするためにこれを使用できます。 Gemini は、企業がマーケティングキャンペーンやブログコンテンツを作成したい場合のコンテンツ作成や、会議の要約や開発者向けのコード生成を行う生産性向上アプリにも使用できます。

同社は、ジェミニがグラフのスクリーンショットを撮り、何百ページもの研究レポートを分析してグラフを更新できることを示す例や、ある人の数学の宿題の写真を分析して正解を見つけ、間違った答えを指摘する例など、いくつかの例を示した。

ジェミニ・ウルトラは、数学、物理学、歴史、法律、医学、倫理学など57の科目を組み合わせて世界知識と問題解決能力をテストする大規模マルチタスク言語理解（MMLU）において人間の専門家を上回る成績を収めた初のモデルであると、同社は水曜日のブログ投稿で発表した。複雑な内容のニュアンスや論理的思考を理解できると言われています。

「ジェミニは、Google Researchの同僚を含むGoogle全体の大規模なコラボレーションの成果です」とGoogle CEOのサンダー・ピチャイ氏は水曜日のブログ投稿で述べた。「最初からマルチモーダルであり、テキスト、コード、音声、画像、動画など、さまざまな種類の情報を一般化し、シームレスに理解、操作、組み合わせることができることを意味します。」

本日より、Google のチャットボット Bard は、高度な推論、計画、理解、その他の機能を支援するために Gemini Pro を使用します。同社幹部は火曜日の記者との電話会議で、来年初めにジェミニ・ウルトラを採用した「バード・アドバンスト」を発売する予定だと語った。

このアップデートは、検索大手の Google が初めて Bard をリリースしてから 8 か月後、OpenAI が GPT-3.5 上で ChatGPT をリリースしてから 1 年後に行われました。 3月に、アルトマン氏が率いるスタートアップはGPT-4を立ち上げた。幹部らは火曜日、ジェミニ・プロはGPT-3.5よりも性能が優れていると述べたが、GPT-4と比べるとどうなのかという質問には答えなかった。

しかし、Googleが水曜日に発表したホワイトペーパーによると、GeminiのUltraモデルはいくつかのベンチマークでGPT-4を上回ったという。

Google が Bard Advanced へのアクセスを有料化する計画があるかどうか尋ねられたとき、Google Bard ゼネラルマネージャーの Sissie Hsiao 氏は、Google は優れたエクスペリエンスを生み出すことに注力しており、収益化に関する詳細はまだないと述べた。

記者会見で、現世代のLLMと比べてGeminiには何か新しい機能があるかと尋ねられたとき、Google DeepMindの製品担当副社長であるEli Collins氏は「あると思います」と答えたが、同社はまだGemini Ultraaの新しい機能の理解に取り組んでいるところだ。

Google は、準備が整っていないため Gemini のリリースを延期したと報じられており、今年初めに同社が AI ツールの展開に苦戦していたことを思い出すことになる。

複数の記者が遅延について質問したところ、コリンズ氏は、より高度なモデルのテストには時間がかかると答えた。コリンズ氏は、ジェミニは同社がこれまでに構築したAIモデルの中で最も厳密にテストされたものであり、グーグルのモデルの中で「最も包括的な安全性評価」を受けていると述べた。

ジェミニ・ウルトラは最大モデルであるにもかかわらず、メンテナンス費用がはるかに安いとコリンズ氏は言う。「能力が高まっただけでなく、効率も向上しました」と同氏は言う。「ジェミニを訓練するにはまだ多くのコンピューターが必要ですが、これらのモデルを訓練する能力はより効率的になってきています。」

コリンズ氏は、同社がこのモデルについての詳細を記載した技術白書を水曜日に発表する予定だが、円周数は公表しないと述べた。今年初め、ジャーナリストたちは、当時最新だった Google の AI モデル「Palm 2 Large Language Model」が、その前身である LLM のほぼ 5 倍の量のテキストデータでトレーニングされていることを発見しました。

また、水曜日にGoogleはAIモデルのトレーニング用次世代Tensor Processing Unitを発表した。グーグルは、セールスフォースと新興企業のライトリックス社が、2021年に発表されたTPU v4よりも優れた価格性能比を提供するTPU v5pチップの使用を開始したと述べたが、市場リーダーのエヌビディアと比較したパフォーマンスに関する情報は提供しなかった。

10月に行われたグーグルの第3四半期の決算発表の際、投資家らは同社がAIをいかにして実際の利益につなげていくのかについて幹部らにさらなる質問をぶつけた。

Google は 8 月に Search Generative Experiences (SGE) と呼ばれる初期の実験を開始しました。これは、検索エンジンを使用する際に GenAI エクスペリエンスがどのようなものになるかをユーザーが確認できるようにするものです。検索は依然として同社の主要な収益源であり、結果はチャットボットの時代を反映してより会話形式になっていますが、まだ実験段階と考えられており、一般には公開されていません。

ジェミニが5月に年次開発者会議「Google I/O」で初めてこの実験を発表して以来、投資家らはSGEのタイムラインを尋ねてきた。ジェミニの水曜日の発表ではSGEについてほとんど触れられず、幹部らは一般公開の計画については曖昧で、「今後1年以内に」ジェミニはSGEに統合されると述べている。

「このモデリングの新時代は、当社がこれまで取り組んできた科学と工学の取り組みの中でも最大のものの一つです」とピチャイ氏は水曜日のブログ投稿で述べた。「ジェミニが世界中の人々にもたらすであろう未来と機会に、私は本当に興奮しています。」

<<: Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

>>: Gemini vs ChatGPT: Google の最新 AI と ChatGPT のどちらが優れているのでしょうか?