Googleがこれまでで最も強力なAIモデル「Gemini」を発表

Googleがこれまでで最も強力なAIモデル「Gemini」を発表

グーグルは水曜日、AIを収益化する方法に対する回答を求める圧力が高まる中、同社がこれまでで最も強力だと考える人工知能モデルを発表した。

大規模言語モデル Gemini には、最大かつ最も強力なカテゴリである Gemini Ultra、さまざまなタスクに拡張可能な Gemini Pro、特定のタスクやモバイル デバイスで使用される Gemini Nano の 3 つの異なるキットが含まれます。

同社は現在、Google Cloud を通じて顧客に Gemini のライセンスを供与し、顧客独自のアプリケーションで使用してもらうことを計画している。 12 月 13 日より、開発者および企業顧客は、Google AI Studio または Google Cloud Vertex AI の Gemini API を通じて Gemini Pro にアクセスできるようになります。 Android 開発者も Gemini Nano を使用してビルドできるようになります。 Gemini は、Bard チャットボットや、会話形式のテキストで検索クエリに回答する Search Generated Experience などの Google 製品にも使用される予定です (SGE はまだ広く利用可能ではありません)。

企業は、チャットボットや製品の推奨を通じてより高度な顧客サービスを提供したり、製品の宣伝を希望する企業のトレンドを特定したりするためにこれを使用できます。 Gemini は、企業がマーケティング キャンペーンやブログ コンテンツを作成したい場合のコンテンツ作成や、会議の要約や開発者向けのコード生成を行う生産性向上アプリにも使用できます。

同社は、ジェミニがグラフのスクリーンショットを撮り、何百ページもの研究レポートを分析してグラフを更新できることを示す例や、ある人の数学の宿題の写真を分析して正解を見つけ、間違った答えを指摘する例など、いくつかの例を示した。

ジェミニ・ウルトラは、数学、物理学、歴史、法律、医学、倫理学など57の科目を組み合わせて世界知識と問題解決能力をテストする大規模マルチタスク言語理解(MMLU)において人間の専門家を上回る成績を収めた初のモデルであると、同社は水曜日のブログ投稿で発表した。複雑な内容のニュアンスや論理的思考を理解できると言われています。

「ジェミニは、Google Researchの同僚を含むGoogle全体の大規模なコラボレーションの成果です」とGoogle CEOのサンダー・ピチャイ氏は水曜日のブログ投稿で述べた。「最初からマルチモーダルであり、テキスト、コード、音声、画像、動画など、さまざまな種類の情報を一般化し、シームレスに理解、操作、組み合わせることができることを意味します。」

本日より、Google のチャットボット Bard は、高度な推論、計画、理解、その他の機能を支援するために Gemini Pro を使用します。同社幹部は火曜日の記者との電話会議で、来年初めにジェミニ・ウルトラを採用した「バード・アドバンスト」を発売する予定だと語った。

このアップデートは、検索大手の Google が初めて Bard をリリースしてから 8 か月後、OpenAI が GPT-3.5 上で ChatGPT をリリースしてから 1 年後に行われました。 3月に、アルトマン氏が率いるスタートアップはGPT-4を立ち上げた。幹部らは火曜日、ジェミニ・プロはGPT-3.5よりも性能が優れていると述べたが、GPT-4と比べるとどうなのかという質問には答えなかった。

しかし、Googleが水曜日に発表したホワイトペーパーによると、GeminiのUltraモデルはいくつかのベンチマークでGPT-4を上回ったという。

Google が Bard Advanced へのアクセスを有料化する計画があるかどうか尋ねられたとき、Google Bard ゼネラルマネージャーの Sissie Hsiao 氏は、Google は優れたエクスペリエンスを生み出すことに注力しており、収益化に関する詳細はまだないと述べた。

記者会見で、現世代のLLMと比べてGeminiには何か新しい機能があるかと尋ねられたとき、Google DeepMindの製品担当副社長であるEli Collins氏は「あると思います」と答えたが、同社はまだGemini Ultraaの新しい機能の理解に取り組んでいるところだ。

Google は、準備が整っていないため Gemini のリリースを延期したと報じられており、今年初めに同社が AI ツールの展開に苦戦していたことを思い出すことになる。

複数の記者が遅延について質問したところ、コリンズ氏は、より高度なモデルのテストには時間がかかると答えた。コリンズ氏は、ジェミニは同社がこれまでに構築したAIモデルの中で最も厳密にテストされたものであり、グーグルのモデルの中で「最も包括的な安全性評価」を受けていると述べた。

ジェミニ・ウルトラは最大モデルであるにもかかわらず、メンテナンス費用がはるかに安いとコリンズ氏は言う。 「能力が高まっただけでなく、効率も向上しました」と同氏は言う。「ジェミニを訓練するにはまだ多くのコンピューターが必要ですが、これらのモデルを訓練する能力はより効率的になってきています。」

コリンズ氏は、同社がこのモデルについての詳細を記載した技術白書を水曜日に発表する予定だが、円周数は公表しないと述べた。今年初め、ジャーナリストたちは、当時最新だった Google の AI モデル「Palm 2 Large Language Model」が、その前身である LLM のほぼ 5 倍の量のテキスト データでトレーニングされていることを発見しました。

また、水曜日にGoogleはAIモデルのトレーニング用次世代Tensor Processing Unitを発表した。グーグルは、セールスフォースと新興企業のライトリックス社が、2021年に発表されたTPU v4よりも優れた価格性能比を提供するTPU v5pチップの使用を開始したと述べたが、市場リーダーのエヌビディアと比較したパフォーマンスに関する情報は提供しなかった。

10月に行われたグーグルの第3四半期の決算発表の際、投資家らは同社がAIをいかにして実際の利益につなげていくのかについて幹部らにさらなる質問をぶつけた。

Google は 8 月に Search Generative Experiences (SGE) と呼ばれる初期の実験を開始しました。これは、検索エンジンを使用する際に GenAI エクスペリエンスがどのようなものになるかをユーザーが確認できるようにするものです。検索は依然として同社の主要な収益源であり、結果はチャットボットの時代を反映してより会話形式になっていますが、まだ実験段階と考えられており、一般には公開されていません。

ジェミニが5月に年次開発者会議「Google I/O」で初めてこの実験を発表して以来、投資家らはSGEのタイムラインを尋ねてきた。ジェミニの水曜日の発表ではSGEについてほとんど触れられず、幹部らは一般公開の計画については曖昧で、「今後1年以内に」ジェミニはSGEに統合されると述べている。

「このモデリングの新時代は、当社がこれまで取り組んできた科学と工学の取り組みの中でも最大のものの一つです」とピチャイ氏は水曜日のブログ投稿で述べた。「ジェミニが世界中の人々にもたらすであろう未来と機会に、私は本当に興奮しています。」

<<:  Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

>>:  Gemini vs ChatGPT: Google の最新 AI と ChatGPT のどちらが優れているのでしょうか?

推薦する

サプライチェーン管理における自動化の重要性

今日のペースが速く競争の激しいビジネス環境において、サプライ チェーン管理は成功に不可欠な要素です。...

...

機械学習のケーススタディ: クレジットカード詐欺検出

私は51CTOアカデミー講師の唐玉迪です。51CTOアカデミーの「4.20 ITリチャージフェスティ...

プログラミングと数学の基礎が乏しい場合、人工知能を始めるにはどうすればよいでしょうか?

1. AI開発の現状1.1 コンセプトWikipedia によると、人工知能とは、人間や他の動物の...

ChatGPT も「逆方向に学習」するのでしょうか?

継続的に学習することで向上していくことは、現代の AI の大きなセールスポイントの 1 つです。しか...

マイクロソフトがAIコンテンツレビューツール「Azure AI Content Safety」を正式にリリース

10月18日、マイクロソフトは健全で調和のとれたコミュニティ環境を作り、写真やテキスト内の偏見、憎悪...

...

人工知能は法曹界に新たな形を与えています。法務テクノロジー企業はどのようにしてクライアントにグローバルなサービスを提供できるのでしょうか?

法務テクノロジーには、弁護士とそのサポートスタッフが顧客に法務サービスを提供するのに役立つソフトウェ...

2019年に注目すべき5つのAIトレンド

2018 年には、機械学習と人工知能に基づくプラットフォーム、ツール、アプリケーションの劇的な成長が...

自然言語処理: コンピュータに人間の言語を理解して処理させる

自然言語処理 (NLP) は、人工知能の分野における重要かつ刺激的なテクノロジーです。その目標は、コ...

機械学習プロジェクトの完全な構築プロセスとタスクリストが公開されており、収集する価値があります。

機械学習プロジェクトの作成というと、データ、モデリング、テストなどを思い浮かべる人がほとんどですが、...

自動運転のための2Dおよび3D視覚認識アルゴリズムについて話す

環境認識は自動運転における最初のリンクであり、車両と環境を結び付けるものです。自動運転システムの全体...

9つの主要テーマ!機械学習アルゴリズム理論に関する面接の質問の要約

[[342976]]機械学習は、強力な理論的側面と実践的側面を備えた技術分野です。機械学習関連の仕事...

Midjourney の最新「拡張イメージ」ゲームプレイ: 高解像度の大ヒット作が 1 時間で直接制作可能!

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...