グーグルは水曜日、AIを収益化する方法に対する回答を求める圧力が高まる中、同社がこれまでで最も強力だと考える人工知能モデルを発表した。 大規模言語モデル Gemini には、最大かつ最も強力なカテゴリである Gemini Ultra、さまざまなタスクに拡張可能な Gemini Pro、特定のタスクやモバイル デバイスで使用される Gemini Nano の 3 つの異なるキットが含まれます。 同社は現在、Google Cloud を通じて顧客に Gemini のライセンスを供与し、顧客独自のアプリケーションで使用してもらうことを計画している。 12 月 13 日より、開発者および企業顧客は、Google AI Studio または Google Cloud Vertex AI の Gemini API を通じて Gemini Pro にアクセスできるようになります。 Android 開発者も Gemini Nano を使用してビルドできるようになります。 Gemini は、Bard チャットボットや、会話形式のテキストで検索クエリに回答する Search Generated Experience などの Google 製品にも使用される予定です (SGE はまだ広く利用可能ではありません)。 企業は、チャットボットや製品の推奨を通じてより高度な顧客サービスを提供したり、製品の宣伝を希望する企業のトレンドを特定したりするためにこれを使用できます。 Gemini は、企業がマーケティング キャンペーンやブログ コンテンツを作成したい場合のコンテンツ作成や、会議の要約や開発者向けのコード生成を行う生産性向上アプリにも使用できます。 同社は、ジェミニがグラフのスクリーンショットを撮り、何百ページもの研究レポートを分析してグラフを更新できることを示す例や、ある人の数学の宿題の写真を分析して正解を見つけ、間違った答えを指摘する例など、いくつかの例を示した。 ジェミニ・ウルトラは、数学、物理学、歴史、法律、医学、倫理学など57の科目を組み合わせて世界知識と問題解決能力をテストする大規模マルチタスク言語理解(MMLU)において人間の専門家を上回る成績を収めた初のモデルであると、同社は水曜日のブログ投稿で発表した。複雑な内容のニュアンスや論理的思考を理解できると言われています。 「ジェミニは、Google Researchの同僚を含むGoogle全体の大規模なコラボレーションの成果です」とGoogle CEOのサンダー・ピチャイ氏は水曜日のブログ投稿で述べた。「最初からマルチモーダルであり、テキスト、コード、音声、画像、動画など、さまざまな種類の情報を一般化し、シームレスに理解、操作、組み合わせることができることを意味します。」 本日より、Google のチャットボット Bard は、高度な推論、計画、理解、その他の機能を支援するために Gemini Pro を使用します。同社幹部は火曜日の記者との電話会議で、来年初めにジェミニ・ウルトラを採用した「バード・アドバンスト」を発売する予定だと語った。 このアップデートは、検索大手の Google が初めて Bard をリリースしてから 8 か月後、OpenAI が GPT-3.5 上で ChatGPT をリリースしてから 1 年後に行われました。 3月に、アルトマン氏が率いるスタートアップはGPT-4を立ち上げた。幹部らは火曜日、ジェミニ・プロはGPT-3.5よりも性能が優れていると述べたが、GPT-4と比べるとどうなのかという質問には答えなかった。 しかし、Googleが水曜日に発表したホワイトペーパーによると、GeminiのUltraモデルはいくつかのベンチマークでGPT-4を上回ったという。 Google が Bard Advanced へのアクセスを有料化する計画があるかどうか尋ねられたとき、Google Bard ゼネラルマネージャーの Sissie Hsiao 氏は、Google は優れたエクスペリエンスを生み出すことに注力しており、収益化に関する詳細はまだないと述べた。 記者会見で、現世代のLLMと比べてGeminiには何か新しい機能があるかと尋ねられたとき、Google DeepMindの製品担当副社長であるEli Collins氏は「あると思います」と答えたが、同社はまだGemini Ultraaの新しい機能の理解に取り組んでいるところだ。 Google は、準備が整っていないため Gemini のリリースを延期したと報じられており、今年初めに同社が AI ツールの展開に苦戦していたことを思い出すことになる。 複数の記者が遅延について質問したところ、コリンズ氏は、より高度なモデルのテストには時間がかかると答えた。コリンズ氏は、ジェミニは同社がこれまでに構築したAIモデルの中で最も厳密にテストされたものであり、グーグルのモデルの中で「最も包括的な安全性評価」を受けていると述べた。 ジェミニ・ウルトラは最大モデルであるにもかかわらず、メンテナンス費用がはるかに安いとコリンズ氏は言う。 「能力が高まっただけでなく、効率も向上しました」と同氏は言う。「ジェミニを訓練するにはまだ多くのコンピューターが必要ですが、これらのモデルを訓練する能力はより効率的になってきています。」 コリンズ氏は、同社がこのモデルについての詳細を記載した技術白書を水曜日に発表する予定だが、円周数は公表しないと述べた。今年初め、ジャーナリストたちは、当時最新だった Google の AI モデル「Palm 2 Large Language Model」が、その前身である LLM のほぼ 5 倍の量のテキスト データでトレーニングされていることを発見しました。 また、水曜日にGoogleはAIモデルのトレーニング用次世代Tensor Processing Unitを発表した。グーグルは、セールスフォースと新興企業のライトリックス社が、2021年に発表されたTPU v4よりも優れた価格性能比を提供するTPU v5pチップの使用を開始したと述べたが、市場リーダーのエヌビディアと比較したパフォーマンスに関する情報は提供しなかった。 10月に行われたグーグルの第3四半期の決算発表の際、投資家らは同社がAIをいかにして実際の利益につなげていくのかについて幹部らにさらなる質問をぶつけた。 Google は 8 月に Search Generative Experiences (SGE) と呼ばれる初期の実験を開始しました。これは、検索エンジンを使用する際に GenAI エクスペリエンスがどのようなものになるかをユーザーが確認できるようにするものです。検索は依然として同社の主要な収益源であり、結果はチャットボットの時代を反映してより会話形式になっていますが、まだ実験段階と考えられており、一般には公開されていません。 ジェミニが5月に年次開発者会議「Google I/O」で初めてこの実験を発表して以来、投資家らはSGEのタイムラインを尋ねてきた。ジェミニの水曜日の発表ではSGEについてほとんど触れられず、幹部らは一般公開の計画については曖昧で、「今後1年以内に」ジェミニはSGEに統合されると述べている。 「このモデリングの新時代は、当社がこれまで取り組んできた科学と工学の取り組みの中でも最大のものの一つです」とピチャイ氏は水曜日のブログ投稿で述べた。「ジェミニが世界中の人々にもたらすであろう未来と機会に、私は本当に興奮しています。」 |
<<: Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作
>>: Gemini vs ChatGPT: Google の最新 AI と ChatGPT のどちらが優れているのでしょうか?
[[253678]] [51CTO.com クイック翻訳] 機械学習 (ML) は、パターンを識別...
データ ガバナンスと AI 疲労は 2 つの異なる概念のように聞こえるかもしれませんが、この 2 つ...
AI の急速な発展は多くの人々の学習意欲をかき立てていますが、初心者にとっては大量の手動プログラミン...
商業的な AI の成功のほとんどは、教師あり機械学習 (ML) に関連しています。たとえば、スマート...
以下の記事では、主にハッカーがGSMアルゴリズムをクラックし、携帯電話ユーザーが盗聴の危険にさらされ...
現在、あらゆるToB市場において、5G+AIが並行して未来を創造しています。 [[331677]] ...
先日蘇州で開催された中国人工知能産業2020年年次大会で発表された「2020年中国人工知能発展報告書...
「中関村スマート人工知能パートナープログラム」(以下、プログラム)の登録は2021年3月1日に正式に...
[[272732]] ▲ 図:アレン細胞科学研究所のコンピュータービジョン研究者、グレッグ・ジョンソ...
都市から農村まで、わが国の宅配便や電子商取引企業がドローン物流と配達に注力したことで、国産ドローンの...