12月8日のニュース、今週の水曜日、Googleは最新の人工知能モデルGeminiをリリースしました。 Google は、このモデルが一連の知能テストにおいて OpenAI の GPT-4 モデルや「熟練した」人間よりも優れていると主張しているが、技術的な指標の点では、Gemini は OpenAI の 8 か月前に発表された GPT-4 モデルよりわずかに優れているだけだ。 上記のニュースを受けて、グーグルの株価は木曜日の米国株式市場の終値で5.31%上昇して136.93ドルとなり、時価総額は1兆7000億ドルとなった。 1年前、GoogleはOpenAIのチャットボットChatGPTに不意を突かれ、それ以来、人工知能における自社の急速な進歩を描写することに熱心だった。グーグルは水曜日、手品のトリックを見破り、会計認定試験で好成績を収めることができる「ジェミニ」という新しい人工知能モデルを予定より早く突然リリースした。 Googleが公開したデモ動画もSNSで話題を呼んだが、技術的な観点から見ると、GoogleはまだOpenAIに追いついている段階だ。 Google Gemini と OpenAI のトップモデル GPT-4 のパフォーマンス比較から判断すると、Google の最も強力な Gemini Ultra は、高校物理学、専門的な法的テスト、倫理的なシナリオなどのほとんどのベンチマークテストで GPT-4 を上回っています。覚えておいてください、現在の AI 競争はこれらの機能によってほぼ完全に定義されます。 しかし、ほとんどのベンチマークでは、Gemini Ultra は GPT-4 を数パーセントしか上回りません。言い換えれば、Google のいわゆるトップ AI モデルは、少なくとも 1 年前に OpenAI が完成させた成果に比べてわずかに改善されただけのものである。 Google の言うとおり Gemini Ultra が 1 月初旬にリリースされた場合、トップ AI モデルのリストのトップに長く留まることはできないかもしれません。 Google が OpenAI に追いつこうと努力する中、OpenAI には次世代の人工知能モデル GPT-5 を開発するのにほぼ 1 年の期間がある。 Google が Social Media X に投稿したデモ ビデオは、一見すると印象的です。 Google の AI モデルは、プラスチックのカップの下の紙のボールを追跡したり、画像の輪郭を描く前にそれがカニであると推測したりすることができ、Google の DeepMind AI ラボで長年にわたり訓練されてきた強力な推論能力を実証しています。これは他の AI モデルにはない機能です。しかし、ビデオで紹介されている他の機能の多くは Google 独自のものではありません。ChatGPT Plus3 でも同様の機能があり、ウォートン大学のイーサン・モリック教授が実験的に実証しています。 さらに、Googleはデモ動画が編集されていたことも認めた。 「このデモを実現するために、レイテンシを減らし、ジェミニの出力を圧縮しました」と同社はビデオの説明で述べている。つまり、モデルが応答するのにかかる時間は、実際にはビデオに示されている時間よりも長くなるということだ。 実際、デモンストレーションはリアルタイムではなく、音声による対話では完了しませんでした。グーグルの広報担当者は、このビデオは「ビデオの静止画像フレームとテキストを使用して作成された」と述べた。ジェスチャー、絵、または他のオブジェクトの写真を通じて、他のユーザーが Gemini と対話する方法を紹介する Web サイトがあります。つまり、デモ ビデオの音声は、Gemini に与えられた人工的なプロンプトを説明しているだけであり、Gemini の出力は依然として静止画像のままです。これは、人間が Gemini と流暢に会話でき、モデルが周囲の世界をリアルタイムで観察して反応できるという Google の示唆と矛盾しているように思われます。 また、デモンストレーションビデオでは、展示されているモデルがジェミニ ウルトラ人工知能モデルであることも明記されていませんでした。詳細から、Google はマーケティング活動に力を入れており、同社が世界最大級の AI 研究チームを擁し、他のどの企業よりも多くのデータにアクセスできることを人々に覚えてもらいたいと考えていることがうかがえる。 Googleは水曜日に実施したように、Chrome、Android、Pixelスマートフォンのエンドデバイス向けにGeminiモデルをリリースし、同社の展開ネットワークがいかに大規模であるかを人々に思い出させたいと考えている。 しかし、テクノロジー業界では、どこにでもあることが必ずしも見た目ほど有利であるとは限りません。初期の携帯電話大手 Nokia (および BlackBerry) は、Apple がより高性能で直感的な iPhone で自社の市場シェアを奪ったことで、このことを痛感しました。ソフトウェアの世界では、商業的な成功は多くの場合、最高のパフォーマンスを発揮するシステムから生まれます。 Google のこの動きは、OpenAI の最近の混乱を利用しようとする試みであることはほぼ間違いない。 OpenAIの取締役会がCEOのサム・アルトマン氏を一時的に解任したと報じられ、同社の将来が危ぶまれる中、GoogleはすぐにOpenAIの法人顧客にGoogleに乗り換えるよう説得するマーケティングキャンペーンを開始した。現在、Gemini のリリースにより、Google はその不確実性を利用しようとしているようです。 しかし、このデモの効果は限られていた。 Google はこれまでにも新しいテクノロジーを披露してきましたが、何も進展しませんでした。これまでのところ、Google の広大な組織構造と階層化された製品マネージャー体制により、OpenAI ほど機敏に製品をリリースすることができていない。社会が人工知能の変革的影響に取り組む中、Google の最新の動きは悪いことではないが、その有効性はまだ分からない。確かに、Google はまだ追いついている最中です。 |
<<: すべての AI エンジニアが知っておくべき AI ツールとフレームワークのトップ 10
C# アルゴリズムは張さんの誕生日問題をどのように実装するのでしょうか?まず、張さんの誕生日に関する...
モデルの組み合わせ (ブースティング、バギングなど) と決定木に関連するアルゴリズムは多数あります。...
近年、大手テクノロジー企業は人工知能と機械学習の研究に力を入れています。その中でも、Googleはこ...
[[243197]]人工知能とは何ですか?人工知能の定義は、「人工知能」と「知能」の 2 つの部分に...
人工知能を使って患者の死期を予測するというのは、ディストピアSFシリーズ『ブラック・ミラー』のような...
1. 機械学習の定義機械学習はコンピュータサイエンスのサブフィールドであり、人工知能の分野および実装...
人工知能(AI)が社会に普及するにつれ、サイバーセキュリティの分野にも参入してきました。 AI は、...
[[408373]]この記事では主に機械学習 (ML) と機能的磁気共鳴画像法 (fMRI) の応用...
GPT-4V はすでに、Web サイトのコード設計やブラウザの制御に役立っています。これらのアプリケ...
ドローンは最近ますます人気が高まっています。高解像度カメラ付きの機械を数百ドルで購入することもできま...
科学研究の分野で働く人なら、P/NP 問題についてはある程度聞いたことがあるでしょう。この問題は、ク...
[[425546]]エリック・ルセロ博士最近、Google Quantum AIのチーフエンジニアで...