12月8日のニュース、今週の水曜日、Googleは最新の人工知能モデルGeminiをリリースしました。 Google は、このモデルが一連の知能テストにおいて OpenAI の GPT-4 モデルや「熟練した」人間よりも優れていると主張しているが、技術的な指標の点では、Gemini は OpenAI の 8 か月前に発表された GPT-4 モデルよりわずかに優れているだけだ。 上記のニュースを受けて、グーグルの株価は木曜日の米国株式市場の終値で5.31%上昇して136.93ドルとなり、時価総額は1兆7000億ドルとなった。 1年前、GoogleはOpenAIのチャットボットChatGPTに不意を突かれ、それ以来、人工知能における自社の急速な進歩を描写することに熱心だった。グーグルは水曜日、手品のトリックを見破り、会計認定試験で好成績を収めることができる「ジェミニ」という新しい人工知能モデルを予定より早く突然リリースした。 Googleが公開したデモ動画もSNSで話題を呼んだが、技術的な観点から見ると、GoogleはまだOpenAIに追いついている段階だ。 Google Gemini と OpenAI のトップモデル GPT-4 のパフォーマンス比較から判断すると、Google の最も強力な Gemini Ultra は、高校物理学、専門的な法的テスト、倫理的なシナリオなどのほとんどのベンチマークテストで GPT-4 を上回っています。覚えておいてください、現在の AI 競争はこれらの機能によってほぼ完全に定義されます。 しかし、ほとんどのベンチマークでは、Gemini Ultra は GPT-4 を数パーセントしか上回りません。言い換えれば、Google のいわゆるトップ AI モデルは、少なくとも 1 年前に OpenAI が完成させた成果に比べてわずかに改善されただけのものである。 Google の言うとおり Gemini Ultra が 1 月初旬にリリースされた場合、トップ AI モデルのリストのトップに長く留まることはできないかもしれません。 Google が OpenAI に追いつこうと努力する中、OpenAI には次世代の人工知能モデル GPT-5 を開発するのにほぼ 1 年の期間がある。 Google が Social Media X に投稿したデモ ビデオは、一見すると印象的です。 Google の AI モデルは、プラスチックのカップの下の紙のボールを追跡したり、画像の輪郭を描く前にそれがカニであると推測したりすることができ、Google の DeepMind AI ラボで長年にわたり訓練されてきた強力な推論能力を実証しています。これは他の AI モデルにはない機能です。しかし、ビデオで紹介されている他の機能の多くは Google 独自のものではありません。ChatGPT Plus3 でも同様の機能があり、ウォートン大学のイーサン・モリック教授が実験的に実証しています。 さらに、Googleはデモ動画が編集されていたことも認めた。 「このデモを実現するために、レイテンシを減らし、ジェミニの出力を圧縮しました」と同社はビデオの説明で述べている。つまり、モデルが応答するのにかかる時間は、実際にはビデオに示されている時間よりも長くなるということだ。 実際、デモンストレーションはリアルタイムではなく、音声による対話では完了しませんでした。グーグルの広報担当者は、このビデオは「ビデオの静止画像フレームとテキストを使用して作成された」と述べた。ジェスチャー、絵、または他のオブジェクトの写真を通じて、他のユーザーが Gemini と対話する方法を紹介する Web サイトがあります。つまり、デモ ビデオの音声は、Gemini に与えられた人工的なプロンプトを説明しているだけであり、Gemini の出力は依然として静止画像のままです。これは、人間が Gemini と流暢に会話でき、モデルが周囲の世界をリアルタイムで観察して反応できるという Google の示唆と矛盾しているように思われます。 また、デモンストレーションビデオでは、展示されているモデルがジェミニ ウルトラ人工知能モデルであることも明記されていませんでした。詳細から、Google はマーケティング活動に力を入れており、同社が世界最大級の AI 研究チームを擁し、他のどの企業よりも多くのデータにアクセスできることを人々に覚えてもらいたいと考えていることがうかがえる。 Googleは水曜日に実施したように、Chrome、Android、Pixelスマートフォンのエンドデバイス向けにGeminiモデルをリリースし、同社の展開ネットワークがいかに大規模であるかを人々に思い出させたいと考えている。 しかし、テクノロジー業界では、どこにでもあることが必ずしも見た目ほど有利であるとは限りません。初期の携帯電話大手 Nokia (および BlackBerry) は、Apple がより高性能で直感的な iPhone で自社の市場シェアを奪ったことで、このことを痛感しました。ソフトウェアの世界では、商業的な成功は多くの場合、最高のパフォーマンスを発揮するシステムから生まれます。 Google のこの動きは、OpenAI の最近の混乱を利用しようとする試みであることはほぼ間違いない。 OpenAIの取締役会がCEOのサム・アルトマン氏を一時的に解任したと報じられ、同社の将来が危ぶまれる中、GoogleはすぐにOpenAIの法人顧客にGoogleに乗り換えるよう説得するマーケティングキャンペーンを開始した。現在、Gemini のリリースにより、Google はその不確実性を利用しようとしているようです。 しかし、このデモの効果は限られていた。 Google はこれまでにも新しいテクノロジーを披露してきましたが、何も進展しませんでした。これまでのところ、Google の広大な組織構造と階層化された製品マネージャー体制により、OpenAI ほど機敏に製品をリリースすることができていない。社会が人工知能の変革的影響に取り組む中、Google の最新の動きは悪いことではないが、その有効性はまだ分からない。確かに、Google はまだ追いついている最中です。 |
<<: すべての AI エンジニアが知っておくべき AI ツールとフレームワークのトップ 10
Google サービスには 20 億行のコードが含まれており、自動車システムには 1 億行のコードが...
[51CTO.com からのオリジナル記事] 自動車業界における人工知能の応用を考えるとき、最初に思...
「私はAIと関係を築きました。」 一夜にして、Google のエンジニアであるブレイク・ルモワンは、...
[[206421]]国慶節の連休中の数日間、河南省では新たなテクノロジードラマが繰り広げられた。コン...
Stability AI は、プログラミング用の最初の生成 LLM AI 製品である StableC...
過去 10 年間で、ディープラーニングの分野では多くの高度な新しいアルゴリズムと画期的な研究が登場し...
[[411760]] Vol.1 背景ドローンの開発は大きな技術的進歩です。ドローンは、娯楽や商業用...
翻訳者 | イェ・ウェイミンレビュー | Chonglou効率、コードの品質、生産性はすべてプログラ...
人工知能の進歩は前例のない機会をもたらすと同時に、経済的、政治的、社会的混乱ももたらします。専門家は...
[[343105]] [51CTO.com クイック翻訳] サイバー脅威の複雑さと数は時代とともに進...
この不況は、私たちがこれまで経験したどの不況よりも深刻で、突然のものである。私たちは皆、嵐がすぐに過...
一方で感染症の予防と抑制、他方で春節の旅行ラッシュの帰省があり、今年の仕事再開への道のりは異例のもの...
AI の実装は一度で終わるものではなく、幅広い戦略と継続的な調整のプロセスが必要です。ここでは、AI...