Googleの「反撃」が来た! ジェミニはソラに脚光を奪われましたが、今は再び脚光を浴びているようです。 最新のテストでは、Gemini 1.5 は、Sora ビデオが AI によって生成されたかどうかを分析できます。 重要な要素を直接的に伝えるタイプです。 たとえば、この古典的な猫のビデオでは、ジェミニ 1.5 は次のように言っています。
この生成されたビデオでは、ジェミニ1.5が詐欺の詳細をすべて伝えています〜 魔法は魔法に勝つと言われますが、ソラがリリースされてからわずか数日後、ジェミニ 1.5 にすぐに「追いつかれ」ました。 ジェミニ 1.5 の第一波のテスト結果について、ネットユーザーは「これは恐ろしく良い」と述べ、これを「ゲームチェンジャー」と呼んだ。 ジェミニ1.5テストの第一波が到来突然リリースされたGeminiバージョン1.5ですが、反対側のSoraに隠れてしまいました。 しかし、それでも、モデルのパフォーマンスの大幅な向上、特に100万トークンのコンテキストウィンドウのサポートは、ネットユーザーに依然として感銘を与えました。 現在、一部のブロガーが徐々にアクセス資格を取得し、実際のテストの第一波を開始しています。 生成されたビデオが本物か偽物かを識別できることに加えて、次のような優れた機能もあります。 1. 長い動画を分解して理解する。 たとえば、14 分間の NBA ダンク ビデオでは、Gemini 1.5 はどのダンクのスコアが最も高いかを判断し、そのダンクの詳細を提供できます。 応答プロセス全体にかかる時間はわずか約 55 秒です。 2. 長い文章の内容を理解し、比較分析を行う。 ブロガーは、合計で約10万トークン相当の映画「インターステラー」と「アド・アストラ」の2本の完全な脚本を提出し、ジェミニ1.5にそれらを分析して比較し、どちらの映画を見るか決めるよう依頼した。 わずか 30 秒強で、完全かつ詳細な分析レポートが提供されます。 この観点から見ると、プロットやセリフを分析するのは子供の遊びのように思えます。 (映画の中で最も感動的な名言を3つ分析してください) 3. 少数言語に翻訳する。 英語をサトラン語に翻訳するなど、約2,000人しか話さない言語でも扱うことができます。 さらに、論文内の表を分析して理解するといった詳細もあります。 ネットユーザーはこの一連の実際のテストに驚嘆し、これは大きな改善であり、GPT-5 がこれに対抗するまで待たなければならないかもしれないと考えている。 特に、100 万トークンのコンテキストを処理できるため、GenAI スタートアップにとって非常に便利です。 一部のネットユーザーは、Google がコンテキスト ウィンドウのサイズ問題をどのように解決するのかについても興味を持っています。
ネットユーザー:偶然ではないだろうしかし、OpenAI側からはまだGoogleの「反撃」に反応した者はいない。以前、Sora がリリースされたとき、Google からコメントを寄せる人はほとんどいませんでした。 しかし、両社は同じ日に発表をしており、ネットユーザーたちは長い間、次のような想像を膨らませてきた。
一部のネットユーザーは、ソラの発表は明らかにマーケティング上の動きであり、まだ準備ができていないと考えている。それに比べると、Gemini 1.5 はまさに画期的な製品です。 しかし、ソラこそが本当のサプライズだと考える人もいます。 Gemini 1.5 はかなり良いですが、驚くほどではありません。 OpenAI も内部に 100 万を超えるモデルを持っていると確信しています。 (Sora はサイドプロジェクトです)。 そして、GPT-5 が登場すれば、すべての競合製品を打ち負かすだろうと考えられています。 これら2つの操作についてどう思いますか? もう一つ両社は激しい戦いを繰り広げており、痛手を負うのはAdobeのような注目を浴びていない企業だ。 ここ2日間、株価は何度も下落しています... 以前から注目を集めているビデオ生成会社Runwayの共同創設者は、次のように答えた。 「ゲームが始まった」 。 今回の国内の反応はChatGPTのそれとは少し異なる点が特筆に値します。 ソラが出てきた後は、反対する人も減って、前よりも静かになりました… |
<<: OpenAIの従業員が996の勤務スケジュールを公開、ネットユーザー「本当の競争は強制する必要はない」
>>: 20 分で回路基板の組み立て方を学びましょう!オープンソースのSERLフレームワークは、精密制御において100%の成功率を誇り、人間の3倍の速さです。
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
人工知能は画期的であり、時には衝撃的です。私たちは、効率性、自動化、スマートな予測に関する素晴らしい...
01 ROS入門多くの初心者は、ロボットのオペレーティングシステムと聞いて、「オペレーティングシス...
AI Index は、人工知能の現状に関する詳細な年次レポートです。自律システム、研究開発、AI の...
ニューヨーク市警察は、その「ユートピア的」技術に対する激しい批判を受け、米国企業ボストン・ダイナミク...
清華大学金融学科教授の李道奥氏は、ハーバード大学で経済学の博士号を取得。スタンフォード大学フーバー研...
2019年は確かに忙しい年でした。人工知能に関する進歩やニュースが頻繁に報道されるにつれ、私たちの...
人工知能ベンチマーク組織 MLCommons は、人工知能安全性 (AIS) ワーキング グループの...
電子コンピューティングと比較すると、光コンピューティングは高速、高帯域幅、低消費電力という利点があり...
今日、産業用ロボットはほぼすべての産業で使用されています。これらは製造施設に数多くのメリットをもたら...
途中で迷うと、モデルは怠惰になり、コンテキストが長くなるほど、モデルは愚かになります... LLM ...
Java の文字の組み合わせソートは、特に難しい問題ではありません。ブルートフォースとグラフ理論 (...
私たちが通常、論文や科学文献を読むときに目にするファイル形式は、基本的に PDF (Portable...
AIoTとは何でしょうか?多くの人にとって「AI+IoT」が答えになると信じています。昨年初めから...