Gemini 1.5 ハンズオンレビュー: Sora は偽物に見えるが、もっと素晴らしい機能がある

Gemini 1.5 ハンズオンレビュー: Sora は偽物に見えるが、もっと素晴らしい機能がある

Googleの「反撃」が来た!

ジェミニはソラに脚光を奪われましたが、今は再び脚光を浴びているようです。

最新のテストでは、Gemini 1.5 は、Sora ビデオが AI によって生成されたかどうかを分析できます。

重要な要素を直接的に伝えるタイプです。

たとえば、この古典的な猫のビデオでは、ジェミニ 1.5 は次のように言っています。

その目も毛も本物には見えませんでした。

この生成されたビデオでは、ジェミニ1.5が詐欺の詳細をすべて伝えています〜

魔法は魔法に勝つと言われますが、ソラがリリースされてからわずか数日後、ジェミニ 1.5 にすぐに「追いつかれ」ました。

ジェミニ 1.5 の第一波のテスト結果について、ネットユーザーは「これは恐ろしく良い」と述べ、これを「ゲームチェンジャー」と呼んだ。


ジェミニ1.5テストの第一波が到来

突然リリースされたGeminiバージョン1.5ですが、反対側のSoraに隠れてしまいました。

しかし、それでも、モデルのパフォーマンスの大幅な向上、特に100万トークンのコンテキストウィンドウのサポートは、ネットユーザーに依然として感銘を与えました。

現在、一部のブロガーが徐々にアクセス資格を取得し、実際のテストの第一波を開始しています。

生成されたビデオが本物か偽物かを識別できることに加えて、次のような優れた機能もあります。

1. 長い動画を分解して理解する

たとえば、14 分間の NBA ダンク ビデオでは、Gemini 1.5 はどのダンクのスコアが最も高いかを判断し、そのダンクの詳細を提供できます。

応答プロセス全体にかかる時間はわずか約 55 秒です。

2. 長い文章の内容を理解し、比較分析を行う

ブロガーは、合計で約10万トークン相当の映画「インターステラー」と「アド・アストラ」の2本の完全な脚本を提出し、ジェミニ1.5にそれらを分析して比較し、どちらの映画を見るか決めるよう依頼した。

わずか 30 秒強で、完全かつ詳細な分析レポートが提供されます。

この観点から見ると、プロットやセリフを分析するのは子供の遊びのように思えます。

(映画の中で最も感動的な名言を3つ分析してください)

3. 少数言語に翻訳する

英語をサトラン語に翻訳するなど、約2,000人しか話さない言語でも扱うことができます。

さらに、論文内の表を分析して理解するといった詳細もあります。

ネットユーザーはこの一連の実際のテストに驚嘆し、これは大きな改善であり、GPT-5 がこれに対抗するまで待たなければならないかもしれないと考えている。


特に、100 万トークンのコンテキストを処理できるため、GenAI スタートアップにとって非常に便利です。

一部のネットユーザーは、Google がコンテキスト ウィンドウのサイズ問題をどのように解決するのかについても興味を持っています。

何か新しいことが発見されたり達成されたりしたに違いありません。


ネットユーザー:偶然ではないだろう

しかし、OpenAI側からはまだGoogleの「反撃」に反応した者はいない。以前、Sora がリリースされたとき、Google からコメントを寄せる人はほとんどいませんでした。

しかし、両社は同じ日に発表をしており、ネットユーザーたちは長い間、次のような想像を膨らませてきた。

それは偶然である可能性は低いです

アルトマン氏は、Google を宣伝する絶好の機会を逃したくなかった。

一部のネットユーザーは、ソラの発表は明らかにマーケティング上の動きであり、まだ準備ができていないと考えている。それに比べると、Gemini 1.5 はまさに画期的な製品です。

しかし、ソラこそが本当のサプライズだと考える人もいます。

Gemini 1.5 はかなり良いですが、驚くほどではありません。

OpenAI も内部に 100 万を超えるモデルを持っていると確信しています。 (Sora はサイドプロジェクトです)。

そして、GPT-5 が登場すれば、すべての競合製品を打ち負かすだろうと考えられています。

これら2つの操作についてどう思いますか?

もう一つ

両社は激しい戦いを繰り広げており、痛手を負うのはAdobeのような注目を浴びていない企業だ。

ここ2日間、株価は何度も下落しています...

以前から注目を集めているビデオ生成会社Runwayの共同創設者は、次のように答えた。 「ゲームが始まった」

今回の国内の反応はChatGPTのそれとは少し異なる点が特筆に値します。

ソラが出てきた後は、反対する人も減って、前よりも静かになりました…

<<:  OpenAIの従業員が996の勤務スケジュールを公開、ネットユーザー「本当の競争は強制する必要はない」

>>:  20 分で回路基板の組み立て方を学びましょう!オープンソースのSERLフレームワークは、精密制御において100%の成功率を誇り、人間の3倍の速さです。

推薦する

世界を席巻しているトップ10のプログラミングアルゴリズムを鑑賞しましょう

[[121078]]アルゴリズムは今日の私たちの生活にとって非常に重要なので、いくら強調してもし過ぎ...

...

Appleのアプリランキングアルゴリズム調整の裏側:ランキング管理企業が一夜にして沈黙

4月1日早朝のニュース:3月初旬から、AppleはAppランキングアルゴリズムを徐々に調整し、ランキ...

IoTとAIの組み合わせがもたらす大きなチャンス

食器洗い機がどれくらいの時間稼働するか知っていますか? 多くの人はおそらく退屈だと言うでしょう。この...

今年の主要リリース: 人工知能開発レポート 2020

過去10年間で、人工知能は研究室から工業生産へと移行し、従来の産業モデルを再構築し未来をリードする価...

コンピュータービジョンは建設業界をどのように変えているのでしょうか?

コンピュータービジョンは建設業界をどのように変えているのでしょうか?建設作業員は毎日、監視と監督を必...

事前トレーニング後、パフォーマンスが悪化します。自己トレーニングは事前トレーニングに取って代わるものでしょうか?

2018年末には、FAIRの研究者らが「ImageNetの事前トレーニングの再考」と題する論文を発...

...

アメリカン・エキスプレスはAIを活用して不正行為を検出し、セキュリティを強化

アメリカン・エキスプレスは長年にわたり、人工知能と認知技術のリーダーとして活躍してきました。大規模で...

なぜRLの一般化は難しいのか:バークレーの博士が認知POMDPと暗黙の部分観測性から説明する

[[437395]]今日の強化学習 (RL) には、収束性が低いなど多くの問題があります。比較的弱い...

このアルゴリズムチームは 2020 年に何をしましたか?

[[383980]]冒頭に書いた私自身、毎年まとめを書く習慣があります。2020年は、私の職務が垂...

...

クラウド、持続可能性、デジタル導入 - 2022 年のアジア太平洋地域の技術予測

フォレスターのアジア太平洋地域における 2022 年の予測によると、地域特有の圧力により、どこからで...

...

エスティローダーはAI/AR技術を活用してメイクアップをより洗練させ、近視の人がメイクアップがうまくできないことを心配する必要がなくなる

この化粧品大手は、視覚障害者が簡単に化粧を行えるよう、AIと拡張現実(AR)技術を活用した音声対応の...