Gemini はバグ修正が得意です!ウェブビデオを録画してコードライブラリを提供するだけです。ネットユーザーはじっとしていられません。アクセス権が欲しいのです

Gemini はバグ修正が得意です!ウェブビデオを録画してコードライブラリを提供するだけです。ネットユーザーはじっとしていられません。アクセス権が欲しいのです

Google Gemini のバグ修正はネットユーザーの目を開かせた!

X という人物は、Gemini 1.5 Pro をテストするために、Web ページのコードを書くときに意図的に 3 つのバグを残し、それぞれの Web ページのバグのビデオを録画したと話しました。

その後、コード ベースはファイルにパッケージ化され、ビデオとともに Gemini 1.5 Pro に送られ、コード内のすべてのバグを検出して修正し、変更内容の簡単なガイドと説明を提供するように促されました。

予想外に、Gemini 1.5 Pro は数分ですべてのバグを正しく特定し、修正しました。

若者がこの遊び方を投稿した後、人気は上がり続け、ネットユーザーはワンクリックで3回投稿し、リポストやいいね、コレクションの数は1万を超えた。

彼はまた、コメント欄で「これは単なる一例であり、最悪のパフォーマンスとなるだろう」と強調した。ジェミニには明るい未来がある。

一部のネットユーザーは、あることを思い出すと面白いと思ったと語った。Nvidiaの黄院士が以前、「将来、子供たちはプログラミングを学ぶ必要がなくなる」と公に述べたことがあり、当時は多くの人がそれに反対し、「AIはプログラマーに取って代わることはない」と言った。

しかし、いずれにしても、AI がプログラマーに支援を提供できることは明らかです。

次に、Gemini 1.5 Pro でバグがどのように修正されたかを見てみましょう。

イベント

冒頭で述べたように、ネットユーザーはまずウェブページのコードを書く際に故意に次の 3 つの間違いを犯しました。

その結果、Web ページ上のいくつかの機能操作が正常に動作しなくなったため、その男性は、正常に動作していない箇所のビデオを 3 本撮影しました。各ビデオの長さは 10 秒以上です。

その後、ビデオはコード ベースとともに Gemini 1.5 Pro で失われました。

プロンプトは次のとおりです:

コード内のバグを修正します。バグを修正するための簡単なマークダウン ガイドを作成し、実際のコードを記述してバグを修正します。完全な PR のように完全なコードが必要なので、変更を加えます。

その後、Gemini 1.5 Pro は 3 つのバグを即座に正確に特定しました。

  • ToDoをクリックしても完了/未完了としてマークされません
  • テーマスイッチャーでテーマが切り替わらない
  • ログインボタンをクリックしても何もアクションは発生しません

次に、添付のコードとともに、修復ソリューションがそれぞれ示されます。

彼は入力したコードを注意深くチェックし、Gemini 1.5 Pro によって返された答えが正しいことを確認しました。

また、この人物は、これら 3 つのバグは実際にはコード ベース ファイル内で離れた場所にあることを強調しました。つまり、Gemini 1.5 Pro は完全なコンテキストを読み取ったということです。

「アクセス権が必要です」

この一連の操作を見たネットユーザーは興奮して手をこすり合わせ、Gemini 1.5 Proにアクセスしたいと叫んだ。


待つことに加えて、一部のネットユーザーは、コードの修正にGPT-4を使用することも非常に有用であると述べ、GPT-5も想像しました。

次はリアルタイムのインタラクションでしょうか? GPT-5 で画面共有でしょうか?

一方、すでにアクセス権を獲得したネットユーザーたちはすでに楽しい時間を過ごしている。

たとえば、最新の論文 10 件を一度に Gemini 1.5 Pro に入力し、著者の電子メール アドレスを検索するように依頼できます。

その結果、Gemini 1.5 Pro は初めてそれを正常に検出しました。

次に、Gemini 1.5 Pro に、360,000 を超えるトークンを使用して「ハリー・ポッターと不死鳥の騎士団」の全巻から文の話し手を見つけるように依頼したところ、Gemini 1.5 Pro はそれを見事に見つけました。


テストは難易度が上がり続け、一度に3冊の本を入力しました。Gemini 1.5 Proは、約1分でようやく対応するスピーカーを再び見つけました。

驚いたテスターは、Gemini 1.5 Pro の論理的推論能力を次のように要約しました。

通常のプロンプトの場合、GPT-4 のパフォーマンスに近づきます。

しかし、数十の例を追加するにつれて、Gemini のパフォーマンスは際限なく向上しました。複数の例のヒントは、新しい微調整方法になります。

ウォートン・スクールのイーサン・モリック教授もこの楽しみに参加した。 352 ページの「 60 Years in Space」ルールブック、約 250,000 トークンをGemini 1.5 Proに失ってから、役割を果たすように依頼します。

説明が何ページにもわたって非常に複雑だったにもかかわらず、ジェミニは「理解したようだ」。

イーサン・モリック教授は、他のすべての AI はこのテストに失敗し、 Gemini 1.5 Proだけが成功したと述べました。

このネットユーザーは、Xアルゴリズムのコードリポジトリ全体をコンパイルしてGemini 1.5 Proにアップロードしたいと考えており、オンラインでネットユーザーから質問を収集しています。

集計が終わると、合計310,489トークンが集まりました。Dogan Ural氏は、Gemini 1.5 Proに「Twitterで影響力を増減させる上位5つのものは何ですか?」など、ネットユーザーが気になる一連の質問をしました。

Gemini 1.5 Pro は簡単に次の答えを出しました:

<<: 

>>:  LeCun の最新インタビュー: 物理世界が最終的に LLM の「アキレス腱」となるのはなぜでしょうか?

ブログ    

推薦する

AIとインフラストラクチャのゲームチェンジャーが市場で成熟しつつあります。

機械学習が「人間レベル」の能力に到達するには、多くのトレーニング反復とラベル付きデータが必要です。こ...

...

...

中国の人工知能はどれほど強力か?将来ロボットが手術を行えるようになるか?外国人は信じられないと言う

写真は人工知能中国の人工知能はどれほど強力か?将来ロボットが手術を行えるようになるか?多くの中国人は...

...

ChatGPTの愚かさに対する新たな説明: 世界はAIによって変化し、訓練されたときとは異なっている

学術界は、ChatGPT がなぜ愚かになったのかという新たな説明を持っています。カリフォルニア大学サ...

Amazon SageMaker を使用した機械学習モデルのトレーニングとデプロイ

[[248715]] [51CTO.com 速訳] re:Invent 2017 カンファレンスで ...

...

OpenAI、自然言語をコードに翻訳するAIシステムCodexのテストを開始

マイクロソフトなどの企業から強力なサポートを受けて、人工知能のスタートアップ企業であるOpenAIは...

3日間で自己学習したAlphaZeroがAlphaGoに勝利。GitHubの2017年年次レポートは人工知能の人気ぶりを示す!

[[207020]]本日 Nature に発表されたこの重要な論文には、Google の Deep...

人工知能は理想的なサイバー防御手段か?

企業や政府がサイバーセキュリティに対する意識を高め、毎年数十億ドルがこの分野に投資されるようになると...