バードがグーグル一家を爆破！歴史上初めて、大規模なモデルが自己検査のためにオンラインで公開され、電子メール、地図、文書、ビデオがすべて利用可能になりました。

バード家のバケツがついに登場！

Bard は今年 3 月にリリースされ、6 か月後、ようやく独自のプラグインエコシステムを実現しました。豊富な Google アプリケーション API を呼び出して複雑な操作を実行できます。

今後、Bard は、Gmail、ドキュメント、ドライブ、Google マップ、Youtube、Google フライトなどのアプリケーションなど、毎日使用する Google ツールを開いて、そこから必要な情報を検索できるようになります。

必要な情報が複数のアプリケーションやサービスに分散している場合でも、Bard を使用するとすぐに統合できます。

つまり、Google 製品を深く使用すればするほど、Bard の可能性は高まります。

大型モデルの開発に伴い、国内メーカーとGoogleなどの大手企業の両方がアプリケーションエコロジーの方向へ動き始めました。

ファミリーバケットアシスタント

たとえば、グランドキャニオンに行きたい場合、このアクティビティをうまく計画するには非常に詳細な情報が必要です。

そしてバードはその魔法の機能を果たすことができる——

Gmail からのメッセージを読み取り、全員にとって都合の良い日付を選択します。

次に、リアルタイムのフライト情報とホテル情報を検索し、Google マップで空港までの道順を取得します。

YouTube ビデオをいくつか視聴してグランドキャニオンのガイドを作成するのにも役立ちます。

これらのタスクはすべて、Bard による 1 回の会話で完了します。

あるいは、新しい仕事を探していて履歴書を書く必要がある場合は、次のように Bard に指示することができます。

「ドライブから、2023 年 6 月の履歴書を見つけて、短い自己紹介文にまとめてください。」

このようにして、Bard は新しい履歴書の完成をお手伝いします。

「アレックスとの最近のメールのやり取りに基づいて、ビジネス協力計画を作成し、Gmail 経由でアレックスに送信するのを手伝ってください。」

「パリとその周辺のいくつかの都市について先ほど検索した情報に基づいて、旅行ガイドをデザインし、Google ドキュメントに保存してください。」

「議事録に記載されている自分に関する情報はすべて Google Keep に保存しています。」

…

バードがあなたのためにできることはたくさんあります。そのアイデアは Notion AI に多少似ていますが、後者はさまざまなデータベース内のデータを呼び出すことができません。

ご存知のとおり、データは現在最も不足しているリソースです。

OpenAI と比較すると、Bard の自然な利点は、より多くのデータとアプリケーションです。

今後、Bard はインターネットの検索履歴、閲覧したビデオ、電子メール、ドキュメント、地図に自動的にアクセスし、最も必要な情報を要約できるようになります。

「プライバシーはどうなるの？」と心配する人もいるかもしれません。

これに対し、Googleは、拡張機能をどのように使用するかはユーザーが決めることであり、これらの機能はいつでもオフにできると述べた。

Workspace 拡張機能の使用を選択した場合、人間のレビュー担当者は Gmail、ドキュメント、クラウドドライブの内容を表示できず、Bard はこのデータを読み取って広告を表示したりモデルをトレーニングしたりすることもできなくなります。

「Googleで検索」してエラーをチェックする

さらに、バードは間違いを犯す可能性があることを積極的に認めた歴史上初のモデルでもあります。

今回、バード氏は「Google It」ボタンを更新し、自ら「再確認」できるようにした。

1 回のクリックで、Bard は自動的に返信をチェックし、あなたが言ったことに根拠があるかどうか、インターネット上の対応するコンテンツでそれを確認できるかどうかを確認します。

バード氏は、緑色でマークされた発言について非常に自信を持っている。なぜなら、Google で検索すれば、それを裏付けるコンテンツを見つけることができるからだ。

オレンジ色にマークされている場合、バードは間違いを犯したことを認めます。インターネットで見つかった情報に基づいて、彼は確かにナンセンスな話をするという間違いを犯したことを知ることができます。

また、誰かが共有リンクを介して Bard の回答をあなたと共有した場合は、それをクリックして会話を続けたり、質問についてより詳細な質問をしたり、それを自分の新しいアイデアのインスピレーションとして使用したりできます。

Googleの最も強力なモデルPalLM 2をベースに

Bard がこれらすべての新機能を実現できたのは、Google が PaLM 2 モデルにアップデートを加えたおかげです。

PalLM 2 は、Google のこれまでで最も高性能なモデルです。

Google は最先端の強化学習技術を使用して PaLM 2 をトレーニングし、より直感的で想像力豊かなものにしました。

現在、Bardが使用できる言語は40以上に拡大しています。

韓国の YouTube Music でマーケティングマネージャーの職の面接を受けたい場合、韓国の音楽業界 (K-POP の人気など) に関する知識が必要な場合は、Bard に面接の質問の準備を依頼できます。

バードに、任意のプログラミング言語で、文中に各単語が出現する回数をカウントするプログラムを作成するように依頼できます。

Bard に文を入力として受け取り、文中の各単語の数を出力するように指示します。句読点は無視され、大文字と小文字は区別されません (例: "the cat and the hat" は、"the": 2、"cat": 1、"and": 1、"hat": 1 としてカウントされます)。

バードはPythonでコードを書きました。

簡単に試してみる

これを見た編集者は思わずウズウズしてしまい、すぐに試してみました。

ただし、バードは基本的に Google ファミリー全体をカバーしています。ただし、航空券、ホテル、地図などは国内ではほとんど必要ありません。

生産性の面では、バード氏に最近受け取った電子メールの簡単な概要を説明してもらいました。

ざっと目を通し、要約すると、Bard と New Scientist Events から次のようなメールが届きました…

エンターテイメントに興味がある場合は、最近の視聴履歴に基づいて、Bard に新しいビデオを推奨するよう依頼できます。

その後、バード氏はNLPと機械学習に関するビデオをいくつか推薦しました。

質問：新しく発売されたiPhone 15 Proはどうですか？

すぐに長く雄弁なレビューが寄せられました。

その答えは十分に信頼できるものでしょうか?それとも、ナンセンスや幻覚がたくさんあるのでしょうか?

早速、新しくアップグレードされた「ダブルチェック」機能を使い、バードさんに再度「セルフチェック」を依頼しました。

リンクをクリックすると、Bard は対応する文を直接強調表示し、簡単に比較および判断できるようにします。

公式紹介にあるように、インターネット上に類似の情報が存在することを表す緑色のほか、インターネット上の情報が AI によって生成された情報と矛盾していることを表すオレンジ色もあります。

ただし、この機能はまだ完璧ではなく、大きなモデルの錯覚の問題を完全に解決することはできません。

例えば、明らかに背面カメラが4つあるMIX Fold 3は、バードによって「トリプルカメラ」に変更されただけでなく、同社もテスト後にそれが正しいと固く信じていました。

たとえば、一部の回答には「Google で検索」ボタンがありますが、結局何も見つかりません。

あるいは、ボタンがまったくないこともあります...（バード自身が作成したシーンではよくあることです）

少し前に話題になった GPU 不足に関する記事のイラストを Bard に入力して、それが何を意味するか聞いてみます。

バードの答えは驚くべきものだった。

あなたが送ってくれた画像は、「GPU がやってくる!」という言葉が書かれた大型貨物船のミームでした。

この画像は、GPU が巨大な貨物船で輸送されていることを示唆しており、現在の状況をユーモラスに誇張しています。これは、GPU 不足に対する人々の不満を表現し、GPU を購入したいという願望を表明する方法でもありました。

同時に、このグラフは、2023 年 9 月時点で GPU 不足が続いているため、現在の時間枠にも関連しています。

しかし、この答えにもいくつか不正確な点があります。たとえば、不足はマイナーやゲーマーによって引き起こされたのではなく、生成 AI による需要の急増によって引き起こされたものです。

しかし、バードがたった一枚の写真に基づいて、これほどの関連性と高揚感を生み出せるというのは、やはり驚くべきことだ。

<<: ハーバード大学とコロンビア大学が、AlphaFold 2 のプライベートトレーニングデータの問題を解決するために 1,600 万個のタンパク質配列をオープンソース化しました。

>>:

ブログ

AIスタートアップの構築から得た3つの重要な教訓

ブログ

マスク氏はOpenAIを訴えた。彼らはAGIを作成し、それをマイクロソフトにライセンス供与したが、これは設立協定に対する露骨な裏切りである。

ブログ

バードがグーグル一家を爆破！歴史上初めて、大規模なモデルが自己検査のためにオンラインで公開され、電子メール、地図、文書、ビデオがすべて利用可能になりました。

ファミリーバケットアシスタント

「Googleで検索」してエラーをチェックする

Googleの最も強力なモデルPalLM 2をベースに

簡単に試してみる

エンジニアリングチームでよく使用される 6 つの AI ツール

鵬城クラウドブレインは鵬城シリーズの大型モデルの基礎研究をサポート

新しい人工筋肉、応用シナリオの範囲が極めて広い！マイクロロボット：非常に必要

OpenAIの最初の投資家コスラ氏：AIスタートアップのほとんどは過大評価されている

ロボットはどのようにして経路を計画するのでしょうか?アニメーションを見てみましょう

OpenAIによって普及したエージェントはどのようにして人材を解放するのでしょうか？清華大学などがProAgentをリリース

AIスタートアップの構築から得た3つの重要な教訓

マスク氏はOpenAIを訴えた。彼らはAGIを作成し、それをマイクロソフトにライセンス供与したが、これは設立協定に対する露骨な裏切りである。

推薦する

2021 年の人工知能のトップ 10 トレンド

ジェフ・ディーン氏は自身の研究に対する批判に答える。「我々は新しいSOTAを取得しようとしているわけではなく、コスト計算は間違っている」

カリフォルニア大学バークレー校と他の研究チームは、岩の多い海岸や草原を横断しながら、変化する環境にリアルタイムで素早く適応する新しいロボット動作アルゴリズムを開発している。

このAI「マスターレベル」の棒人間レベルはネットユーザーを驚かせた。GANすら使っていない

AI 開発企業向けのトップ機械学習フレームワーク (2020 年版)

SFから現実へ：人間のデジタルツインの旅

AIがまだ人間を超えられない9つの分野

あらゆる角度から監視されることへの不安：AI はプライバシー侵害にどう対抗できるか？

2021 年に登場予定の 10 のビッグデータテクノロジー

最も人気のある 5 つの AI プログラミング言語

リスト発表：海雲捷雲の田良氏が「2021年科学技術影響力のある人物賞」を受賞

ロボティックプロセスオートメーションの 10 の秘密