バードがグーグル一家を爆破!歴史上初めて、大規模なモデルが自己検査のためにオンラインで公開され、電子メール、地図、文書、ビデオがすべて利用可能になりました。

バードがグーグル一家を爆破!歴史上初めて、大規模なモデルが自己検査のためにオンラインで公開され、電子メール、地図、文書、ビデオがすべて利用可能になりました。

バード家のバケツがついに登場!

Bard は今年 3 月にリリースされ、6 か月後、ようやく独自のプラグイン エコシステムを実現しました。豊富な Google アプリケーション API を呼び出して複雑な操作を実行できます。

今後、Bard は、Gmail、ドキュメント、ドライブ、Google マップ、Youtube、Google フライトなどのアプリケーションなど、毎日使用する Google ツールを開いて、そこから必要な情報を検索できるようになります。

必要な情報が複数のアプリケーションやサービスに分散している場合でも、Bard を使用するとすぐに統合できます。

つまり、Google 製品を深く使用すればするほど、Bard の可能性は高まります。

大型モデルの開発に伴い、国内メーカーとGoogleなどの大手企業の両方がアプリケーションエコロジーの方向へ動き始めました。

ファミリーバケットアシスタント

たとえば、グランドキャニオンに行きたい場合、このアクティビティをうまく計画するには非常に詳細な情報が必要です。

そしてバードはその魔法の機能を果たすことができる——

Gmail からのメッセージを読み取り、全員にとって都合の良い日付を選択します。

次に、リアルタイムのフライト情報とホテル情報を検索し、Google マップで空港までの道順を取得します。

YouTube ビデオをいくつか視聴してグランドキャニオンのガイドを作成するのにも役立ちます。

これらのタスクはすべて、Bard による 1 回の会話で完了します。

あるいは、新しい仕事を探していて履歴書を書く必要がある場合は、次のように Bard に指示することができます。

「ドライブから、2023 年 6 月の履歴書を見つけて、短い自己紹介文にまとめてください。」

このようにして、Bard は新しい履歴書の完成をお手伝いします。

「アレックスとの最近のメールのやり取りに基づいて、ビジネス協力計画を作成し、Gmail 経由でアレックスに送信するのを手伝ってください。」

「パリとその周辺のいくつかの都市について先ほど検索した情報に基づいて、旅行ガイドをデザインし、Google ドキュメントに保存してください。」

「議事録に記載されている自分に関する情報はすべて Google Keep に保存しています。」

バードがあなたのためにできることはたくさんあります。そのアイデアは Notion AI に多少似ていますが、後者はさまざまなデータベース内のデータを呼び出すことができません。

ご存知のとおり、データは現在最も不足しているリソースです。

OpenAI と比較すると、Bard の自然な利点は、より多くのデータとアプリケーションです。

今後、Bard はインターネットの検索履歴、閲覧したビデオ、電子メール、ドキュメント、地図に自動的にアクセスし、最も必要な情報を要約できるようになります。

「プライバシーはどうなるの?」と心配する人もいるかもしれません。

これに対し、Googleは、拡張機能をどのように使用するかはユーザーが決めることであり、これらの機能はいつでもオフにできると述べた。

Workspace 拡張機能の使用を選択した場合、人間のレビュー担当者は Gmail、ドキュメント、クラウド ドライブの内容を表示できず、Bard はこのデータを読み取って広告を表示したりモデルをトレーニングしたりすることもできなくなります。

「Googleで検索」してエラーをチェックする

さらに、バードは間違いを犯す可能性があることを積極的に認めた歴史上初のモデルでもあります。

今回、バード氏は「Google It」ボタンを更新し、自ら「再確認」できるようにした。

1 回のクリックで、Bard は自動的に返信をチェックし、あなたが言ったことに根拠があるかどうか、インターネット上の対応するコンテンツでそれを確認できるかどうかを確認します。

バード氏は、緑色でマークされた発言について非常に自信を持っている。なぜなら、Google で検索すれば、それを裏付けるコンテンツを見つけることができるからだ。

オレンジ色にマークされている場合、バードは間違いを犯したことを認めます。インターネットで見つかった情報に基づいて、彼は確かにナンセンスな話をするという間違いを犯したことを知ることができます。

また、誰かが共有リンクを介して Bard の回答をあなたと共有した場合は、それをクリックして会話を続けたり、質問についてより詳細な質問をしたり、それを自分の新しいアイデアのインスピレーションとして使用したりできます。

Googleの最も強力なモデルPalLM 2をベースに

Bard がこれらすべての新機能を実現できたのは、Google が PaLM 2 モデルにアップデートを加えたおかげです。

PalLM 2 は、Google のこれまでで最も高性能なモデルです。

Google は最先端の強化学習技術を使用して PaLM 2 をトレーニングし、より直感的で想像力豊かなものにしました。

現在、Bardが使用できる言語は40以上に拡大しています。

韓国の YouTube Music でマーケティング マネージャーの職の面接を受けたい場合、韓国の音楽業界 (K-POP の人気など) に関する知識が必要な場合は、Bard に面接の質問の準備を依頼できます。

バードに、任意のプログラミング言語で、文中に各単語が出現する回数をカウントするプログラムを作成するように依頼できます。

Bard に文を入力として受け取り、文中の各単語の数を出力するように指示します。句読点は無視され、大文字と小文字は区別されません (例: "the cat and the hat" は、"the": 2、"cat": 1、"and": 1、"hat": 1 としてカウントされます)。

バードはPythonでコードを書きました。

簡単に試してみる

これを見た編集者は思わずウズウズしてしまい、すぐに試してみました。

ただし、バードは基本的に Google ファミリー全体をカバーしています。ただし、航空券、ホテル、地図などは国内ではほとんど必要ありません。

生産性の面では、バード氏に最近受け取った電子メールの簡単な概要を説明してもらいました。

ざっと目を通し、要約すると、Bard と New Scientist Events から次のようなメールが届きました…

エンターテイメントに興味がある場合は、最近の視聴履歴に基づいて、Bard に新しいビデオを推奨するよう依頼できます。

その後、バード氏はNLPと機械学習に関するビデオをいくつか推薦しました。

質問:新しく発売されたiPhone 15 Proはどうですか?

すぐに長く雄弁なレビューが寄せられました。

その答えは十分に信頼できるものでしょうか?それとも、ナンセンスや幻覚がたくさんあるのでしょうか?

早速、新しくアップグレードされた「ダブルチェック」機能を使い、バードさんに再度「セルフチェック」を依頼しました。

リンクをクリックすると、Bard は対応する文を直接強調表示し、簡単に比較および判断できるようにします。

公式紹介にあるように、インターネット上に類似の情報が存在することを表す緑色のほか、インターネット上の情報が AI によって生成された情報と矛盾していることを表すオレンジ色もあります。

ただし、この機能はまだ完璧ではなく、大きなモデルの錯覚の問題を完全に解決することはできません。

例えば、明らかに背面カメラが4つあるMIX Fold 3は、バードによって「トリプルカメラ」に変更されただけでなく、同社もテスト後にそれが正しいと固く信じていました。

たとえば、一部の回答には「Google で検索」ボタンがありますが、結局何も見つかりません。

あるいは、ボタンがまったくないこともあります...(バード自身が作成したシーンではよくあることです)

少し前に話題になった GPU 不足に関する記事のイラストを Bard に入力して、それが何を意味するか聞いてみます。

バードの答えは驚くべきものだった。

あなたが送ってくれた画像は、「GPU がやってくる!」という言葉が書かれた大型貨物船のミームでした。

この画像は、GPU が巨大な貨物船で輸送されていることを示唆しており、現在の状況をユーモラスに誇張しています。これは、GPU 不足に対する人々の不満を表現し、GPU を購入したいという願望を表明する方法でもありました。

同時に、このグラフは、2023 年 9 月時点で GPU 不足が続いているため、現在の時間枠にも関連しています。

しかし、この答えにもいくつか不正確な点があります。たとえば、不足はマイナーやゲーマーによって引き起こされたのではなく、生成 AI による需要の急増によって引き起こされたものです。

しかし、バードがたった一枚の写真に基づいて、これほどの関連性と高揚感を生み出せるというのは、やはり驚くべきことだ。

<<:  ハーバード大学とコロンビア大学が、AlphaFold 2 のプライベート トレーニング データの問題を解決するために 1,600 万個のタンパク質配列をオープンソース化しました。

>>: 

ブログ    
ブログ    
ブログ    

推薦する

Cloudera Greater Chinaのテクニカルディレクター、Liu Lifang氏:より正確なAIにはより正確なデータが必要

アプリケーションの可観測性と AI の信頼、リスク、セキュリティ管理は、ガートナーが 2023 年に...

AI聴覚技術は国際紛争に関与したことがあるか?

AI視覚技術がさまざまな業界で応用されるのはもはや目新しいことではなく、現在ではAI聴覚技術も戦場...

...

浙江大学の呉飛氏とアリババの賈洋青氏が口論。AIの進化と年収100万ドルのどちらが本当なのか?

人工知能が再び人気を集めていることは間違いありません。第14次5カ年計画では、国家発展の戦略的支えと...

AI プロジェクトの 85% が失敗する理由は何ですか?

現在、人工知能(AI)は、人事、サプライチェーン、マルチレベルマーケティングなど、さまざまな分野で広...

インタープリタパターンを使用して、要素のXPathパスを取得するためのアルゴリズムを実装します。

[[432233]]文章1. 通訳モード言語に対して、その文法表現(言語のルールを定義するために使...

...

人工知能のコミュニケーション:コンテキストは業界マネージャーにとって成功への道

SymphonyAI のマーケティング責任者として、私は企業における人工知能 (AI) のあらゆるア...

...

アリババクラウド南京雲奇カンファレンス:スマート製造モデルの共有と最先端技術の発表

[51CTO.comより引用] 本日、アリババクラウドカンファレンス南京サミットが正式に開催され、ま...

AIoTの生死に関わる状況:将来的にはAIoTは非常に収益性が高いが、現時点ではAI+IoTは非常に高価

Huawei が初めて AIoT 戦略を発表したり、JD.com が IoT 事業を Xiaojin...

...

ビッグデータなどの最も中核的なキーテクノロジー:32のアルゴリズム

[[181277]]オーストリアの記号計算研究所 (RISC) の Christoph Koutsc...