事故! GoogleのAIがチューリングテストに合格:4つのタスクに成功、うち3つは手動で実行

事故! GoogleのAIがチューリングテストに合格:4つのタスクに成功、うち3つは手動で実行

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

Google の驚くべき運営には驚かされるばかりです。

世界最大の AI 企業であり、「人類の希望」の体現者である Google は、実際に実際の人間を使って AI を装うことに頼りました。

ニューヨークタイムズがこのニュースを暴露するとすぐに、そのサークルは爆発した。

コアとなるのは、昨年発表された、本物の電話と偽物の電話を区別しにくくする AI 「Duplex」です。

[[266384]]

実際のテストは4回成功し、そのうち3回は手動で行われた。

昨年のI/Oカンファレンスでは、電話をかけるためのAI Duplexが発表されるや否や皆を驚かせ、世界に衝撃を与えましたが、「hmm」という音はさらに印象的でした。

その後、グーグル会長でチューリング賞受賞者のジョン・ヘネシー氏も自ら電話をかけ、電話予約の分野ではこのAIがチューリングテストに合格したと語った。

[[266385]]

今年のI/Oで、GoogleのCEOピチャイ氏は、この製品が1年以内に米国の40州以上で商用利用されたことも明らかにした。

それは、静かな水が深く流れることを意味し、私たちは草の根レベルで広く深く人々に奉仕しています。

しかし、ニューヨークタイムズの記者が好奇心からそれを試してみたところ、恥ずかしい結果となった。

よりよいテストのために、彼らは Google アシスタントが組み込まれており、レストランの予約時に電話予約が必要な場合に Duplex を起動できる Pixel スマートフォン 2 台も発見しました。

数日のうちに、ニューヨークタイムズの記者がそれを10回以上使用しました。

しかし、成功した予約 4 件のうち 3 件は、Duplex の背後にある人的努力によるものでした。

もっと率直に言えば、成功した電話予約の 75% は、AI に「偽装した」人間によって行われています。

予約は AI によって一度だけ行われました。

ニューヨークタイムズの記者も、今回、Google AIの実力が実証されたと述べている。コミュニケーションがスムーズで扱いやすいだけでなく、小さな休止やモーダル粒子もあり、コミュニケーションがよりリアルになっている。

レストランのマネージャーが「何人で食べるのか」「いつ食べるのか」「名前」「携帯電話番号」などの情報を尋ねると、Google AIは簡単に応答し、正確に答えました。

レストランのマネージャーが突然「子供はいますか?」と尋ねたときも、Google AIは「クライアントの予約を取っているのでわかりません」と答えることができました。

しかし残念なことに、テスト中に成功した 4 件の予約のうち、本物の AI だったのはこの 1 件だけでした。

テストサンプルが十分に大きくない場合でも、大きな問題を説明することができます。

さらに、Google が AI を「偽装」するために人間の発信者を利用していたことが発覚したが、これは当初、レストランからの「報告」から発覚した。

アイルランド訛りの Google の「AI」

ラオタイキッチンの従業員、ジミー・トランさんは、Google アシスタントから電話を受けました。

それはアイルランド訛りのはっきりした男性の声で、週末に二人で予約したいという内容だった。

シャオ・チェンは最初、かなり興奮していました。結局のところ、彼はそれについて少し聞いていたからです。 Google 経由で行われる予約の電話は、普通の電話ではありません。その背後には、驚くべき Google AI - Duplex があります。

しかし、シャオ・チェンは非常に驚きました。なぜこの「AI」のアクセントは実際にはAIのように聞こえないのでしょうか?アイルランド訛りだけでなく、話し方のトーンやイントネーションも「人間のよう」です。

そこでシャオ・チェンは直接尋ねました。「あなたはアイルランド人ですか?」

相手はすぐに「ああ、そうだね」と返事をしました。私はロボットではありません。それから彼は大声で笑いました。

[[266386]]

***チェン氏は困惑したまま、ニューヨーク・タイムズに答えを求めることにした。

ただし、尋ねなければわかりません。

Google 公式: 通話の 1/4 は人間が行う

なぜなら、タイ料理レストランのオーナーであるチェン氏に電話をかけた人物は、確かに Google のコールセンターの従業員であったことを Google が公式に認めたからです。

そして現在、Duplex を介した通話の約 25% は完全に人間によって操作されており、人間が介在しないその他のケースでは、通話の 15% に人間が介入しています。

もちろん、Googleはこれまで、AI Duplexの背後に人間のコールセンターがあることを明らかにしたことはない。

実際、Google の姿勢は、完全に AI であり、完全に自動化されており、人間はまったく必要ないというものでした。

ただ、Yundanfengqing氏は以前、公式ブログで、機械はほとんどのタスクを自律的に完了し、処理できない状況を特定して、人間に処理させることができると述べていました。

これは、ユーザーエクスペリエンスを確保するための冗長な動作のように思えます。

人間が直接関与しているだけでなく、通話の4分の1がAIに「偽装」されているとは予想もしていませんでした。

そして、ニューヨークタイムズによる簡単なテストによれば、作業の4分の3は実際には人間の従業員によって行われていた。

では、これが今日の Google のやり方なのでしょうか?

企業や製品は、美しく魅力的なパッケージにされ、隅に「結果は参考値です」という注意書きが添えられた「インスタントラーメン」になってしまったのでしょうか?

Googleはこう答えた。「レストランへの敬意から」

そしてGoogleの説明と対応もわかりにくいです。

Google によれば、Duplex はレストランへの敬意から、時々人間に頼っているという。

Google アシスタント事業の責任者であるニック・フォックス氏は、レストランでの体験を保証するために、Google は Duplex で人間的要素を大幅に排除しなかったと説明した。

しかし、Google は時間の経過とともに製品を継続的に改善し、自動化システムを改善して、人間の介入の必要性を徐々に減らしています。

Duplex のプロダクト マネージャーは、レストランによっては電話で予約を受け付けられるかどうかわからないところもあるため、こうしたレストランでは人間による電話予約を優先すると述べました。

つまり、Google のシステムは、電話予約を明示的に受け入れるレストランに対してのみ AI を使用することになります。

しかし、ニューヨークタイムズはすぐに例を挙げてこれを批判した。

なぜなら、以前 Duplex を使用して予約を正常に行っていたレストランが、再度 Google AI を使用して予約を行おうとすると、Google は人間を派遣したからです。

ニューヨーク・タイムズ紙は、デュプレックス・システムの学習速度が十分ではないのではないかと推測した。

もう一つの理由は、The Verge の以前のレポートで言及されていたが、この技術はまだ新しく、用途が限られているということだ。 Google は、データの取得と AI のトレーニングに引き続き手動呼び出しを使用しています。

しかし、いずれにしても、Google が作成した素晴らしい AI は今回失敗しました。

「人工的であればあるほど、知能も高まる」という言葉には誰もが慣れていますが、Google がアプリケーション レベルの人工知能製品で「人工」+「知能」モデルを使用していることは、やはり衝撃的です。

事件が明らかになった後、一部の人々は次のようにコメントした。

信じられないくらい、ステージでライブ演奏されたときは驚きました。彼らは完全に嘘をついており、誰かが彼らを訴えることを心から願っています。彼らはその日、ステージ上の何千人もの観客を騙した。

しかし、Google の熱烈な支持者の中には、Google が Duplex を慎重かつ非攻撃的な方法で導入するのは賢明だと考える人もいます。

Duplex が発売されたときのことをまだ覚えているかどうかわかりません。

ここにレビューがあります:

しかし、デモがいかにクールであったとしても、今や現実によって恥ずかしい打撃を受けてしまった。

[[266387]]

どう思いますか?

ニューヨークタイムズは次のように報じた。

https://www.nytimes.com/2019/05/22/technology/personaltech/ai-google-duplex.html

<<:  5 つのコア コンポーネントで構成される AIoT は、3 つの大きな課題に直面しています。2 つのブレークスルー以外に何があるのでしょうか。

>>:  中国のトップ 10 の技術革新の一覧。世界をリードする技術も持っています。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

テレンス・タオが AI を使って形式化した証明とは、いったい何でしょうか? PFR予想の歴史の簡単な紹介

12月5日、有名な数学者でフィールズ賞受賞者のテレンス・タオ氏は、ソーシャルネットワーク上で、多項式...

完璧な意思決定ツリーを作成する方法

[51CTO.com クイック翻訳] ご存知のとおり、決定木は実生活で多くの実用的なシナリオで利用さ...

人工知能は依然として人気があり、大学入試では3年連続で最も人気のある選択肢となっている。

百度がこのほど発表した「百度人気検索・2022年大学入試ビッグデータ」レポートによると、人工知能は3...

...

ついに誰かが様々なStyleGANの大きな概要を作成した

[[435127]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

誰もがエンドツーエンドに取り組んでいますが、エンドツーエンドの自動運転の基礎は何でしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

テスラのオプティマスヒューマノイドロボットが再び進化:視覚に基づいて物体を自律的に分類し、ヨガもできる

9月24日のニュース、本日早朝、テスラ オプティマスの公式Twitterアカウントが新しいビデオをア...

イノベーションに関する対話 - 51CTO 初の開発者コンテストが始まりました!

/* 世界を変えるために生きるここでは、あらゆる作品が市場に参入するための種となる可能性があります...

...

GitHub が機械学習コードの脆弱性スキャンを無料で提供、JavaScript / TypeScript もサポート

現在、JavaScript および TypeScript リポジトリで開発およびテストが行​​われて...

...

...

Github 年次レポートレビュー: TensorFlow が間違いなく最大の勝者です!

現在、世界中の何百万もの開発者が GitHub を使用してコードを共有し、ビジネスを構築しており、多...