事故！ GoogleのAIがチューリングテストに合格：4つのタスクに成功、うち3つは手動で実行

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

Google の驚くべき運営には驚かされるばかりです。

世界最大の AI 企業であり、「人類の希望」の体現者である Google は、実際に実際の人間を使って AI を装うことに頼りました。

ニューヨークタイムズがこのニュースを暴露するとすぐに、そのサークルは爆発した。

コアとなるのは、昨年発表された、本物の電話と偽物の電話を区別しにくくする AI 「Duplex」です。

[[266384]]

実際のテストは4回成功し、そのうち3回は手動で行われた。

昨年のI/Oカンファレンスでは、電話をかけるためのAI Duplexが発表されるや否や皆を驚かせ、世界に衝撃を与えましたが、「hmm」という音はさらに印象的でした。

その後、グーグル会長でチューリング賞受賞者のジョン・ヘネシー氏も自ら電話をかけ、電話予約の分野ではこのAIがチューリングテストに合格したと語った。

[[266385]]

今年のI/Oで、GoogleのCEOピチャイ氏は、この製品が1年以内に米国の40州以上で商用利用されたことも明らかにした。

それは、静かな水が深く流れることを意味し、私たちは草の根レベルで広く深く人々に奉仕しています。

しかし、ニューヨークタイムズの記者が好奇心からそれを試してみたところ、恥ずかしい結果となった。

よりよいテストのために、彼らは Google アシスタントが組み込まれており、レストランの予約時に電話予約が必要な場合に Duplex を起動できる Pixel スマートフォン 2 台も発見しました。

数日のうちに、ニューヨークタイムズの記者がそれを10回以上使用しました。

しかし、成功した予約 4 件のうち 3 件は、Duplex の背後にある人的努力によるものでした。

もっと率直に言えば、成功した電話予約の 75% は、AI に「偽装した」人間によって行われています。

予約は AI によって一度だけ行われました。

ニューヨークタイムズの記者も、今回、Google AIの実力が実証されたと述べている。コミュニケーションがスムーズで扱いやすいだけでなく、小さな休止やモーダル粒子もあり、コミュニケーションがよりリアルになっている。

レストランのマネージャーが「何人で食べるのか」「いつ食べるのか」「名前」「携帯電話番号」などの情報を尋ねると、Google AIは簡単に応答し、正確に答えました。

レストランのマネージャーが突然「子供はいますか？」と尋ねたときも、Google AIは「クライアントの予約を取っているのでわかりません」と答えることができました。

しかし残念なことに、テスト中に成功した 4 件の予約のうち、本物の AI だったのはこの 1 件だけでした。

テストサンプルが十分に大きくない場合でも、大きな問題を説明することができます。

さらに、Google が AI を「偽装」するために人間の発信者を利用していたことが発覚したが、これは当初、レストランからの「報告」から発覚した。

アイルランド訛りの Google の「AI」

ラオタイキッチンの従業員、ジミー・トランさんは、Google アシスタントから電話を受けました。

それはアイルランド訛りのはっきりした男性の声で、週末に二人で予約したいという内容だった。

シャオ・チェンは最初、かなり興奮していました。結局のところ、彼はそれについて少し聞いていたからです。 Google 経由で行われる予約の電話は、普通の電話ではありません。その背後には、驚くべき Google AI - Duplex があります。

しかし、シャオ・チェンは非常に驚きました。なぜこの「AI」のアクセントは実際にはAIのように聞こえないのでしょうか?アイルランド訛りだけでなく、話し方のトーンやイントネーションも「人間のよう」です。

そこでシャオ・チェンは直接尋ねました。「あなたはアイルランド人ですか？」

相手はすぐに「ああ、そうだね」と返事をしました。私はロボットではありません。それから彼は大声で笑いました。

[[266386]]

***チェン氏は困惑したまま、ニューヨーク・タイムズに答えを求めることにした。

ただし、尋ねなければわかりません。

Google 公式: 通話の 1/4 は人間が行う

なぜなら、タイ料理レストランのオーナーであるチェン氏に電話をかけた人物は、確かに Google のコールセンターの従業員であったことを Google が公式に認めたからです。

そして現在、Duplex を介した通話の約 25% は完全に人間によって操作されており、人間が介在しないその他のケースでは、通話の 15% に人間が介入しています。

もちろん、Googleはこれまで、AI Duplexの背後に人間のコールセンターがあることを明らかにしたことはない。

実際、Google の姿勢は、完全に AI であり、完全に自動化されており、人間はまったく必要ないというものでした。

ただ、Yundanfengqing氏は以前、公式ブログで、機械はほとんどのタスクを自律的に完了し、処理できない状況を特定して、人間に処理させることができると述べていました。

これは、ユーザーエクスペリエンスを確保するための冗長な動作のように思えます。

人間が直接関与しているだけでなく、通話の4分の1がAIに「偽装」されているとは予想もしていませんでした。

そして、ニューヨークタイムズによる簡単なテストによれば、作業の4分の3は実際には人間の従業員によって行われていた。

では、これが今日の Google のやり方なのでしょうか?

企業や製品は、美しく魅力的なパッケージにされ、隅に「結果は参考値です」という注意書きが添えられた「インスタントラーメン」になってしまったのでしょうか?

Googleはこう答えた。「レストランへの敬意から」

そしてGoogleの説明と対応もわかりにくいです。

Google によれば、Duplex はレストランへの敬意から、時々人間に頼っているという。

Google アシスタント事業の責任者であるニック・フォックス氏は、レストランでの体験を保証するために、Google は Duplex で人間的要素を大幅に排除しなかったと説明した。

しかし、Google は時間の経過とともに製品を継続的に改善し、自動化システムを改善して、人間の介入の必要性を徐々に減らしています。

Duplex のプロダクトマネージャーは、レストランによっては電話で予約を受け付けられるかどうかわからないところもあるため、こうしたレストランでは人間による電話予約を優先すると述べました。

つまり、Google のシステムは、電話予約を明示的に受け入れるレストランに対してのみ AI を使用することになります。

しかし、ニューヨークタイムズはすぐに例を挙げてこれを批判した。

なぜなら、以前 Duplex を使用して予約を正常に行っていたレストランが、再度 Google AI を使用して予約を行おうとすると、Google は人間を派遣したからです。

ニューヨーク・タイムズ紙は、デュプレックス・システムの学習速度が十分ではないのではないかと推測した。

もう一つの理由は、The Verge の以前のレポートで言及されていたが、この技術はまだ新しく、用途が限られているということだ。 Google は、データの取得と AI のトレーニングに引き続き手動呼び出しを使用しています。

しかし、いずれにしても、Google が作成した素晴らしい AI は今回失敗しました。

「人工的であればあるほど、知能も高まる」という言葉には誰もが慣れていますが、Google がアプリケーションレベルの人工知能製品で「人工」+「知能」モデルを使用していることは、やはり衝撃的です。

事件が明らかになった後、一部の人々は次のようにコメントした。

信じられないくらい、ステージでライブ演奏されたときは驚きました。彼らは完全に嘘をついており、誰かが彼らを訴えることを心から願っています。彼らはその日、ステージ上の何千人もの観客を騙した。

しかし、Google の熱烈な支持者の中には、Google が Duplex を慎重かつ非攻撃的な方法で導入するのは賢明だと考える人もいます。

Duplex が発売されたときのことをまだ覚えているかどうかわかりません。

ここにレビューがあります:

しかし、デモがいかにクールであったとしても、今や現実によって恥ずかしい打撃を受けてしまった。

[[266387]]

どう思いますか？

ニューヨークタイムズは次のように報じた。

https://www.nytimes.com/2019/05/22/technology/personaltech/ai-google-duplex.html

<<: 5 つのコアコンポーネントで構成される AIoT は、3 つの大きな課題に直面しています。2 つのブレークスルー以外に何があるのでしょうか。

>>: 中国のトップ 10 の技術革新の一覧。世界をリードする技術も持っています。

2020 年には、トップ 10 のトレンドテクノロジーを習得する必要があります。

ブログ

機械学習はサイバーセキュリティをどのように向上させることができるのでしょうか?

ブログ

事故！ GoogleのAIがチューリングテストに合格：4つのタスクに成功、うち3つは手動で実行

2020 年には、トップ 10 のトレンドテクノロジーを習得する必要があります。

機械学習はサイバーセキュリティをどのように向上させることができるのでしょうか?

ロボット警察がファンタジーを現実に変える

このアルゴリズムチームは 2020 年に何をしましたか?

GPT-4の予測の新たな波は、大きすぎず密度も高くないテキストのみのモデルに向けて到来している。

ビッグデータは経済生活に影響を与え、AIの基礎となる

将来のビジネスインテリジェンスにおける人工知能の役割

推薦する

人工知能はビジネスモデルの革新を促進し、行動の変化を予測することがより一般的になっている

実験により、人工知能がパスワードを簡単に解読できることが証明された

Siriは中国で禁止されるのでしょうか？国内AI企業がアップルを特許侵害で訴え、高等法院は中国の特許を有効と認定

TensorFlow が NSL ニューラル構造学習フレームワークをオープンソース化

「ビッグモデルは基本的に2つのファイルです！」テスラの元AIディレクターが一般向けに1時間にわたるLLMポピュラーサイエンスを披露

新しいヘルスケアソリューション: ヘルスケアにおける AI と IoT が認知症患者をどのように支援できるか

認知システムが機械学習とセマンティック技術を組み合わせるべき理由

インテルは世界的なIT需要爆発の機会を無駄にしない

GACの第2世代Trumpchi GS4が発売され、WeChat車載バージョンは安全で効率的な車内通信を実現

ヘルスケアにおける機械学習の悪影響

私たちのプライバシーはどこにも見つからない