事故! GoogleのAIがチューリングテストに合格:4つのタスクに成功、うち3つは手動で実行

事故! GoogleのAIがチューリングテストに合格:4つのタスクに成功、うち3つは手動で実行

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

Google の驚くべき運営には驚かされるばかりです。

世界最大の AI 企業であり、「人類の希望」の体現者である Google は、実際に実際の人間を使って AI を装うことに頼りました。

ニューヨークタイムズがこのニュースを暴露するとすぐに、そのサークルは爆発した。

コアとなるのは、昨年発表された、本物の電話と偽物の電話を区別しにくくする AI 「Duplex」です。

[[266384]]

実際のテストは4回成功し、そのうち3回は手動で行われた。

昨年のI/Oカンファレンスでは、電話をかけるためのAI Duplexが発表されるや否や皆を驚かせ、世界に衝撃を与えましたが、「hmm」という音はさらに印象的でした。

その後、グーグル会長でチューリング賞受賞者のジョン・ヘネシー氏も自ら電話をかけ、電話予約の分野ではこのAIがチューリングテストに合格したと語った。

[[266385]]

今年のI/Oで、GoogleのCEOピチャイ氏は、この製品が1年以内に米国の40州以上で商用利用されたことも明らかにした。

それは、静かな水が深く流れることを意味し、私たちは草の根レベルで広く深く人々に奉仕しています。

しかし、ニューヨークタイムズの記者が好奇心からそれを試してみたところ、恥ずかしい結果となった。

よりよいテストのために、彼らは Google アシスタントが組み込まれており、レストランの予約時に電話予約が必要な場合に Duplex を起動できる Pixel スマートフォン 2 台も発見しました。

数日のうちに、ニューヨークタイムズの記者がそれを10回以上使用しました。

しかし、成功した予約 4 件のうち 3 件は、Duplex の背後にある人的努力によるものでした。

もっと率直に言えば、成功した電話予約の 75% は、AI に「偽装した」人間によって行われています。

予約は AI によって一度だけ行われました。

ニューヨークタイムズの記者も、今回、Google AIの実力が実証されたと述べている。コミュニケーションがスムーズで扱いやすいだけでなく、小さな休止やモーダル粒子もあり、コミュニケーションがよりリアルになっている。

レストランのマネージャーが「何人で食べるのか」「いつ食べるのか」「名前」「携帯電話番号」などの情報を尋ねると、Google AIは簡単に応答し、正確に答えました。

レストランのマネージャーが突然「子供はいますか?」と尋ねたときも、Google AIは「クライアントの予約を取っているのでわかりません」と答えることができました。

しかし残念なことに、テスト中に成功した 4 件の予約のうち、本物の AI だったのはこの 1 件だけでした。

テストサンプルが十分に大きくない場合でも、大きな問題を説明することができます。

さらに、Google が AI を「偽装」するために人間の発信者を利用していたことが発覚したが、これは当初、レストランからの「報告」から発覚した。

アイルランド訛りの Google の「AI」

ラオタイキッチンの従業員、ジミー・トランさんは、Google アシスタントから電話を受けました。

それはアイルランド訛りのはっきりした男性の声で、週末に二人で予約したいという内容だった。

シャオ・チェンは最初、かなり興奮していました。結局のところ、彼はそれについて少し聞いていたからです。 Google 経由で行われる予約の電話は、普通の電話ではありません。その背後には、驚くべき Google AI - Duplex があります。

しかし、シャオ・チェンは非常に驚きました。なぜこの「AI」のアクセントは実際にはAIのように聞こえないのでしょうか?アイルランド訛りだけでなく、話し方のトーンやイントネーションも「人間のよう」です。

そこでシャオ・チェンは直接尋ねました。「あなたはアイルランド人ですか?」

相手はすぐに「ああ、そうだね」と返事をしました。私はロボットではありません。それから彼は大声で笑いました。

[[266386]]

***チェン氏は困惑したまま、ニューヨーク・タイムズに答えを求めることにした。

ただし、尋ねなければわかりません。

Google 公式: 通話の 1/4 は人間が行う

なぜなら、タイ料理レストランのオーナーであるチェン氏に電話をかけた人物は、確かに Google のコールセンターの従業員であったことを Google が公式に認めたからです。

そして現在、Duplex を介した通話の約 25% は完全に人間によって操作されており、人間が介在しないその他のケースでは、通話の 15% に人間が介入しています。

もちろん、Googleはこれまで、AI Duplexの背後に人間のコールセンターがあることを明らかにしたことはない。

実際、Google の姿勢は、完全に AI であり、完全に自動化されており、人間はまったく必要ないというものでした。

ただ、Yundanfengqing氏は以前、公式ブログで、機械はほとんどのタスクを自律的に完了し、処理できない状況を特定して、人間に処理させることができると述べていました。

これは、ユーザーエクスペリエンスを確保するための冗長な動作のように思えます。

人間が直接関与しているだけでなく、通話の4分の1がAIに「偽装」されているとは予想もしていませんでした。

そして、ニューヨークタイムズによる簡単なテストによれば、作業の4分の3は実際には人間の従業員によって行われていた。

では、これが今日の Google のやり方なのでしょうか?

企業や製品は、美しく魅力的なパッケージにされ、隅に「結果は参考値です」という注意書きが添えられた「インスタントラーメン」になってしまったのでしょうか?

Googleはこう答えた。「レストランへの敬意から」

そしてGoogleの説明と対応もわかりにくいです。

Google によれば、Duplex はレストランへの敬意から、時々人間に頼っているという。

Google アシスタント事業の責任者であるニック・フォックス氏は、レストランでの体験を保証するために、Google は Duplex で人間的要素を大幅に排除しなかったと説明した。

しかし、Google は時間の経過とともに製品を継続的に改善し、自動化システムを改善して、人間の介入の必要性を徐々に減らしています。

Duplex のプロダクト マネージャーは、レストランによっては電話で予約を受け付けられるかどうかわからないところもあるため、こうしたレストランでは人間による電話予約を優先すると述べました。

つまり、Google のシステムは、電話予約を明示的に受け入れるレストランに対してのみ AI を使用することになります。

しかし、ニューヨークタイムズはすぐに例を挙げてこれを批判した。

なぜなら、以前 Duplex を使用して予約を正常に行っていたレストランが、再度 Google AI を使用して予約を行おうとすると、Google は人間を派遣したからです。

ニューヨーク・タイムズ紙は、デュプレックス・システムの学習速度が十分ではないのではないかと推測した。

もう一つの理由は、The Verge の以前のレポートで言及されていたが、この技術はまだ新しく、用途が限られているということだ。 Google は、データの取得と AI のトレーニングに引き続き手動呼び出しを使用しています。

しかし、いずれにしても、Google が作成した素晴らしい AI は今回失敗しました。

「人工的であればあるほど、知能も高まる」という言葉には誰もが慣れていますが、Google がアプリケーション レベルの人工知能製品で「人工」+「知能」モデルを使用していることは、やはり衝撃的です。

事件が明らかになった後、一部の人々は次のようにコメントした。

信じられないくらい、ステージでライブ演奏されたときは驚きました。彼らは完全に嘘をついており、誰かが彼らを訴えることを心から願っています。彼らはその日、ステージ上の何千人もの観客を騙した。

しかし、Google の熱烈な支持者の中には、Google が Duplex を慎重かつ非攻撃的な方法で導入するのは賢明だと考える人もいます。

Duplex が発売されたときのことをまだ覚えているかどうかわかりません。

ここにレビューがあります:

しかし、デモがいかにクールであったとしても、今や現実によって恥ずかしい打撃を受けてしまった。

[[266387]]

どう思いますか?

ニューヨークタイムズは次のように報じた。

https://www.nytimes.com/2019/05/22/technology/personaltech/ai-google-duplex.html

<<:  5 つのコア コンポーネントで構成される AIoT は、3 つの大きな課題に直面しています。2 つのブレークスルー以外に何があるのでしょうか。

>>:  中国のトップ 10 の技術革新の一覧。世界をリードする技術も持っています。

ブログ    
ブログ    

推薦する

目から涙が溢れてきました!ビクーニャのデジタルツインは10年前の自分を再現し、10年間の対話は数え切れないほどの人々に影響を与えた

Reddit のネットユーザーが何か新しいことをやっている。彼は、自身のオンラインフットプリントデー...

WEF: 2023 年のトップ 10 新興テクノロジー

世界経済フォーラム(WEF)は毎年、世界経済と社会に大きな影響を与える可能性のあるトップイノベーショ...

引退した中国人女性のAIによるイラストがWeiboで話題に! 「バカなガチョウの王様」とハッピー・パピーがGPT-4の想像力の限界に挑戦

AIの創造性の限界は何でしょうか?最近、ネットユーザーは、GPT-4 に適切なタイミングで PUA ...

...

アリババの顔認識セキュリティ技術が3Dマスク攻撃を防ぐ特許を取得

[[334032]]顔認識と 3D テクノロジーが融合したとき、最終的な勝者は誰になるでしょうか? ...

AIが開発ツールを進化させる方法

[[410767]] GitHub Copilot、DeepDev、IntelliCode、その他の...

機械学習アルゴリズムに関する 16 のヒント

スイスアーミーナイフについて聞いたことがあるかもしれません。そうでない場合は、下の図をご覧ください。...

マイクロソフトは、ほぼ100年前の量子理論の新たな証明を示した。

量子コンピューティングは、人類が直面している最も困難な課題のいくつかを解決するのに役立つと期待されて...

メイン検索と店内検索の共同最適化の予備調査と試み

背景と概要Taobao プラットフォームには、検索、推奨、広告など、多くのサブシナリオがあります。各...

チャットボットは過去のもの:避けられない運命…

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

Apple、Google Play ランキングアルゴリズム

すべてのアプリにおいて、製品自体が登場する前、アイデアが生まれた時点で、すでに製品マーケティングの問...

Appleのスマートホームアプリに新機能「クリーンエネルギークエリ」が追加

AppleのiPhone 15の発表イベントでは、同社のカーボンニュートラル化に向けた取り組みに焦点...

Google が「シャンプー」という 2 次最適化アルゴリズムを提案、Transformer のトレーニング時間を 40% 削減

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

新しいインテリジェント顔認識温度測定システムソリューション

春節休暇の到来とともに、全国の主要都市の鉄道駅、空港、地下鉄などの公共の場所が、防疫・抑制の重点エリ...