この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 プログラマーを怒らせないでください。プログラマーを怒らせないでください。プログラマーを怒らせないでください。 たとえ、年間 40 億件もの電話をかけてくるロボットの嫌がらせ発信者であってもです。 3.15ガラでロボットが嫌がらせ電話をかける闇産業チェーンが暴露された後、人々は衝撃を受け、世論は騒然となり、AI実践者は悲嘆に暮れた。 意外なことに、最先端の AI 技術が、悪意を持った企業によってダークサイドへと導かれつつあります。 しかし数時間後、アリババはロボットの問題はロボットに任せるべきだとして、嫌がらせ電話を防ぐためのAI技術の導入を発表した。 公開されたビデオデモでは、アリババAIラボが嫌がらせ防止通話AIを立ち上げ、営業電話の最中に、人間の女性営業担当者がプロセス全体をまったく把握していなかったことが示されました... その後、アリババはAlipayミニプログラムとTmall Genieアプリでもオープンエクスペリエンスを開始し、好評を博しました。 もちろん、Nie Zaiqing 氏は、自分のアマチュア プロジェクトがこれほど広く注目されるとは予想していませんでした。 アリババAIラボの音声アシスタントのトップ科学者であり、アリババAI北京R&Dセンターの責任者、そしてマイクロソフトリサーチアジアの元トップ研究者は、プロジェクトの当初の意図を次のように説明した。 頻繁に嫌がらせの電話を受けるのは本当に迷惑です。さらに、チーム会議がさまざまな電話によって嫌がらせや中断を受けることが多く、会議が開催できないことがあります。そこで、テクノロジーでこの問題を解決できないかと考えました。 こうしてアリの嫌がらせ対策コールAI「エルハ」が誕生した。 機械同士が戦えるようにする Alibaba AI Lab では、このインテリジェントな嫌がらせ防止通話テクノロジーのプロジェクト コード名は「Erha」です。 ユーザーが携帯電話でこのサービスを有効にすると、嫌がらせの電話を受けたときに、その電話を直接ロボットに転送することができます。 アリババは「Erha」の動作状況を示すデモ動画も公開した。 ローンを販売する女性営業マンが電話に出ると、1分以内にエルハさんは流暢に答えただけでなく、受動態から能動態に切り替えて「北京でローンを組むことはできますか?」「最大でいくら借りられますか?」と尋ねました。 彼女は会話の最中に「からかって」さえいた。「前にも電話したことがあるでしょう、聞き覚えがあるような気がします」。会話中ずっと、女性販売員は自分がロボットと話していることに気づいていなかった。 ***「Erha」AIも女性販売員から「WeChat ID」を尋ねられた。 このビデオが公開されるとすぐに、Weiboで話題になった。 「タイトルを読んでいなかったら、ロボットがいるとは思わなかっただろう」と驚く人もいました。 「機械戦争」を始めるために、いくつかの小さな提案をした人がいました。 AI研究者からのコメントもある。例えば、清華大学の劉志遠氏は、嫌がらせを防ぐだけでなく、偽装してデータセットを収集することもできると述べ、この技術の応用を称賛した。 また、アリババAI研究所傘下のTmall Genieは、このロボットは多くの人の「チューリングテスト」に合格したロボットだとも発表した。今ならTmall Genieアプリを開いたり、アリペイでTmall Genieを検索したりして、「Erha」をからかうことができる。 つまり、AI の問題は AI によって解決されているのです。 技術原理: インテリジェントチャット アリババAI北京研究開発センター所長の聶在青博士は、「Erha」の背後で使用されている主な技術はインテリジェントチャット技術であると説明した。 いわゆる「インテリジェント チャット」では、ユーザーのリクエストを理解し、強力なナレッジ グラフを使用してチャットのナレッジ ポイントを作成する必要があります。ユーザーとコミュニケーションをとることで、ナレッジ グラフ内の知識をユーザーに浸透させ、同時にユーザーからのフィードバックを導くことができます。 このプロセスでは、AIがユーザーと会話すればするほど、AIは多くの知識を学習し、ユーザーも会話を通じてお互いから学び、徐々にAIを友人とみなすようになります。 より具体的には、インテリジェント チャットでは、タスクを完了するために非常に高い精度を必要としないため、深層強化学習を使用して対話戦略を学習します。 そのため、AI がミスを犯したとしても、それほど問題にはなりません。ユーザーは、応答に不満を感じるだけです (所有者のタスクを 100% の正確さで完了することが求められるタスク完了時とは異なります)。 強化学習を通じて、次回の対話戦略アルゴリズムは、そのようなユーザーとどのようにチャットすればよいかをよりよく理解できるようになります。 垂直的な技術応用の観点から分類すると、音声認識、NLP、ナレッジグラフ、音声合成(TTS)などの技術がプロセス内で横断的に使用されます。 Nie Zaiqing氏は次のように説明した。 まず、音声認識技術を使用してユーザーの音声をテキストに変換します。 次に、自然言語理解技術を使用して、発信者の意図と特定のスロット値を抽出します。 そして、精密なナレッジグラフに対応し、「Erha」はユーザーの入力を現実世界の人や物と結び付けることができます。 次に、ユーザーの現在の入力内容と過去のやり取りからのコンテキスト情報に基づいて、Erha は次の文が発信者からの質問に対する回答になるか、発信者への質問になるかを決定する必要があります。 ***、Erha はテキストを人間の音声に変換するために音声コラボレーション テクノロジー (TTS) も使用する必要があります。 しかし、それは明確に聞こえ、手順も明確ですが、真実と偽りの区別を難しくすることは容易ではありません。 真実と偽りを区別しにくくするにはどうすればよいでしょうか? Nie Zaiqing は、次の 3 つの側面が核となるべきだと考えています。 ***、ユーザーのすべての単語をキャッチします。 ユーザーの入力スペースが非常に大きいため、発信者が話すすべての単語を理解してインテリジェントに応答することは困難です。 「Erha」の知識分野にない質問に対して、Alibaba AIは現在、ChitChat技術を使用して、インターネット上の公開人間対話ライブラリから最も適切な応答を見つけます。これは、情報検索に基づいて、上位の関連応答を見つける方法です。 目的は、電話をかけた人が「Erha」について知らない可能性があることを隠蔽することです。 次に、関連する質問を積極的にします。 これは会話戦略を学ぶ仕事であり、発信者に「Erha」が彼らの言うことを本当に理解できること、そして会話の文脈が理解されている場合にのみ尋ねられる適切な質問をできることを伝える必要があります。 受動的に応答するだけでは、簡単に発見されてしまいます。 この課題は非常に大きい。Nie Zaiqing 氏は 2018 年に AAAI で論文 (CoChat: タスク完了のためのボットと人間のコラボレーションの実現) を共同発表した。この論文の核心は、チャットボットの対話戦略学習フレームワークを提案し、「Erha」のようなチャットボットがさまざまなシナリオで学習を継続できるようにすることである。 教師あり学習、オンライン学習、深層強化学習(感情分析を使用して報酬と罰のフィードバック信号を提供する)が含まれます。さまざまなチャットボットは、独自のシナリオ要件に応じて、さまざまな学習戦略を選択できます。 たとえば、人間の作業員がいるカスタマーサービスの分野では、オンライン学習をより頻繁に使用できます。Erha のようなロボットは、教師あり学習から始めることができ、深層強化学習は継続的に改善することができます。 そして、人間との継続的な対話を通じて、「Erha」AI は深層強化学習を通じて目標をよりよく達成するためにどのように質問すればよいかをますますよく理解するようになります。 ***、実際の声、イントネーション、休止。 販売促進のための嫌がらせ電話を受けた場合、最初に電話に出た人が声からロボットだと判断すると、会話を続けなくなります。 そこで「Erha」は音声合成(TTS)の分野で多くの成果を上げました。 Alibaba AI *** アルゴリズムは、Tacotron とニューラル ネットワーク ベースのボコーダー アルゴリズムを使用して、非常にリアルな人間の声を合成しますが、残念ながら、大部分のケースではチューリング テストに合格できません。 そのため、「Erha」は現在、非常に高頻度の返信には実際の人物による録音を使用するという移行計画を採用しています。しかし、このプログラムは今後も衰退し続けることは間違いありません。 そして、「Erha」はもともと単なる課外プロジェクトだったことは注目に値します。
プログラマーを怒らせないで 「Erha」を開発する当初の意図は、実は、ますます頻繁になる嫌がらせ電話に対する怒りからでした。 聶在青さんは、ずっと同じ電話番号を使っていたため、漏洩はどんどん深刻になり、嫌がらせの電話を頻繁に受けるようになったと語った。 それはチームの仕事にも影響を及ぼしました。会議中、同僚たちはさまざまな電話に邪魔されることが多く、会議が終わってしまうことがありました。そこで、テクノロジーを使ってこの問題を解決する方法を考え始めました。 さらに腹立たしいのは、大量の嫌がらせ電話が機械によって自動的にかけられ、そのコストがどんどん下がっていることだ。 さらに、適切な時期、適切な場所、適切な人々でもあります。
Alibaba AI Labでは、Nie ZaiqingのチームがTmall Genieのアルゴリズムを担当しており、関連する才能あるチームはすべて、音声認識、NLP、ナレッジグラフなど、チェーン全体をカバーしています。 また、音声アシスタントと同様に、インテリジェントな会話のための基本的なアルゴリズムも普遍的です。 そこで彼らは、興味に駆られて「課外」プロジェクトを始めました。参加したエンジニアたちはとても満足していました。一方ではほっとした気持ちで、他方ではその背後にある意義を理解していました。 その後は順調に進み、今月初めにようやく企業に申請書を提出し、プロジェクトがスタートしました。 今年の3.15ガラでロボットによる嫌がらせ電話がこれほど注目を集めるとは予想していませんでした。 そこでチームは研究開発の成果を公開することに決め、「Erha」は正式に舞台裏から姿を現した。 一夜にして成功する。
AI電話秘書 しかし、「Erha」は嫌がらせの電話に対処するためだけに存在しているのでしょうか? いいえ。 聶在青氏は、「二哈」のさらなる目標は、みんなのAI電話秘書になることだと語った。嫌がらせ電話への対応を手助けするほか、忙しいときに発信者の主な意図を尋ねたり、予約の手配を手伝ったりすることもできる。
さらに、電話対応や議題に重点を置いたこれまでの秘書アシスタントと比べ、「Erha」のような AI 電話秘書は、パーソナライズされた TTS を使用して、所有者にとって非常にリアルな音声を模倣できます。 また、このような目標は達成不可能な「ビジョン」ではありません。 少なくとも現時点では、Erha を使用して AI コール転送を実装することは、もはや技術的な課題ではありません。 AI は、電話に出るのが難しい場合に電話に応答し、それをテキストに変換して「報告」するのに役立ちます。 あなたはそのような AI サービスにお金を払うつもりですか? |
<<: フロントエンド人工知能: 機械学習による関数方程式の導出 - プラチナ III
>>: 2019年の人工知能の給与水準、給与水準分析チャート、わかりやすい
2020 年は特別で忘れられない年であり、人工知能にとっても同じことが言えます。 [[374502]...
3月29日、市場調査会社Meticulous Market Researchが発表した最新のレポート...
序文前回の記事では列挙型の最適化について説明しました。今回は時刻形式である DateTime の最適...
アルゴリズムはビッグデータの最も価値のある部分です。ビッグデータマイニングとは、大量、不完全、ノイズ...
5G建設の展開に伴い、「デジタルトランスフォーメーション」という言葉も注目を浴び、さまざまな展示会...
線形代数は、ベクトル、行列、線形変換を扱う数学の分野です。これは機械学習の重要な基盤であり、アルゴリ...
アルゴリズムは人間の行動に基づいて「ロックイン効果」を生み出します。この法律では、ユーザーにパーソナ...
ロボットが環境内を移動するための最も効率的な方法の 1 つは、比較的滑らかな地形上で車輪を動かすこと...
私たちが SF の世界に引き込まれると、人工知能と機械学習 (AI/ML) の概念は、映画「マトリッ...
テクノロジー界ではもう一つ大きな出来事が起きている。中国で最も人気のある携帯電話ブランドであるHua...
水力発電ダムの壁は川の流れを制限し、川をよどんだ水たまりに変えてしまいます。これらの貯水池が古くなる...
再度調査中! 世界最大の半導体設計ソフトウェア(EDA)サプライヤーであるシノプシスは、中国に重要な...