AI はどのようにして人間の会話の内容を認識するのでしょうか?マイクロソフト研究チームがお伝えします

AI はどのようにして人間の会話の内容を認識するのでしょうか?マイクロソフト研究チームがお伝えします

[[280027]]

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

最近、マイクロソフトの研究チームは、コンテキストモデリングの研究を通じて新しい方法を考案しました。この方法では、AI モデルがコンテキストの履歴記録を通じて会話の最後の言葉を書き換えることができます。では、これはどのような研究方法なのでしょうか?

これについてはKYLE WIGGERS氏が詳しく紹介しており、Leifeng.comは彼の記事の意味を変えずに以下のようにまとめた。

発表前の論文で、Microsoft Research チームは、オープンドメイン会話の教師なしコンテキスト書き換えに関する研究の詳細を説明しました。彼らは、実験結果が書き換え品質と複数ラウンドの応答生成の点で新たなベンチマークに到達したと主張している。

研究者らが説明しているように、会話の文脈では、話題の切り替え、共参照(彼、彼女、それ、彼らなど)、長期的な依存関係など、文のモデリングには見られない課題が生じます。ほとんどのシステムでは、最後の段落にキーワードを追加したり、AI モデルを使用して数値表現を学習したりすることでこれらの問題を解決していますが、このアプローチでは、正しいキーワードを選択できない、長いコンテキストを処理できないなどの障害に遭遇することがよくあります。

ここで、Microsoft Research チームのアプローチが役に立ちます。コンテキスト情報を考慮して会話の最後の文を書き直します。これにより、相互参照がなく、過去の会話の他の発話に依存しない独立した発話が生成されます。

Leifeng.com 注記: [画像ソース: Microsoft 所有者: Microsoft]

たとえば、「私はコーヒーが嫌いです。 - - なぜですか? おいしいのに。」を「なぜコーヒーが嫌いなのですか? おいしいのに。」に変える場合、「it」と「why」が借用されています。ここで、「it」は会話の中で言及されているコーヒーを指し、「why」は「なぜ私はコーヒーを飲むのが嫌いなのか」の略語です。

この目的のために、研究者らは、エンドツーエンドのプロセス自動化を実現する機械学習システムであるコンテキスト書き換えネットワーク (CRN) を設計しました。このシステムは、固定長の発話を固定長の書き換えられた文にマッピングするシーケンスツーシーケンス モデルで構成されています。さらに、最後の発話内のさまざまな単語を見て、文脈から単語をコピーするのに役立つ別の注意メカニズムも備えています。

それで、このシステムはどのように設計されたのでしょうか?

まず、Microsoft Research チームは、コンテキストからキーワードを抽出し、それを元の会話の最後の発話に挿入することで生成された疑似データを使用してモデルをトレーニングしました。次に、最終的な応答が書き換えプロセスに影響を与えるように、強化学習を使用してシステムを目標に向けて誘導しました。

Leifeng.com 注記: [画像ソース: Microsoft 所有者: Microsoft]

一連の実験で、チームは、書き換え品質、マルチターン応答生成、マルチターン応答選択、エンドツーエンドの検索ベースのタスクなど、いくつかのタスクでアプローチを評価しました。強化学習後、文脈からより多くの単語を抽出する傾向があるため、モデルが時々不安定になることに彼らは気づきましたが、発話の多様性も大幅に改善されました。

Microsoft Research チームは、この取り組みがより解釈可能で制御可能なコンテキスト モデリングへの一歩になると考えています。さらに、研究チームは、このモデルはノイズの多い文脈から重要なキーワードを抽出し、それを最終発話に挿入することができるため、制御や解釈が容易になるだけでなく、最終発話に情報を直接伝えるのにも役立つと述べています。

<<:  自動運転のスケールアップ問題

>>:  ガートナーの2020年のトップ10戦略的テクノロジートレンド: ハイパーオートメーション、分散クラウド、AIセキュリティなど

ブログ    
ブログ    

推薦する

...

...

左手にビッグデータ、右手に人工知能。これらのプログラマーは、パンデミック中に何をしたのでしょうか?

今年初めの流行は、特にCOVID-19の非常に感染力が強い性質により、適切な免疫ワクチンがない中で原...

Python を使用したソーシャル メディア感情分析の入門

[[265146]]自然言語処理の基礎を学び、2 つの便利な Python パッケージを調べます。自...

AIがITサービス管理をどう変えるか

SF映画に登場する人工知能(AI)ロボットは、通常、非常に賢く器用です。 [[276115]]人工知...

食品サービス機器業界の主な動向

[[442813]]画像ソース: https://pixabay.com/images/id-673...

ブロックチェーンとAIを最大限に活用する方法

急速に進化する今日のテクノロジー環境において、成功を目指す企業にとって、常に時代の先を行くことが重要...

...

機械学習は音楽界を征服するのに役立ち、あなたは次のヴィンセント・ファングになるでしょう

私はアークティック・モンキーズが大好きですが、彼らはもう何年も新しいシングルをリリースしていません。...

インテリジェントオートメーション: コンピュータビジョン、AI、ARが統合されるとき

インテリジェント オートメーションは、業界がまだビジネスに統合していない、かなり新しい概念です。この...

時間畳み込みネットワーク: 時系列の次の革命?

この投稿では、最近の TCN ベースのソリューションをいくつかレビューします。まず、動き検出のケース...

人工知能の時代では、プログラマーは排除されるのでしょうか?

よく考えてみると、この質問は少し皮肉に思えます。将来、新しいクリエイター (AI) がクリエイター ...

...

Ant Group は、動画の著作権侵害検出用に 16 万本の動画ペアと 28 万本のクリップペアからなる大規模なデータセットを公開しました。

従来の著作権保護業界は、時間がかかり、労働集約的で、コストがかかります。膨大な量のコンテンツを完全に...