ナレッジ グラフは、機械が世界を理解するための基礎です。この 3 人の専門家がナレッジ グラフ テクノロジーをどのように使用しているかをご覧ください。

ナレッジ グラフは、機械が世界を理解するための基礎です。この 3 人の専門家がナレッジ グラフ テクノロジーをどのように使用しているかをご覧ください。

[51CTO.comよりオリジナル記事] 6月21日、WOT2019グローバル人工知能技術サミットが北京JWマリオットホテルで予定通り開幕しました。 2019 年に世界中の技術者の間でオフライン交流が行われる有名なサミットとして、このカンファレンスは、一般技術、応用分野、企業のエンパワーメントという 3 つの主要な章を中心に展開されます。世界中から60名を超えるトップAI専門家が集まり、1,000名を超える参加者とともに、ディープラーニング、ニューラルネットワーク、ビジュアルテクノロジー、自動運転車、機械学習、アルゴリズムモデル、ナレッジグラフなどのトピックに関する技術コンテンツを共有しました。

[[270904]]

6月21日午後、総合技術支部C会場のナレッジグラフ技術フォーラムに、スイス再保険データサイエンティストの王冠氏、美団点評の上級アルゴリズム専門家の潘陸氏、中国科学院自動化研究所の准研究員の何世珠氏を含む3名の上級専門家が招待され、素晴らしい講演を行いました。会議後、51CTOは専門家のスピーチのエッセンスが皆様のお役に立てばと願い、スピーチをテキストにまとめました。

[[270905]]

スイス再保険データサイエンティスト 王冠

ナレッジグラフの構築: データ、アルゴリズム、アーキテクチャ

ナレッジ グラフは保険業界で多くの用途があります。Wang Guan 氏は、4 つの主要な応用シナリオを挙げました。1 つ目は、インテリジェントなインタラクションです。顧客が保険金請求をするとき、顧客は自分の保険が補償されるかどうかを知りたいと考えています。これは、ポリシーの条件を単に列挙するだけでは答えられません。保険商品、顧客データ、会話記録、医療費などのさまざまな情報をナレッジ グラフに統合し、インテリジェントなカスタマー サービスを通じて顧客に迅速にフィードバックを提供する必要があります。 2つ目は、正確なレコメンデーションです。ナレッジグラフを通じて顧客のデータを習得することで、顧客に合った商品を正確にレコメンドすることができます。 3 つ目は、自動請求決済です。現在、ほとんどの請求決済は手動で行われており、特に大規模な保険契約では手作業による調査が必要です。しかし、ナレッジ グラフ テクノロジーにより、いくつかの履歴データを見つけて結論を導き出すことで、自動請求決済を実現できます。 4 番目は、詐欺対策です。保険金詐欺に直面した場合、ナレッジ グラフを使用すると、保険金詐欺師の詐欺の痕跡を簡単に見つけることができます。対応するクエリ ステートメントをいくつか記述することで、一般的な詐欺パターンを見つけることができます。

では、保険業界向けのナレッジ グラフはどのように構築するのでしょうか。これは、ナレッジ システムの構築、ナレッジ ベースの取得、融合、保存、推論、適用などの複数のリンクが関係する非常に複雑なプロセスです。王冠氏は現場でのエンティティと関係性の抽出アルゴリズムに焦点を当て、エンティティとエンティティ間の関係性を抽出することで、非構造化および半構造化テキストデータからナレッジグラフを構築しました。王冠氏は、テキストからベクトルへの変換を実現する抽出アルゴリズムにおいて、単語の埋め込みが非常に重要であると強調した。ベクトルがトレーニングされていれば、中国語の意味を非常にうまく表現し、関連する単語を自動的にキャプチャできる。

情報抽出ツールのアーキテクチャ

テキスト標準ツールのアーキテクチャ

エンティティ認識と関係抽出はどちらも自然言語処理において非常に重要なタスクですが、Wang Guan 氏はそれらについて詳しく説明しませんでした。彼は、さまざまなシナリオに応じてナレッジ グラフを構築する方法はたくさんあると述べました。エンティティはノード、関係はエッジであり、基礎となる関係は最短パス マイニングを通じて見つけられます。 「現在、ナレッジ グラフのアプリケーションは、主に視覚化/探索、グラフ アルゴリズム、グラフ データベース (リレーショナルおよび NoSQL) の 3 つの側面に集中しています。」講演では、非常に実用的な情報抽出ツールとテキスト注釈ツールのアーキテクチャも紹介されました。彼は特に、これらの設計により、人間とコンピューターの相互作用がよりインテリジェントになり、ナレッジグラフがデータマネージャーとフルプロセスの機械学習ツールになると強調しました。

美団点評の上級アルゴリズム専門家、パン・ルー氏

O2Oインテリジェントインタラクションシナリオにおけるナレッジグラフベースの質問応答の応用と進化

[[270906]]

Pan Lu 氏はまず、人間とコンピューターのインタラクションの進化とインテリジェントなインタラクションの種類について検討しました。次に、Meituan の実際の生活シナリオでは、情報取得、リソースのクエリ、さらにはタスクベースのインタラクションを実行する場合、質問応答システムはナレッジ グラフと切り離せないものであるという事実に焦点を当てました。この記事では、制限されたシナリオにおける質問と回答の内容を抽出します。

Pan Lu 氏は、従来の KBQA (知識グラフベースの質疑応答) は、主に意味解析と情報検索という 2 つの主要な技術分野に分かれていると述べました。セマンティック解析は、元の質問を機械が理解できる論理形式に変換します。この形式はナレッジ グラフのストレージ構造に近いため、直接または間接的にクエリを実行できます。情報検索では、有効な情報を抽出することで、候補となる回答を直接見つけます。それには 2 つのアプローチがあります。1 つはトリプルを使用して自然言語を生成し、それを元の質問と比較してクエリを実装する方法です。もう 1 つは、候補となる回答とその周囲のパスをエンコードし、エンコードされた元の質問と比較して回答を取得する方法です。

美団の制限されたシナリオ(注文を例にとると、料理の種類が限られており、料理の配達場所と時間も限られている)では、どのような技術的道を選ぶべきでしょうか? パン・ルー氏は、美団は多くの分野に関わっており、分野間の相関関係は弱く、ラベル付けされたデータが十分ではなく、急速な分野移行のニーズにも応えなければならないと述べました。情報検索のアイデアから学びながら、同時にグラフを照会するためのクエリステートメントを構築することは可能でしょうか? そこで Meituan は、情報検索 + セマンティック解析のソリューションを提案しました。これは、エンティティ リンクを介してサブグラフを決定し、次に関係識別、スロット識別を行い、最後に SparQL を生成してクエリを実行します。各ステップは、単純なルールでコールド スタートすることも、教師なしモデルまたは教師ありモデルでコールド スタートすることもできます。

パン・ルー氏は、制限されたシナリオにおいて、美団が直面する問題の主な特徴は、意図空間の制限、リソースの制限、インタラクションラウンド数の制限、知識拡張の制限であると強調した。したがって、これに基づいて、彼らが提案した KBQA には、基本属性の質問と回答、制約付きリソース クエリ、リソース情報の比較、および動的属性値の計算という 4 つの主要な機能があります。

中国科学院自動化研究所パターン認識国家重点研究室准研究員、何時珠氏

ナレッジグラフに基づく質問応答の主要技術

[[270907]]

何世柱氏は情報表現の発展の歴史について話すことから始めた。同氏は、知識グラフは機械が世界を理解するための基礎であり、言語システムと知識グラフは知識応用の礎でもあり、質問応答システムは次世代検索エンジンの基本形式になると述べた。

彼は、知識質問応答には通常2種類の方法があると紹介しました。1つは意味解析法で、正確性が高く再現率が低く、複雑な問題を解決でき、限られた分野と限られた言語表現に適しており、経験的に解決できます。機械学習方法のトレーニングを必要とせず、制御と介入が容易です。 2 つ目は自然​​な質問応答方式です。これはより使いやすいインタラクティブ インターフェースを備え、知識駆動型とデータ駆動型の統合を実現できますが、より高品質の元のデータとそれをサポートする知識リソースが必要です。

何世珠氏の見解では、自然言語による質疑応答と正確な知識による質疑応答およびチャットボットの違いは、正確な知識による質疑応答は主に知識に関する質問に答えることです。まず、答えは正確でなければなりません。次に、正確さに基づいてのみ、感情的なニーズを満たし、自然言語で応答できるようになります。

「質問応答タスクの場合、リソースと既存のモデルがニーズを満たせるかどうかが鍵となります。実際、コンテンツが著しく不足しており、リソースは十分ではなく、モデルの数も少ないです。オープンドメインの質問応答システムのパフォーマンスは実用的とは言えませんが、限られた分野での応用の余地はまだたくさんあります」と何世珠氏は結論付けました。

上記の内容は、WOT2019グローバル人工知能技術サミットの「ナレッジグラフ」サブフォーラムの講演内容に基づいて51CTO記者がまとめたものです。より完全なWOTコンテンツについては、.comに注目してください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  第 4 次小売革命を経て、WOT の 3 人の専門家が真のスマート小売とは何かを語ります。

>>:  ガートナー: 高等教育における人工知能

ブログ    
ブログ    

推薦する

...

AIスタートアップ向け優秀開発ツールガイドが人気に、Jupyterの「キラー」も発見される

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

面接前に必ず読むべきソートアルゴリズムトップ10

[[419332]]導入プログラマーとして、上位 10 のソート アルゴリズムは必須であり、すべて...

EasyDLは、臨床試験データの敵対的学習と複数のアルゴリズムの比較を簡単に処理します。

[51CTO.com からのオリジナル記事] 画像学習は高度なアルゴリズムであり、画像への高い適応...

調査レポート:世界のテクノロジー支出は2024年に5.3%増加して4.7兆ドルに達する

調査によると、2024年の世界のテクノロジー市場では期待できる出来事がたくさんあることが分かっていま...

グッドホープ・リンユンは並外れた知恵とビジョンを持っています丨2021グッドホープ・パートナーサミットが桂林で開催されました

2021年9月9日、「大空に舞い上がる希望、素晴らしいビジョンを持つ」2021年グッドホープパートナ...

7.4K スター! わずか数分で機械学習モデル用の美しいインタラクティブ インターフェースを生成できます

Gradio は、機械学習やデータ サイエンス関連のデモや Web アプリケーションを構築するための...

ビッグデータとアルゴリズムについて言えば、これらを知っておくことはあなたにとって大きな利益となるでしょう

この記事では、ビッグデータ アルゴリズムを理解するプロセスをまとめます。本文は、アルゴリズムに関する...

注目すべきデータ視覚化の5つの新たなトレンド

[[412404]]データの視覚化はビジネス指標を理解するための最新の方法です情報の世界におけるテク...

...

運転教習業界にも「AI」の波が吹き荒れる、普及規模に注目

[[422314]]近年、都市化と道路交通建設の加速により、自動車旅行の需要が継続的に増加しており、...

スマートビルディングのためのビルディングオートメーションと IoT

[[350210]]今日、私たちが建物について語るとき、それは単なる外殻を意味するのではなく、さま...

最高の AI 学習アプリ トップ 10

人工知能の革新により、ツールの使用方法は変化しています。 AI 学習アプリケーションは、適応型学習、...

顔認識にはリスクがあり、米国は全面的に禁止しているが、なぜ中国はこれほど広く推進しているのだろうか?

顔認識にはリスクがあり、米国は全面的に禁止しているが、なぜ中国はこれほど広く推進しているのだろうか?...

...