ソーシャル ネットワークには、有名な「6 次の隔たり理論」があります。 「世界中のどんな見知らぬ人でも、せいぜい 5 人を通じてしか知り合うことができません。」 「六次の隔たり理論」の背後にあるナレッジグラフは、ソーシャルネットワークがすべての人を結びつけるのに役立つ「ブラックテクノロジー」です。ナレッジ グラフは、エンティティの概念 (人など) をノードとして使用し、関係をエッジとして使用し、視覚的なグラフィックを使用して人々の社会的関係を直感的に表現します。現在、この技術は検索、金融などの分野で広く応用されています。
では、上記のナレッジグラフで「人」を「物」に置き換えるとどのような変化が起こるでしょうか? 明路科技集団の主任科学者で明路科学院の院長である呉新多教授は、伝統的な知識グラフは「何」という質問に答えるのに対し、「物質」を核とする事実グラフは「なぜ」という質問に答えると答えた。現在、ほとんどのナレッジグラフは主にエンティティ(特に名前)に基づいており、イベントナレッジグラフ研究のためのコーパス構築と研究方法はまだ探索段階にあります。
呉新東 「ナレッジグラフの焦点は『知識』から『イベント』へと移り、これは自動ナレッジグラフ構築の分野が成熟しつつあることを表しています。単一の静的なファクトベースのグラフ構築モデルでは、もはや業界のニーズを満たすことはできません。業界は、動的なファクトグラフやその他のより深い意味理解技術に切実な関心を抱いています」とウー・シンドゥオ氏は AI テクノロジーレビューに語った。 1 イベント関係抽出: 静的な知識を動的にする ナレッジグラフの概念は、2012 年に Google によって提案されました。これは、文字列ベースの検索をエンティティベースの検索に置き換え、ユーザーの検索品質とエクスペリエンスを向上させるために検索エンジンによって最初に使用されました。ビッグデータの時代において、ナレッジグラフはインターネット情報を人間の認知世界に近い構造化された形式で表現し、膨大な量のインターネット情報をより適切に整理、管理、理解する方法を提供します。 ナレッジ グラフを構築するための前提と中核となる条件は、知識の獲得です。具体的には、現実世界にあるさまざまな「情報」を「知識」に変換し、それをコンピュータが保存・計算できる構造に表現し、さらに「グラフ」を形成することが必要です。ナレッジ グラフの初期の構築は、人間による分類に大きく依存していました。たとえば、Wikipedia は「クラウドソーシング」アプローチを採用し、ネットユーザーが知識の貢献者になれるようにすることで、ナレッジ グラフの蓄積を加速しました。
しかし、ビッグデータの時代では、手作業ではナレッジグラフ構築のニーズを満たすことができなくなりました。多くの企業が、機械を使用してさまざまなソースや構造からデータを抽出し、知識を形成してそれをナレッジグラフに保存する、自動化された建設技術を積極的に調査および試行し始めています。産業界の実務においては、テキスト情報などの非構造化データから知識を抽出し、ナレッジグラフを構築することには多くの技術的な課題があります。 これは、トップクラスのデータマイニングカンファレンス ICDM が 2019 年からナレッジグラフ コンペティションを開催している理由でもあります。 「ナレッジグラフはMinglueの専門技術分野です。Minglueは、ナレッジグラフの学術研究と産業実践の連携と交流を促進する義務があると考えています。」2019年のICDMは北京で開催されました。会議の発起人であり、データマイニング分野の第一人者であるWu Xinduo教授は、会議の創設以来ずっと会議に参加しています。今回のセッションでは、Wu Xinduo教授は会議の議長を務めただけでなく、第1回ナレッジグラフコンペティションの設立を推進し、ナレッジグラフにおける学術的および産業的交流の重要なプラットフォームにしました。 ICDM 2019 ナレッジグラフ コンペティションのテーマはナレッジグラフの自動生成ですが、2020 年のコンペティションのテーマ「イベント原因抽出」は産業用アプリケーションに近いものとなっています。課題は、シナリオ マーケティングにおける大きな問題点、つまり、消費者行動に関連するコンテンツ シナリオと関係知識をインテリジェントに分析および抽出し、データ マイニング、機械学習、NLP などのテクノロジを使用してモデルを構築し、テキストから消費者イベントの原因と結果をインテリジェントに抽出する方法を解決することです。 ICDM 2020 ナレッジグラフ コンペティションの共同議長であり、中国科学院自動化研究所の研究者である Liu Kang 教授によると、イベント関係の抽出は情報抽出の中でもより難しいタスクです。エンティティ関係抽出と比較して、イベント関係抽出では 2 つのイベント間の関係を決定する必要があり、テキスト内のイベントの説明は通常より複雑で、1 文または複数の文になる場合があります。
リュウ・カン さらに、イベント抽出タスクは、イベントタイプの判断とイベント要素の抽出に重点を置いており、これは単一のイベント内の意味認識に属します。一方、イベント関係は、異なるイベント間の複雑な関係の意味認識に重点を置いています。より正確なイベント抽出は、イベント関係のパフォーマンスを向上させることができます。 AI Technology Reviewによると、今年のナレッジグラフコンペティションの競技データは、実際の公開ユーザー消費レビューデータを使用しており、データ品質の低さ、複数の言語、一貫性のない形式などの問題があり、競技の難易度が高まっています。 これは、ナレッジ グラフのアプリケーションにおいて業界が解決する必要のある問題でもあります。ナレッジ グラフのノードは静的に記述されるエンティティですが、イベントは動的です。エンティティと比較すると、イベントは発生したさまざまな事実情報をより明確かつ正確に表現できます。また、人間の命題記憶は「イベント」に保存され、実際の消費者レビューはまさにそのような動的な情報を反映しています。機械が人間の脳の知識構造システムに近い方法で知識を処理し、推論を実行できるようにすることで、機械は複雑なシナリオにおける特定の問題をよりよく理解し、ユーザーに優れたエクスペリエンスを提供できるようになります。 言い換えれば、ナレッジグラフ内の知識を「動かす」ことは、学術界が人工知能をより良く実現する方法を研究するための手段であるだけでなく、業界が顧客にさらにインテリジェントなサービスを提供し、サービス品質を向上させ、コストを削減するためのニーズでもあります。 2020年のナレッジグラフコンペティションには、北京大学、清華大学、中国科学院、香港中文大学、コーネル大学、シンガポール国立大学などの有名大学や、アリババ、テンセント、ファーウェイ、百度、JD.comなどの企業を含む45か国から2,000を超えるチームが参加しました。 では、イベント関係抽出は、企業のビジネス能力の向上にどのように役立つのでしょうか? 2 イベント関係抽出の役割 劉康教授はAI Technology Reviewに対し、ナレッジグラフの分野では学界とビジネスが密接に結びついており、関連技術には企業における豊富な応用シナリオがあると語った。これにより、学界は理論を研究しながら、技術とシナリオの実際の実装にも重点を置くようになった。今回のコンペティションの策定においても、提案の専門家はこの点を非常によく考慮した。 参加企業のJD.comを例にとると、ナレッジグラフの使用により、業界や企業のデータを自動的に整理して金融データベースを形成し、金融機関が差別化された競争上の優位性を形成するのに役立ちます。ナレッジグラフは、JD Finance App にも提供され、さまざまな業務ラインの営業対話ロボットをサポートし、推論質疑応答、論理判断質疑応答、クエリ質疑応答などの機能を備えたインテリジェント質疑応答システムを提供します。 業界や企業のアプリケーションに加えて、コンテンツ広告やソーシャル リスニングなどの多くのビジネス シナリオでは、消費者イベントの原因の抽出に重点が置かれています。コンテンツ広告を例にとると、今日の広告主は、製品機能を通じてコンテンツを埋め込み、ブランドや製品を消費イベントと巧妙に結び付けることを好みます。そのため、消費者イベントの原因を明示的に抽出することは、広告主のニーズを満たすシステムを構築するための重要な技術になります。 ナレッジグラフ技術は業界での応用が急速に進んでいますが、最先端の学術的成果と実際の応用シナリオの間には依然として大きなギャップがあります。ほとんどの企業には、JD.com のようにナレッジ グラフ内のイベント関係を使用してビジネスを改善する機能がありません。 「因果グラフに基づくアプリケーションは、マーケティング、金融、工業など、複数の業界で登場しています。」ウー・シンドゥオ教授はAIテクノロジーレビューに対し、ミンルー・テクノロジーは企業が因果グラフに基づくアプリケーションを推進するのを支援するのに十分なアイデアと実践を持っていると語った。 「例えば、Minglueの実践では、イベント抽出技術を使用して、世論のホットなイベントを特定し、異なるニュースで言及された同じイベントを集計して人気度をカウントし、バブルチャートなどでイベントの発展傾向を視覚化することで、マーケティングコピーの自動作成と垂直フィールドレポートの自動生成をガイドしています。」 金融業界では、明路科技は浦東発展銀行と協力して、金融認知工学方法論の研究と理論システムの構築を共同で推進し、産業金融生態協力における金融認知インテリジェンスシステムを継続的に改善し、国内トップクラスの認知インテリジェンスプラットフォームインフラストラクチャを構築し、ユーザーの洞察力、知覚、対話能力を強化しています。産業分野では、Minglu は鉄道輸送などの複数の業界におけるインテリジェントなメンテナンスと障害原因特定シナリオの詳細な調査も行っています。 さらに、Minglu Technology はビッグデータと AI テクノロジーに基づいた業界知識グラフも構築しています。ナレッジグラフの自動構築は、Mingluのコアテクノロジーの1つです。2020年7月、2020 WAIC世界人工知能大会で、Minglu Technologyは、音声からリアルタイムでグラフを生成できる世界初のエンタープライズレベルのナレッジグラフ開発ツールキットであるHAO Graphを発表しました。HAOは、専門家がステージで話している間に、バックグラウンドのグラフシステムが自動的に同期してナレッジグラフを構築できるというものです。 HAO グラフは独立して実行することも、企業の技術チームに引き渡して二次開発を行うことで、ユーザーや中小企業に幅広いサービスを提供することができると報告されています。現在、HAO グラフは、デジタル都市、金融、産業、広告、マーケティングなどの複数のシナリオに実装されています。 「HAOガバナンス」モデルアーキテクチャ図 企業にとって、ナレッジグラフの構築は、社内の構造化データ、IoTデータ、外部の非構造化データを結び付けるのに役立ち、次世代の企業データ管理の主流技術ルートになる可能性があります。Minglu Technologyは、ナレッジグラフイベント抽出の分野における新しいトレンドも組み合わせて、企業がナレッジグラフとデータ管理をアップグレードするのを支援します。 3 ナレッジグラフの未来 ナレッジグラフは業界ではある程度応用されていますが、学術研究の観点から見ると、ナレッジグラフの研究は現在急速な発展の初期段階にあり、従来のエンティティ中心のアプローチからイベントなどの複雑に構造化された知識へと移行しつつあるとLiu Kang教授は考えています。 「事前学習済み言語モデルとの組み合わせで、重要なグラフが出現する可能性があります。現在、BERTに代表される事前学習済み言語モデルは、さまざまなNLPタスクで活躍していますが、これは主にビッグデータとコンピューティングパワーの進歩によるものです。しかし、そのようなモデルにどのような知識が含まれているか、また、事前学習済み言語モデルの表現能力を向上させるために知識グラフをどのように使用するかによって、比較的大きなブレークスルーが達成される可能性があります。」Liu Kang教授は、ナレッジグラフの今後の発展動向について語った際にこのように述べました。 基本的に言えば、エンティティからイベントへのコアの移行は、ナレッジ グラフに基づく人工知能の推論の技術的な性質を変えるものではありません。コアの課題は、グラフ上で最適なソリューションを探す際に直面する組み合わせ爆発のジレンマのままです。近年、BERT や GPT-3 などの大規模な事前トレーニング済み言語モデルの出現により、因果グラフの組み合わせ爆発ジレンマを解決するための新しい方法も提供されています。
2020 年のナレッジグラフ コンペティションでは、さまざまなチームの技術的ソリューションも見られました。例えば、JD.comは関係行動の原因抽出というタスクを再検討する新たな視点を導入し、行動タイプと行動の原因を別々に抽出するのではなく、新しいシーケンスラベリングフレームワークを提案しました。2位の日本の参加者はGANを使用してこのタスクを完了し、GAN生成方法を通じてトレーニングサンプルを増やし、GANによって生成されたデータをFakeとしてマークしました。元の5つの時間タイプに基づいて、予測のためにFakeラベルが追加されました。 Liu Kang 教授は、知識グラフの分野における将来の研究は、マルチモーダル性、複雑に構造化された知識、ドメインベースの知識へと発展する可能性があると考えています。その中で、様々なタイプの知識をどのように表現すればよいのでしょうか?常識的な知識をどのように抽出するか?マルチモーダル情報を組み合わせて複雑な構造知識を自動的に取得するにはどうすればよいでしょうか?これらはすべて、彼がより興味深いと考える研究課題です。 呉新多教授は、知識グラフの実用化に向けた重要な発展方向は、静的な知識の記述から動的な問題解決へと移行することだと考えています。原理グラフは問題解決のために動的な情報にアクセスできるため、知識グラフの推論に動的な翼が与えられます。 人工知能技術における知識コンテナおよびインキュベーターとして、ナレッジグラフは AI 分野の将来の発展において重要な役割を果たすでしょう。エンティティに基づく従来のナレッジグラフであれ、イベントに基づく新世代のナレッジグラフであれ、その構築技術の発展と応用シナリオの探求は継続され、この過程でナレッジグラフ構築技術はますます自動化の方向へと進んでいきます。同時に、Minglueに代表されるAIとビッグデータ企業の推進により、ナレッジグラフはますます多くの分野で真に実装できる応用シナリオを見つけ、あらゆる分野の生産性を解放し、ビジネス変革に貢献します。 |
<<: AIが臨床試験でスムーズな患者マッチングを実現する方法
AI分野におけるモデリング手法として、微分方程式と機械学習がありますが、それぞれの利点は何でしょうか...
[51CTO.comよりオリジナル記事] 近年、都市化の急速な発展に伴い、中国の都市の街灯の数はます...
人工知能は急速に企業間の差別化要因になりつつあります。ここでは、AI エリートとしてすぐに必要となる...
TVM は、あらゆる種類の CPU、GPU、その他の特殊なアクセラレータで動作するオープンソースのデ...
新型コロナウイルス感染者数がほぼ指数関数的に増加し、世界は機能停止状態に陥っている。世界保健機関によ...
[[275226]]コールドスタンバイとホットスタンバイコールドスタンバイとは、通常は稼働していな...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能 (AI)、自動化、認知システムを取り巻く原則と実践は、ビジネス分野、専門知識、専門分野に関...
[[334871]]原題:「人間の顔認識」から「犬の顔認識」まで、人工知能はペット経済にも参入する...