[51CTO.comより引用] モバイルインターネットの発展に伴い、あらゆるものの相互接続が可能になり、この相互接続によって生成されるデータも爆発的に増加しています。これらのデータは、関係性を分析するための有効な原材料を提供するだけでなく、人工知能の急速な発展に膨大なデータ配当をもたらします。そのため、ナレッジグラフが誕生し、近年注目の技術となりました。 今日は、概念、表現、構成、応用という 4 つの側面からナレッジ グラフを詳細かつ包括的に調査してみましょう。 ナレッジグラフとは何か ナレッジグラフ (KnowledgeGraph/Vault) は、科学的ナレッジグラフとも呼ばれ、2012 年に Google によって提案された新しい概念です。 Google のナレッジ グラフのアーキテクチャに基づくと、ナレッジ グラフは、大まかに言えばセマンティック ウェブとして理解できます。セマンティック ウェブは、ナレッジ ベースと密接に関連しているものの、明らかな違いがあるテクノロジ スタックです。Google の設計コンセプトでは、ナレッジ グラフの目標は、情報過多の問題を解決することです。 Google ナレッジグラフ アーキテクチャ 少し抽象的な感じがしますか?視点を変えてみましょう。実用化の観点から、ナレッジ グラフは単純にマルチリレーショナル グラフとして理解できます。ナレッジ グラフは、データ マイニング、情報処理、知識測定、グラフィックス描画などの一連の方法を通じて、さまざまなタイプの情報 (異種情報) をすべて接続することによって得られるリレーショナル ネットワークです。ナレッジグラフは、「関係」の観点から問題を分析する機能を提供します。 ナレッジグラフの表現 ナレッジ グラフ アプリケーションの前提は、ナレッジ グラフが構築されていることであり、これはナレッジ ベースとも考えられます。これは、検索関連の質問に答えるためにも使用できる理由です。たとえば、Baidu 検索エンジンに「Lu Han のガールフレンドは?」と入力すると、「Guan Xiaotong」という答えが直接得られます。これは、「Lu Han」と「Guan Xiaotong」のエンティティとそれらの関係を含むシステム レベルの知識ベースを作成したためです。したがって、検索を実行すると、キーワード抽出(「Lu Han」、「Guan Xiaotong」、「ガールフレンド」)とナレッジベースでのマッチングを通じて、最終的な回答を直接取得できます。この検索方法は、従来の検索エンジンとは異なります。従来の検索エンジンは最終的な回答ではなく Web ページを返すため、ユーザーが自分で情報を選別してフィルタリングする追加のプロセスがあります。 現実の世界では、エンティティと関係にも独自の属性があり、たとえば人物には「名前」や「年齢」があります。ナレッジ グラフに属性がある場合は、プロパティ グラフを使用してそれを表現できます。次の図は単純なプロパティ グラフを表しています。劉二さんと劉強さんは父と息子で、劉二さんの電話番号は159から始まる。この電話番号は2018年に有効化されており、2018年は関係の属性として利用できる。同様に、劉二自身も、35歳という年齢や自営業者という立場など、いくつかの属性値を持っています。 ナレッジグラフの構成 ナレッジ グラフの構築は、反復的な更新プロセスです。知識獲得のロジックによれば、反復の各ラウンドは次の 3 つの段階で構成されます。 1. 情報抽出:さまざまな種類のデータソースからエンティティ、属性、エンティティ間の関係を抽出し、これに基づいてオントロジー知識表現を形成します。 2. 知識の融合: 新しい知識を獲得した後、矛盾や曖昧さを排除するためにそれを統合する必要があります。たとえば、一部のエンティティには複数の表現がある場合があり、特定のタイトルが複数の異なるエンティティに対応する場合があります。 3. 知識処理(計算 + アプリケーション):統合された新しい知識については、知識ベースの品質を確保するために、適格な部分を知識ベースに追加する前に、品質評価(一部のスクリーニングには人間の参加が必要)を受ける必要があります。 ナレッジグラフアーキテクチャ分析図 ナレッジグラフの応用 ナレッジグラフ技術は、さまざまなビジネスシナリオに多数のインテリジェントなアプリケーションと成功事例をもたらしました。上記の検索エンジンの例(最も代表的な海外の検索エンジンはGoogle SearchとMicrosoftのBing Search、国内の主流検索エンジン企業にはBaiduやSogouなど)は、氷山の一角にすぎません。エディターを使用して、ナレッジグラフの他のアプリケーションを見てみましょう。 ナレッジグラフ関連技術により、目論見書、年次報告書、企業発表、証券会社調査レポート、ニュースなどの半構造化テーブルや非構造化テキストデータから、企業の株主、子会社、サプライヤー、顧客、パートナー、競合他社などの情報を一括して自動抽出し、企業のナレッジグラフを構築することができます。 マクロ経済イベントや企業関連イベントが発生した際、証券アナリスト、トレーダー、ファンドマネージャー、その他の投資研究者は、このマップを使用してより深い分析を行い、より適切な投資判断を下すことができます。たとえば、米国が ZTE への輸出を制限したというニュースが発表された後、ZTE の顧客、サプライヤー、パートナー、競合他社の関係マップがあれば、ZTE が取引を停止した場合に影響を受ける国際上場企業と国内上場企業を迅速に選別し、投資機会を探ったり、ポートフォリオのリスク管理を行ったりすることができます。 ナレッジグラフ技術は、法的ナレッジグラフを迅速に構築するのに役立ちますが、現在、法的ナレッジグラフに関する理論的な研究は不足しています。他の分野のナレッジ グラフと比較すると、法律ナレッジ グラフでは法的論理を考慮する必要があります。以下は、法律ナレッジ グラフの一部です。 上記の例から、すべての犯罪行為には主語、目的語、主観的要素、客観的要素があることがわかります。犯罪行為のマップを作成するには、テキストからこの情報を抽出する必要があります。大量の判断をマイニングすることで、犯罪行為間の関係を確立できます。たとえば、過剰な自己防衛と故意の傷害には関係があり、つまり誤判断の関係があります。このマップを使用すると、判決が下された場合、裁判官は事件が誤審であるかどうか、または追加情報が必要かどうかを判断するのに役立ちます。 ナレッジ グラフは、さまざまなデータ ソースからの情報を統合することによって構築され、ドメイン エキスパートが導入されてビジネス エキスパート ルールが確立されます。データの不一致を検出し、作成したナレッジグラフを使用して潜在的な不正リスクを特定します。たとえば、借り手張xxと借り手呉xは同僚として情報を記入しましたが、2人が記入した会社名は異なり、同じ電話番号が2人の借り手のものです。これらの不一致は詐欺を示している可能性があります。 不正行為防止インテリジェンス分析 教育や科学研究、医療、バイオメディカル、ビッグデータ分析を必要とする一部の産業など。これらの業界では、統合された関連リソースが緊急に必要とされています。ナレッジグラフは、より正確で標準化された業界データと豊富な表現を提供し、ユーザーがより便利に業界知識を習得するのに役立ちます。 ナレッジグラフの産業応用 結論 ナレッジグラフは挑戦的で非常に興味深い分野です。今後数年間で、ナレッジグラフは間違いなく人工知能の最先端の研究課題になるだろうと私は信じています。ナレッジグラフの重要性は、グローバルな知識ベースであるという点だけでなく、スマート検索や深い質疑応答などのインテリジェントアプリケーションをサポートするための基盤であるという点にもあります。また、人類の知識の宝庫を開き、多くの関連分野に新たな発展の機会を切り開く鍵でもあります。この意味で、ナレッジグラフは技術であるだけでなく、戦略的な資産でもあります。 もちろん、ナレッジグラフ プロジェクト自体は依然としてビジネス中心、データ中心であることを強調しておく必要があります。ビジネスとデータの重要性を過小評価することはできません。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
>>: オープンソースのAIがディープラーニングを使用して、顔の表情の特徴に基づいて画像のキャプションを生成
全国的に人材不足が進む中、テクノロジーは雇用者が厳しい市場で最高の人材を見つけるのに役立ちますが、人...
効果的な IT 組織は、ハイパフォーマンス コンピューティング (HPC) から教訓を得て、システム...
TensorFlow は長い間、使いにくいと批判されてきました。 TensorFlow 2.0 のリ...
モザイク除去のための人工知能、ディープ CNN デノイザーとモザイク除去のための多層隣接コンポーネン...
現在、スマートシティや無人店舗からスマートブレスレットやスマート温度調節器まで、私たちの身の回りには...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
倉庫業界はテクノロジー主導の革命の真っ只中にあり、企業はコストを削減し、業務を最適化し、サプライチェ...
ディープラーニング モデルが大きくなるにつれて、あらゆる種類のハイパーパラメータ調整を行うのは非常に...
1. バブルソート 2. シェルソート 3. 選択ソート 4. 挿入ソート 5. クイックソート 6...
ソーシャルネットワーク、ライブ放送、ショートビデオの普及に伴い、他人により良い印象を与えるために、顔...
[51CTO.com クイック翻訳] Facebookの機械学習フレームワークPyTorchは、20...
1. ロジスティック回帰ロジスティック回帰。まず線形回帰から始めます。線形回帰の出力は実用的な意味を...