1.1 ナレッジグラフの開発履歴 • 第一段階(1955-1977)はナレッジグラフの起源段階であり、この段階で引用ネットワーク分析が現代科学の発展を研究するための一般的な方法になり始めました。 • 第 2 段階 (1977-2012) は、知識グラフの発展段階です。セマンティック ウェブは急速に発展し、「知識オントロジー」の研究はコンピューター サイエンスの重要な分野になりました。知識グラフは、知識の組織化と表現においてセマンティック ウェブとオントロジーの概念を吸収し、コンピューター間およびコンピューターと人間の間での知識の交換、流通、処理を容易にしました。 • 第3段階(2012年から現在)はナレッジグラフの繁栄段階です。2012年にGoogleがGoogle Knowledge Graphを提案し、ナレッジグラフが正式に命名されました。Googleはナレッジグラフ技術を通じて検索エンジンのパフォーマンスを向上させました。人工知能の活発な発展により、知識グラフに関わる知識の抽出、表現、融合、推論、質問応答などの重要な課題が解決され、ある程度の進歩が遂げられました。知識グラフは知識サービス分野の新たなホットスポットとなり、国内外の学者や業界から幅広い注目を集めています。 ナレッジグラフの具体的な開発プロセスを下図に示します。 ケーススタディ資料 近年、セマンティック ウェブの台頭により、オントロジー技術が広く注目を集めています。多くの大手多国籍企業がオントロジー技術の研究を始めています。 Google は 2012 年にナレッジ グラフ プロジェクトを提案しました。これは、オントロジー技術を使用して検索精度を向上させ、よりインテリジェントな知識閲覧を実現することを目的としています。百度や捜狗などの国内インターネット企業もこの分野でプロジェクトを立ち上げている。 Microsoft は、Web ページから情報をクロールして大規模なオントロジーを構築することを目的とした Probase プロジェクトを提案しました。 IBM は、セマンティック Web テクノロジーを使用して、異種の医療データの統合とより正確なクエリ回答を処理します。オントロジー技術は、IBM の有名な質問応答システム Watson で重要な役割を果たしています。 Oracle は、強力なセマンティック データ推論およびインデックス作成システムを実装します。オントロジー技術は、欧州および米国の政府によってもサポートされています。英国政府は、多くの政府ウェブサイトの情報をオントロジーの形式で配布する http://Data.gov.uk プロジェクトを開始しました。米国政府も同様のプログラムを実施している。学術界、特にコンピュータサイエンスの分野ではオントロジーの研究に多くの成果があり、多くの実用的な技術が開発されています。過去 5 年間、欧州連合はオントロジー関連の研究に多額の科学研究資金 (累計で数億ユーロを超える) を投資してきました。 1.2 ナレッジグラフの重要性 ナレッジグラフは人工知能の重要な基礎です。 n ナレッジグラフはインテリジェントな開発を促進します。 ナレッジグラフは、強力な人工知能の開発を推進する中核的な原動力の 1 つです。 ナレッジ グラフは、2012 年 5 月 17 日に Google によって提案されました。当初の目的は、検索エンジンの機能を強化し、ユーザーの検索品質と検索エクスペリエンスを向上させることでした。現在の人工知能技術は、実際には知覚知能(主に画像、ビデオ、音声、テキストなどの認識)と認知知能(知識推論、因果分析などを含む)に簡単に分けることができます。ナレッジグラフ技術は、認知知能の分野における主要な技術であり、人工知能技術の不可欠な部分です。その強力なセマンティック処理と相互接続された組織化機能は、インテリジェントな情報アプリケーションの基盤を提供します。 ナレッジ グラフは、現実世界に存在するエンティティとそれらの間の関係を記述することを目的としています。人工知能技術の発展と応用により、ナレッジグラフは主要技術の1つとして、インテリジェント検索、インテリジェントな質疑応答、パーソナライズされた推奨、コンテンツ配信などの分野で広く利用されるようになりました。 ナレッジグラフは、その利用範囲から、一般ナレッジグラフとドメインナレッジグラフに分けられます。一般ナレッジグラフは広範さを重視し、ほとんどのデータはインターネットから取得されますが、ドメインナレッジグラフは垂直分野に適用され、基本的なデータサービスとなっています。 1.3 ナレッジグラフの定義 国立標準技術研究所のナレッジグラフは、新しい知識表現方法ではなく、業界における知識表現の大規模な知識アプリケーションです。インターネット上の識別可能な客観的なオブジェクトを関連付けて、客観的な世界のエンティティとエンティティの関係の知識ベースを形成します。本質的には、ノードがエンティティまたは概念を表し、エッジがエンティティ/概念間のさまざまな意味関係を表すセマンティックネットワークです。ナレッジ グラフのアーキテクチャには、ナレッジ グラフ自体の論理構造と、ナレッジ グラフの構築に使用される技術 (システム) アーキテクチャが含まれます。ナレッジ グラフの論理構造は、モデル層とデータ層に分けられます。モデル層はデータ層の上にあり、ナレッジ グラフの中核です。モデル層には、洗練された知識が格納されます。ナレッジ グラフのモデル層を管理するには、通常、オントロジー ライブラリが使用されます。オントロジー ライブラリの公理、ルール、制約のサポートは、エンティティ、関係、エンティティ タイプと属性間の接続を標準化するために使用されます。データ層は主に一連の事実で構成され、知識は事実単位で保存されます。ナレッジ グラフのデータ層では、知識は事実の形式でグラフ データベースに保存されます。 「エンティティ-リレーションシップ-エンティティ」または「エンティティ-属性-値」のトリプルをファクトの基本表現として使用すると、グラフ データベースに保存されているすべてのデータが巨大なエンティティ リレーションシップ ネットワークを構成し、「ナレッジ グラフ」を形成します。 ナレッジ グラフは、現実世界に存在するさまざまなエンティティや概念、およびそれらの関係を記述することを目的としています。これは、ノードがエンティティまたは概念を表し、エッジが属性または関係で構成される巨大なセマンティック ネットワーク グラフを構成します。現在、ナレッジグラフは、さまざまな大規模な知識ベースを参照するために使用されています。 上図に示すように、ナレッジ グラフには 3 種類のノードが含まれており、その基本形式は (エンティティ 1-リレーションシップ-エンティティ 2) と (エンティティ-属性-属性値) です。 エンティティ: 区別可能で独立して存在するものを指します。たとえば、国: 中国、イギリスなど、都市: 北京、ロンドンなど。 セマンティック クラス: 国、都市、民族など、特定の特性を持つエンティティのコレクション。 属性値: エンティティが指す属性の値。たとえば、中国(エンティティ)の面積(属性)は 960 万平方キロメートル(属性値)です。 リレーションシップ: ナレッジ グラフでは、リレーションシップは kk グラフ ノード (エンティティ、セマンティック クラス、属性値) をブール値にマッピングする関数です。 上記のセマンティック グラフの概念に基づいて、次の図に示すように、例として国のナレッジ グラフを構築できます。 |
<<: 「ニューラル+シンボリック」:知識グラフの観点から見た認知推論の発展
>>: 知識をグラフに変換するには、いくつのステップが必要ですか?インターネット上で最も包括的な清華ナレッジグラフレポートの89ページ
[[227907]]ここ数カ月、軍事用AIと能動攻撃兵器の問題が話題になっており、多くのAI研究者...
現在、人口ボーナスの減少、人件費の上昇、人材構成の矛盾などの問題が、製造業の発展を阻む困難になりつつ...
ビッグデータと高性能コンピューティング リソースにアクセスすることで、企業は新しい人工知能ツールと機...
ディープ ニューラル ネットワーク (DNN) は、基本的に複数の接続されたパーセプトロン (パーセ...
人工知能は歴史的に、やや相反する2つの陣営の間を揺れ動いてきました。一方では、ノーム・チョムスキー、...
[[327815]]この記事を読むと、次のことがわかります。 1. シーケンス予測問題のための単純な...
12月5日、Googleの研究者グループは、OpenAIの人工知能チャットボットChatGPTのトレ...
顔認識技術はAI時代に利便性をもたらすだけでなく、効率も向上させます。 8月21日、百度ブレインオー...
私はテスラの「純粋なビジュアルルート」に常に懐疑的でした。疑問なのは、アルゴリズムの進歩によってカメ...
[[212222]]音声認識にディープラーニングが導入されて以来、単語の誤り率は急速に低下しました。...
GPT-3などの超大規模モデルの登場により、コンテキスト内学習も普及してきました。インコンテキスト...
調査会社ガートナーは、データ サイエンスおよび機械学習プラットフォームを「さまざまなデータ サイエン...