[51CTO.com クイック翻訳]企業の業務効率と事業部門の競争力を向上させるための重要なツールとして、エンタープライズ ナレッジ グラフ (EKG) は、組織の内部データと外部データを調整するためにさまざまなシナリオでますます広く使用されています。しかし、その反面、EKG のデメリットは、ビジネス部門が EKG を開発、維持、拡張することが難しい場合があることです。この記事では、EKG に現在存在するさまざまな課題と、ネイティブ マルチモデル データベースによって提供される柔軟なデータ表現を使用してそれらの課題に対処する方法について説明します (図 1 を参照)。 図1: マルチモデル知識グラフは、複数のデータ表現を1つのシステムに融合できる エンタープライズ ナレッジ グラフとは何ですか? 現在、ナレッジグラフは、Google、Apple、Facebook、Twitter、Microsoft、Linkedin、Ebay、Alibaba などの企業に数兆ドルの富をもたらしています。彼らは主に独自のテクノロジースタックを開発することでナレッジグラフをサポートしています。オープンソースの EKG と比較すると、商用グラフ データベース製品の開発は、業界または企業固有の知識モデルに基づいて組織のコンテンツ、データ、および情報資産を調整することです。 EKG は通常、組織の知識領域と、人間と機械が理解できるそのコンポーネントを表します。これは、組織の知的資産、コンテンツ、およびデータの参照コレクションです。このようなコレクションは、何らかのデータ モデルを使用して、人、場所、物、およびそれらの関係を記述します。 多くの企業がさまざまな種類のビジネス ナレッジ グラフ (BKG) ソリューションを導入していますが、すべてのグラフが EKG と呼べるわけではありません。 EKG の主な原動力は、特定のビジネス ニーズを満たすカスタマイズされたナレッジ グラフを構築することです。 BKG が主にセグメント化されたビジネス ユース ケースのサポートを目的としているのに対し、EKG は複数のビジネス ユニットと複数のユース ケースに高品質の統合データを提供することを目的としています。次のセクションでは、EKG を活用してビジネスユースケースをサポートする際の課題と機会について説明します。 EKGの課題と機会 企業にとって、EKG には複数のデータ ソースからの価値の高いデータが含まれているため、ビジネス ユース ケースをサポートするためにデータ ソースを統合する時間と労力を節約できます。現在の EKG ソリューションの多くは、企業の概念モデルに基づいて、複数の異なる異種ソース システムを調整できます。これらの生データは通常、Hadoop/HDFS、S3 などの分散ストレージ システムに一時的に保存されます。ミドルウェア クラスターは、このデータを抽出してグラフ データベース クラスターに変換 (抽出、変換、ロード、ETL) します。 EKG はエンタープライズ検索などのアプリケーションをサポートしているため、ビジネス アプリケーションをサポートするには、さまざまな形式 (ドキュメント、テーブル、キー値、グラフなど) で EKG データを抽出して変換する必要があります。 図2: 地図の調整とデータの提供の際に生じる可能性のある不一致 組織は EKG に必要な複雑な複数ソースのデータにデータを調整するのに苦労することが多いため、EKG の潜在能力が十分に活用されていないことがよくあります。同時に、ビジネス ユーザーは複雑で馴染みのないナレッジ グラフ表現に対処するのが難しいだけでなく、それを使用するためのツールも不足しています。企業は多大な努力により数十、数百のデータソースを EKG に統合し、データの出所や権限の保持などのデータガバナンスの問題を解決することができますが、ビジネス部門は高品質の EKG データを最大限に活用する上で「最後の 100 メートル」で大きな課題に直面しています。 問題の本質は、データからグラフィックスへの「すべてまたはゼロ」の変換プロセスによって、ソース データの表現と EKG の間、および EKG とビジネスが希望するデータ処理方法の間に不一致が生じることです (図 2 を参照)。マルチモデルベースの EKG は、ナレッジ グラフでの表現の多様性を可能にすることで、データの不一致を削減します。これにより、グラフを段階的に柔軟に調整できるようになり、ビジネス ユニットは必要に応じて最小限のデータ変換を実行できます。 複数のデータソースをグラフに統合する課題 企業は多数の異なるデータ ソースを調整する必要があります。一般的に言えば、関連性の高いデータ ソースが統合されるほど、企業にとっての潜在的な価値は高まります。もちろん、データ ソースの数が増えると、データをグラフに調整するコストも指数関数的に増加します。そのため、企業は、アジャイル アプリケーションを通じてデータを自動的にオーケストレーションし、オンデマンドで利用できるようにする方法を模索しています。 図 3: EKG のデータ調整量は、データ ソースの数に応じて指数関数的に増加します。 異なるデータの微妙な違いを表現し、グラフ構造を標準化するには、複雑な知識表現を使用する必要があることがわかります。ナレッジ グラフによって使用され、統合されるすべてのソース データは、単一モデルのグラフ データベース内のグラフ構造に変換する必要があります。もちろん、ソース データをこれらの複雑なナレッジ グラフ表現にマッピングするには、時間、労力、知識が必要です。 下の図 4 に示すように、EKG 生成プロセスでは大量のリソースが必要になるため、グラフ データベースのスケーラビリティに影響する可能性があります。実際のアプリケーションでは、特にキー値やドキュメントなどの実際のデータを保存する場合、グラフ データベースのスケーラビリティを超える膨大な量のデータが常に存在します。 図4: グラフ処理データの複雑さとドキュメントおよびキー値の処理能力の関係 これらの理由から、マルチモデル データベースは、さまざまなキー値、ドキュメント、結合、グラフ データ モデルを、オンデマンドで拡張し、グラフ表現を簡素化する方法で統合できます。たとえば、純粋なグラフで表現すると、企業内のネットワーク セキュリティ情報は毎年数兆の「エッジ」の割合で増加します。その後、グラフ、ドキュメント、接続を組み合わせると、同じエンタープライズ ネットワーク セキュリティ グラフが数十億の「エッジ」で表される場合があります。 企業が EKG の開発と維持に必要な作業量を削減する方法を模索する際、次のような疑問が湧くことがよくあります。
現時点ではデータを自動的にグラフに調和させる実用的なソリューションがないため、EKG は全体的なグラフ モデルである必要があり、すべてのデータをグラフに変換して初めて真に役立つことになります。同時に、他の種類のデータ モデルを組み込むことができるため、EKG の展開と保守の作業が軽減され、EKG の潜在的な規模が拡大し、EKG の開発と保守の柔軟性と俊敏性が向上します。さらに、他のデータ モデルのナレッジ グラフにセグメンテーション データとグラフを同じデータベースに保存することで、グラフを俊敏かつ反復的に調整できるようになります。 心電図をアクセス可能にする課題 前述したように、ビジネス ユーザーは複雑で馴染みのないナレッジ グラフ表現を扱うのが難しく、それを使用するためのツールも不足しています。実際の使用では、次のような EKG の問題が発生することがよくあります。
上記の課題の本質は、EKG とビジネス部門がデータを使用し処理する方法との間の不一致から生じています。たとえば、ある企業では 2017 年 1 月から 2019 年 12 月までのすべての取引情報が必要であり、そのようなデータを特定のドキュメント構造 (JSON ドキュメント コレクションなど) の形式で提供することを要求する場合があります。この目標を達成するために追加のグラフ クエリ言語を学習したり使用したりしたくないため、「データ ショッピング」エクスペリエンスが必要です。つまり、EKG ストアを訪問し、複数のフィルターを使用して EKG カタログのデータを検索し、EKG ストアが推奨するデータ セットで既存のデータを補足し、データを取得する方法とタイミングを指定します。 マルチモデルエンタープライズナレッジグラフ マルチモデル エンタープライズ グラフ (MMEKG) は、ユーザーが同じエコシステム内でデータ ソース、EKG、およびデータ表現を混在させて管理できるようにすることで、上記のさまざまな問題を解決できます。 時間とコストを削減 MMEKG は、要求に応じてグラフの遅延変換を実行できます。マルチモデル グラフでは、エッジと頂点に異なるドキュメントを含めることができるため、グラフのサイズを縮小できます。これに基づいて、EKG もアジャイル反復プロセスを使用して開発できます。 図 5: マルチモデル グラフを使用すると、ナレッジ グラフのデータをより効果的に調整できます。 コンピューティングリソースを削減 下の図 6 に示すように、EKG ソリューションでは通常、ステージング、グラフ ETL、グラフ管理、ビジネス部門へのデータ配信に個別のデータ システムを使用する必要があります。 MMEKG は、ソース データ、ナレッジ グラフ、選択されたビジネス データ間の不一致を効果的に排除できます。同じシステムでデータを管理するだけでなく、変換の遅延を削減し、すべてのデータを検索可能にします。ご覧のとおり、ステージング、変換、グラフィックス、ビジネス アプリケーションに個別のクラスターを使用することに伴うコストが削減されます (図 7 を参照)。 図6: 典型的なEKGエコシステムは、ステージングと変換に複数のシステムを使用します 図7: ソースデータ、EKG、ビジネスデータを同じマルチモデルデータベースで管理できます 使いやすさ マルチモデルにより、ソース データ、ナレッジ グラフ、ビジネス アプリケーション データを同じデータ システムで検索して見つけることができるため、ビジネス ユーザーは複雑なエンタープライズ グラフ モデルを理解しなくても独自の形式でデータを使用できます。 データ系統 また、データのステージング、変換、配信に同じマルチモデル システムが使用されるため、データの系統を追跡することがはるかに簡単になります。 既存のEKGを強化 RDF(リソース記述フレームワーク)タイプの EKG を導入している企業は、既存の投資を維持し、それを MMEKG で活用することができます。マルチモデル グラフは RDF のラベル付き有向グラフのスーパーセットであるため、モデル データベースは RDF のオントロジーと RDF の EKG を吸収できます。同様に、マルチモデル グラフにも属性グラフが含まれているため、属性グラフに基づく EKG の同化が容易になります。 図8: マルチモデルEKGはRDFを抽出でき、プロパティグラフに基づいてEKGを抽出できる 要約する マルチモデルは EKG の実用的なテクノロジーです。その利点には、EKG のマルチソース データをより流動的にすること、ビジネス ユース ケースでの EKG データの使いやすさを向上させること、ハイブリッド モデルを通じてより高いスケーラビリティを実現すること、EKG エコシステムの複雑さを軽減することなどがあります。 原題: マルチモデル ナレッジ グラフ、著者: Arthur Keen & Jan Stuecke [51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください] |
<<: 人工知能の導入は、より費用対効果の高い臨床試験の新しい時代を告げるだろう
米国で売上高最大のソーセージブランドであるジョンソンビルソーセージのグローバルネットワークオペレーシ...
2018 年 5 月に、EU 一般データ保護規則 (GDPR) が正式に施行されました。それ以来、...
都市から農村まで、わが国の宅配便や電子商取引企業がドローン物流と配達に注力したことで、国産ドローンの...
最近の人工知能の進歩は目覚ましいものがあります。人工システムは、アタリのビデオゲーム、古代のボードゲ...
今日、デジタル変革はビジネス存続の基盤となっています。自動化された工場から人工知能 (AI) 品質管...
最近、中国のビッグデータおよび人工知能製品と技術の大手プロバイダーであるPERCENTは、コンピュー...
中国気象局は7月29日、「人工知能気象応用作業計画(2023-2030年)」を発表し、国内の人工知能...
高齢者介護サービスも人工知能を積極的に取り入れる必要がある。両者を統合し、相互に補強し、高齢者の多様...
テクノロジーは私たちの世界を変えました。それは何十億もの人々に考え、アイデア、洞察を共有する機会を与...
偽の肖像ビデオ生成技術は、政治宣伝、有名人のなりすまし、証拠の捏造、その他のアイデンティティ関連の操...