アリババのナレッジグラフが初めて公開: 1日あたり数千万のブロックデータ、数十億の完全インテリジェント監査

アリババのナレッジグラフが初めて公開: 1日あたり数千万のブロックデータ、数十億の完全インテリジェント監査

アリババのナレッジグラフの助けにより、アリババの電子商取引プラットフォームの管理と制御は、以前の「巡回検査」モードから、公開側でのリアルタイムの個別検査にアップグレードされました。大規模な製品リリースという課題に直面して、私たちはビッグデータと人工知能を最大限に活用し、悪質な行為者や問題のある製品が Alibaba エコシステムに侵入するのを防いでいます。同時に、ナレッジグラフは、リアルタイムの対決、変異、問題のある販売業者による悪意のある攻撃など、多くの課題に直面しながらも、1日あたり数千万、数十億の本格的なインテリジェント監査の傍受量を維持し、スパム、侵害、コンプライアンス、偽造、業務範囲など、さまざまなシナリオで問題のある販売業者とリアルタイムで対決しています。当社は、知的財産権の保護を最大限に高め、消費者の権利を保護するために、知能、自己学習、ミリ秒レベルの応答、説明可能性など、知識グラフ推論エンジン技術に対するより高い技術要件を提示し、良好な社会的利益を実現しています。

[[202401]]

Alibaba Knowledge Graphの応用

Alibabaのエコシステムには膨大な量の商品データが蓄積されています。これらの貴重な商品データは、Taobao、Tmall、1688、AliExpressなどの複数の市場から来ています。同時に、ブランドオーナー、業界運営、ガバナンス運営、消費者、国家機関、物流会社など、さまざまな役割が参加し、このような巨大な商品ライブラリの修正に貢献しています。知的財産の保護、消費者のショッピング体験の向上、製品データの標準化(製品仕様の統一と製品情報の確実性)、内部および外部データとの深い相互接続の実現など、その意義は非常に重要です。Alibaba Product Knowledge Graph は、製品標準化の基本的かつ根本的な作業を担っています。 これに基づいて、どの商品が同一製品であるか、ブランドが認可されているかどうか、そのブランドの製品がどの市場で販売されているかを確実に知ることができます。

Alibaba Knowledge Graphは、商品、標準製品、標準ブランド、標準バーコード、標準分類を中心に、エンティティ認識、エンティティチェーン、セマンティック分析技術を使用して、世論、百科事典、国家業界標準など、9つの主要な第1レベルのオントロジーを統合およびリンクします。数百億のトリプルが含まれており、巨大な知識ネットワークを形成しています。

Alibaba Knowledge Graph は、最先端の NLP、意味推論、ディープラーニングなどのテクノロジーを総合的に活用し、ネットワーク全体のすべての製品を対象としたインテリジェントなサービス システムを構築し、Alibaba エコシステムでさまざまな役割を果たします。製品ナレッジグラフは、検索、フロントエンドのショッピングガイド、プラットフォームガバナンス、インテリジェントな質疑応答、ブランド運用などのコアビジネスや革新的なビジネスで広く使用されています。ブランドがグローバルデータに関する洞察を得るのに役立ち、プラットフォームの管理と運用が問題のある製品を特定するのに役立ち、業界が特定の情報に基づいて製品を選択するのに役立ち、人、商品、場所をマッチングさせて消費者のショッピング体験を向上させるなど、さまざまなことができます。新しい小売と国際化のための信頼性の高いインテリジェント エンジンを提供します。

推論エンジンを構築するための機械学習アルゴリズムの導入

知識表現と推論を実装するためのフレームワークを設計しました。さらに、ナレッジ グラフのエンティティ、関係、語彙 (同義語、下位語、および下位語)、垂直ナレッジ グラフ (地理的位置グラフ、マテリアル グラフなど)、機械学習アルゴリズム モデルなどがすべて含まれており、統一された説明が可能です。

さまざまなシナリオに応じて、推論を階層的および同等の推論、矛盾推論、知識発見推論、オントロジー概念推論などに分類します。例えば

1. 下位語と同値性の推論。親クラスを検索する場合、下位語と上位語の推論を通じてサブクラスのオブジェクトが呼び出され、同等の推論(エンティティの同義語、異形語、同じモデルなど)を使用して呼び出しが拡張されます。 例えば、消費者を守るためには、「核汚染地域で生産された食品」を傍受する必要があります。推論エンジンは、これを「この地域で生産され、その属性項目が「原産地」と同義であり、その属性値がこの地域の従属エンティティであり、対象食品と同じ種類の食品である食品を見つける」と解釈します。

2. 矛盾した推論。問題のある販売者に対処する過程では、販売者の資格における商品名、属性、画像、商品資格、ブランド、材質、原材料などの基本情報の一貫性チェックを行う必要があります。例えば、タイトルのブランドは Nike で、属性やタグのブランドは Nake だとすると、下図のようになります。左側は、商品のタイトル、属性、タグのブランド情報が一貫していることを示しており、推論では一貫しているとしています。右はタグとブランドが一致せず、推論エンジンによって問題のある商品と判断された商品です。

3. 知識発見推論。一貫性推論の目的は、情報の確実性を確保することです。たとえば、一貫性推論によって、データに含まれる食品成分リストが正しいことを確認できます。しかし、消費者は買い物をするときに原材料リストの複雑な数字を見ることはほとんどありません。消費者が本当に気にするのは、無糖や無塩など、強い認識を伴う知識ポイントです。消費者のショッピング体験を向上させるために、次のような基礎となる成分リストデータと国内業界標準を通じて知識発見推論が実行されます。

無糖: 炭水化物≤0.5g/100g(固形)または100mL(液体)

無塩: ナトリウム≤5mg/100gまたは100mL

原材料名データを「無糖」「無塩」などの知識ポイントに変換できます。これにより、データが本当に知識に変わります。 AB テストによって検証された、フロントエンドのショッピング ガイド内の同様の知識ポイントにより、消費者のショッピング体験が大幅に向上しました。

推論エンジンの背後にある技術的フレームワーク

まず、推論エンジンは意味解析を通じて自然言語を論理形式に変換します。セマンティック解析では、ニューラル ネットワークと記号ロジック実行を組み合わせた方法が使用されます。自然言語は、構文、文法分析、NER、エンティティ リンクを通じて分散表現にエンコードされ、文の分散表現はさらに論理式に変換されます。

分散表現を論理式に変換するプロセスでは、まず、表現と述語論理演算間のマッピングの問題に直面します。述語をアクションとして扱い、トレーニングを通じて記号操作を実行します。これは、ニューラル プログラマーの注意メカニズムを使用して適切な操作を選択するのと同様です。つまり、最も可能性の高い述語操作を選択し、最後に、分析された構文に基づいて述語操作を可能な論理式につなぎ合わせ、論理式をクエリなどに変換します。プロセスを下の図に示します。

第二に、論理式は後続の論理的推論とグラフ推論をトリガーします。論理式の設計時には、次の原則に従います。論理式は人間の自然言語に近いため、機械と人間の両方にとって理解しやすいものです。表現能力は、ナレッジグラフデータと知識表現の要件を満たしています。拡張が容易で、新しいクラス、エンティティ、関係を簡単に追加できる必要があります。 Datalog、OWL など、複数の論理言語とシステムをサポートできる必要があります。 つまり、これらの言語とその背後にあるアルゴリズム モジュールはプラグイン可能です。 プラグイン可能な関数を通じて、推論エンジンはさまざまな論理システムを記述する機能を備えています。

従属関係と同等性の推論の例を見てみましょう。「中国で生産された食品」

論理式として記述すると次のようになります。

∀x: 食品(x) ⊓ (∀ y: 同義語(y, 原産地)) (x, (∀ z: 従属エンティティ(中国, z)を含む))

次に同じものを見つけます:

∀t, x: ($ c: は product(x, c) に属する ⊓ は product(t, c) に属する)

さらに、推論エンジンは知識ベースの自動補完にも使用されます。埋め込みをベースに知識ベースを完成させます。主なアイデアは、Trans シリーズの特徴に加えて、エッジ、隣接ポイント、パス、エンティティのテキスト説明 (詳細など)、画像などの特徴を考慮して、知識ベースの構造情報を埋め込みに追加し、新しい関係を予測して完成させることです。

3年間の構築を経て、アリババナレッジグラフは巨大なナレッジグラフと膨大な標準データを形成しました。同時に、浙江大学の陳華軍教授チームと共同プロジェクトチームを設立し、最先端の自然言語処理、知識表現、論理的推論技術を導入し、アリババの新小売と国際化戦略においてますます重要な役割を果たしています。

[この記事は51CTOコラムニスト「アリババオフィシャルテクノロジー」によるオリジナル記事です。転載については原著者にお問い合わせください。]

この著者の他の記事を読むにはここをクリックしてください

<<:  機械学習は、足を上げることから敷居に落ちることまで行います

>>:  人工知能の真の可能性を捉えて、最も大きなチャンスを提供する製品やサービスはどれでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

...

AIは「噂を払拭する剣」となり、今後の応用に無限の可能性を秘めている

インターネットの普及は人々に多くの利便性をもたらしましたが、噂が広がる温床にもなっています。ネット上...

Facebook がアルゴリズム コード ライブラリ PySlowFast をオープンソース化、最先端のビデオ理解モデルを簡単に再現

Facebook AI Research は近年、ビデオ理解研究において多くの素晴らしい成果を上げて...

信頼性の高い人工知能システムのルールをどのように定義し構築するのでしょうか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

LeCun、Zhou Zhihua、Kai-Fu Leeらは2020年にAIに何を期待しているのでしょうか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

何開明のMAE制限が破られ、Swin Transformerと組み合わせることで、トレーニング速度が向上しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Juli プロジェクト第 21 号 - AntRay: 大規模モデル時代の AI コンピューティング インフラストラクチャ

8月12日、Juliプロジェクトシリーズ活動の第21回「大規模言語モデルのトレーニングとアプリケーシ...

人工知能のトップ10の応用シナリオ

序文人工知能ブームは世界中を席巻し、数え切れないほどの人材が人工知能業界に集まっています。機械翻訳、...

...

OpenAI: ニューヨークタイムズは私を攻撃するためにハッカーを雇った

新聞社が雇ったハッカーが AI の巨人を攻撃するのはなぜでしょうか?ニューヨーク・タイムズがOpen...

幼少期から始める:AIを学ぶのに最適な時期は中学生

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

未来のあなたは「透明」です!コンピューターは人間の脳信号から思考を予測し、最大83%の精度で人間の脳画像を復元します。

最近、ヘルシンキ大学の研究者らは、脳信号を監視することでコンピューターが視覚知覚をシミュレートできる...

...