【51CTO.comオリジナル記事】
最近、北京グローバル金融センターで北科不動産ナレッジグラフテクノロジーカンファレンスが開催されました。近年、人工知能の分野で比較的人気のある技術として、ナレッジグラフは、インテリジェント検索、インテリジェントな質疑応答、インテリジェントな推奨などのシナリオで広く使用されています。このカンファレンスは、Beikeのインテリジェント検索チームの4人の専門家が主催しました。300人以上のAI開発者や愛好家が招待され、Beikeのグラフ技術の実践的な経験と応用結果をゲストと共有しました。 北池不動産のリスク管理における関係グラフの実装 Beike のシニアエンジニアである Wang Xuezhi 氏は、Beike のリスク管理システムにおける関係グラフの実装に焦点を当て、Beike のリスク管理システムにおける関係グラフの応用について詳しく説明しました。王雪志氏は、BeikeのビジネスモデルはACNブローカー協力ネットワークに基づいていると紹介した。リスク管理はビジネスと密接に関係しています。したがって、シェルの業界特性とビジネス モデルにより、シェルのリスク管理シナリオにも独自の特徴が生まれます。
北科不動産のシニアエンジニア、王雪志氏 ACNブローカー協力ネットワークとは、物件情報の完全共有などのルールを遵守することを前提に、同一ブランドまたはブランド間のブローカーが異なる役割で取引に参加し、取引成立後に各役割の手数料率に応じて手数料を分配する協力モデルを指します。このモデルは、ブランドを超えて物件、顧客、ブローカー間の連携を実現するが、シェルのリスク管理システムの構築では、次の要素を考慮する必要があることも意味する。ビジネスはオンラインとオフラインに分かれており、取引チェーンは長く、リンクが多い。フランチャイズリスクとブローカーリスクに同時に直面する。ブローカーが責任を問われる場合は、完全な証拠チェーンを提供する必要がある。ビジネスシナリオはリース、新築住宅、中古住宅販売など多岐にわたる。取引シナリオは、低頻度、高額、長期サイクルを特徴とする。 王学志氏は、リスク管理において関係性マップが使用される理由として、第一に、関係性マップは点、線、面のリスク特性を示すことができ、集団攻撃に非常に適しているため、第二に、シェルは自社の現実に基づき、小規模B違反と比較して、大規模Bリスクは被害の程度という点で優先されると考えているためだと指摘した。さらに、Big B 違反と複雑な関連関係は強く相関しており、関係グラフに適用できます。 報道によると、全体的なアーキテクチャの面では、シェルの関係グラフは、基本データ、知識構築、知識マイニング、ビジネスアプリケーションの4つのレイヤーに分かれており、技術の選択の面では、シェルはグラフ分析コンピューティングエンジンとしてSpark Graph Xを、グラフクエリツールとしてJanus Graphを選択しました。応用シナリオの面では、関係グラフは主にシェルのリスク管理システムでアクセス防止と制御、リスク定量化、品質管理、リスク発見、ケース追跡に使用されています。 王学志氏は、今後、シェルのリスク管理における関係グラフの応用は、知識推論、知識融合、高密度サブグラフマイニング、グラフ埋め込みなどを含む基本機能の深化と、リスクガバナンスにおける違反のインテリジェントな追跡と違反パターンの自動学習の促進など、ビジネスアプリケーションの拡大という2つの側面に主に重点を置くと述べました。ユーザーの増加に関しては、関係グラフを通じてブローカーの信用記録が記録され、これに基づいてブローカーBとブローカーCへの推奨が行われます。 Beike.com における関係グラフの構築と応用 Beikeの上級アルゴリズムエンジニアであるZhou Yuchi氏は、「Beikeにおける関係グラフの構築と応用」をテーマに、Beikeの関係グラフ構築の動機、設計プロセス、応用実践について詳細に解説しました。 北科不動産のシニアアルゴリズムエンジニア、周玉智氏 周玉池氏はまず、なぜ北家氏は関係マップを作成したいのかという疑問を提起しました。一般的に、不動産業界の関係マップのノードは、仲介業者、住宅、顧客などで構成されます。関係には通常、閲覧、フォロー、表示などの行動関係が含まれます。 Beike は事業の急速な発展に伴い、膨大な量のデータを蓄積してきました。数十億の行動データに直面した場合、データの背後にある価値を探索するにはどのような方法を使用できますか?シェルの答えは関係マップです。 周玉池氏は、関係マップを 0 から 1 に構築するプロセスは、関係マップで何ができるか、どのように設計するか、どのように適用するかという 3 つの中核要素から切り離せないと考えています。彼は、Shell Relationship Map の全体的な技術アーキテクチャに焦点を当てました。 アーキテクチャは、下から上に、基本グラフ、サブグラフ、グラフ機能、グラフ アプリケーションの 4 つのレイヤーに分かれています。最下層は、さまざまな動作関係を定義する基本グラフです。関係の強さ、同種グラフ、異種グラフなどのサブグラフは、基本グラフの上に構築されます。その中で、関係性の強さの定量化は、構築プロセスにおける最優先事項です。基本グラフとサブグラフを組み合わせることで、関係グラフの基礎が形成されます。基盤が築かれた後、多段階クエリ、影響、埋め込み、クラスタリング、類似性、関係予測の 6 つの機能を含むグラフ機能が構築されました。最後に、グラフ機能に基づくアプリケーションを調査し、Tenant Pass や Intelligent Customer Service などのアプリケーション ツールを開発しました。 関係性グラフの基盤構築においては、関係性の強さの定量化が非常に重要な課題です。シェルは、建設プロセス中に主に重量、頻度、時間の 3 つの要素を考慮します。周玉池氏は次のように説明しています。「関係の種類によって重みは異なります。たとえば、表示行動の重みは閲覧行動の重みよりも高くなります。閲覧は軽い行動であり、高頻度の関係は低頻度の関係よりも重要であり、最近の関係は長期的な関係よりも重要であると私たちは考えています。一般的に、ビジネス理解に基づき、データ生成と組み合わせて、さまざまな関係の種類の重みを定義します。同時に、モデリング アプローチを使用して、一部の行動データを計算して、理解と相互検証します。」 関係グラフの能力構築において、周玉池は影響力、埋め込み、類似性、関係予測という 4 つの機能の導入に重点を置きました。ノードの影響に関しては、Beike は次数中心性法を使用します。 Beike にとって、ユーザー接続数の増加とユーザー変換率の向上は非常に重要です。一般的なグラフ埋め込み手法の中で、Beike は同種ネットワークに Node2vec を採用し、自社の開発実態に基づいてサイド インフォメーションを使用して最適化を行いました。同時に、異種ネットワークには Metapath2vec を試しました。機能面では、類似のプロパティ、類似のユーザーなど、埋め込みに基づいて同様の計算を実行できます。さらに、関係予測を実装する方法は 2 つあります。1 つは、類似の家や類似のユーザーと関係の強さに基づいて推測する方法です。もう 1 つは、異種ネットワークの UserEmbedding と HouseEmbedding に基づいて家とユーザーの関係を予測する方法です。 リレーショナルグラフの応用探究において、周雨池氏は主に多次クエリとベクトル化という2つの観点から詳細な説明を行いました。 Shell には、多段階クエリに基づく 2 つのアプリケーションがあります。1 つは、ブローカーと顧客を結び付ける Shell の製品である Tenant Pass です。もう 1 つは、ユーザー中心で、基本グラフを使用してニーズを満たす直接接続されたプロパティを見つけ、グラフ機能を使用してマイニングするか、プロパティ機能を使用して類似のプロパティを見つけ、ユーザーに関連するサブグラフを推奨し、推奨事項を視覚的に表示する Graph Mining です。 ベクトル化された探索に基づく Shell の典型的なアプリケーションは、推奨機能です。一般的に言えば、仲介業者が顧客のために住宅を探す方法は、WeChatグループやモーメンツを検索したり、店内の他の仲介業者に尋ねたり、住宅交換会でコミュニケーションをとったりするなど、まだ比較的原始的な段階にあります。しかし、Beike は、人、顧客、住宅をマッチングするアルゴリズムを通じてブローカーを支援することができます。一方では、ブローカーが顧客をスクリーニングし、適切な住宅を推奨するのに役立ちます。他方では、顧客と高品質の住宅をマッチングさせることで取引率を向上させることもできます。 北家不動産における分散グラフデータベースの応用実践 Beikeの検索プラットフォームの責任者であるGao Pan氏の講演テーマは、主にグラフデータベースを中心とした関係グラフのインフラストラクチャに重点が置かれました。
Beike.comの検索プラットフォーム責任者、ガオ・パン氏 Gao Pan 氏は、グラフ データベースの定義と応用分野について簡単に説明しました。いわゆるグラフ データベースは、画像を保存するデータベースではなく、ノードと関係を保存し、グラフ構造で保存およびクエリを実行するデータベースです。グラフ データベースの応用シナリオは非常に幅広く、ソーシャル ネットワーク、検索推奨、リスク管理、ビジネス プロセス、イベント関係などの分野の問題を解決するために使用できます。 その後、Gao Pan 氏は Beike 氏にグラフ データベース プラットフォームの必要性について説明しました。 「現在、北科兆芳の業界最大グラフは 480 億トリプルに達しています。非常に現実的な問題は、効率的なビジネス クエリをサポートするために、このような大量のデータをどのように保存すればよいかということです。同時に、グラフ データベースの使用を必要とするすべてのシナリオをサポートする汎用グラフ データベース プラットフォームがあるかどうかを検討しました。これにより、上位レベルのグラフ開発者は、基盤となるストレージ テクノロジの実装に労力を費やすことなく、戦略やアルゴリズムにさらに集中できるようになります。答えは明らかにイエスです。統一されたグラフ データベース プラットフォームが必要です。」 この需要に後押しされて、Beike は適切なグラフ データベースを探し始めました。オープン ソース、パフォーマンス、安定性、成熟度、使いやすさ、スケーラビリティ、運用および保守コストなどの要素を考慮した後、最終的に DGraph と JanusGraph のどちらかを選択することにしました。アーキテクチャ、レプリケーション、データの一貫性、クエリ言語、全文検索、視覚化、書き込みパフォーマンス、クエリパフォーマンス、運用および保守コストを比較した結果、最終的に DGraph が選択されました。グラフ データベース クラスターの構築とデータのインポートが完了した後のパフォーマンス ストレス テストでも、Beike は非常に満足のいく結果を得ました。480 億のデータに対するすべてのクエリは 50 ミリ秒以内に完了し、同時実行性は 15,000 QPS を超えました。もちろん、DGraph にも欠点や短所があります。複数のエッジをサポートしていない、クラスターは 1 つのグラフしかサポートしていない、ビッグ データ エコシステムと互換性がないなどです。全体的に、まだ改善の余地は多くあります。 Gao Pan 氏は、次のステップとして、Beike はソースコードの改善を含め、グラフ データベース構築のパフォーマンスと安定性について徹底的な最適化を継続し、次に、グラフ データベースを検索ミドル プラットフォームの基本エンジンとして推進して、さまざまなグラフ データベース検索のニーズに対応し、検索クラウド プラットフォームのインターフェイス操作と迅速な構成アクセスを組み合わせて、運用と保守のコストを簡素化すると述べました。 Beike の分散グラフ データベースが成熟すると、社内のさまざまな知識グラフ、リスク関係グラフなどを統一的にサポートできるようになり、すべてのグラフ ニーズは基盤となるストレージ技術に集中する必要がなくなり、グラフの構築や適用の戦略アルゴリズムにのみ集中できるようになります。 不動産業界における業界マップの応用 Beikeの業界マップ責任者であるSun Baqun氏は、不動産分野における業界マップの構築と応用というテーマを参加者と共有しました。
ベイク不動産の業界マップ責任者、サン・バクン氏 孫八群は、業界企業にとって、内部データを使用して自己分析と定性的な説明を完了し、外部データを使用して市場での位置付けと定量的な説明を明確にし、業界における全体的な発展状況を把握し、統合データ分析を通じて最終的にビジネス目標を達成し、つまり業界ナレッジグラフを通じて自社の戦略計画とビジョンとミッションを実現できると考えています。 孫百群氏は、業界知識グラフを通じて問題を解決するという考え方を簡単に説明しました。まず、目標を設定して価値を導き出します。次に、ソリューションを選択してその道筋を実現します。最後に、結果を評価してサイクルを形成します。 「業界グラフに基づいて、全国の都市における全体的な価値空間を計算しました。価値空間では、来年のGMVを増やすという基本的な中核目標があります。これは、会社の戦略指標と定義に基づいています。実行に関しては、目標を細分化する必要があります。一方では、インテリジェントな質問と回答、知識推論、コミュニティの発見などのグラフテクノロジーを適用することで、ビジネス目標の達成を直接促進できます。他方では、効率改善ツール、リード増加、市場意思決定などのツールを備えた業界知識グラフに基づいて構築された業界インテリジェンスシステムを通じて、目標の達成を促進できます。最後に、効果評価を通じて、ポジティブなサイクルが形成されます。」 孫百群氏は、業界データの導入、処理、統合について適切な説明を行った。種類別に見ると、主な業界データは、自社と競合他社の両方を知る必要がある標準的な競合他社、関連する国の政策やマクロ経済環境などの専門的なコンテンツ、開発者、物件、建設業者からのデータなどの上流と下流、物件周辺の環境データである周辺環境、および詳細を説明する必要のないユーザーグループの 5 つのカテゴリに分類できます。これらのデータはさまざまなソースから取得され、構造上大きな違いがあるため、これらのデータを導入した後でデータのクリーニングとエンティティの融合を行う必要があり、その後で業界ナレッジ グラフの構築を開始できます。 最後に孫百群氏は、今後1年間のBeikeの産業グラフのインテリジェントアプリケーションにおける研究開発の方向性について言及した。まず、IM アシスタントはブローカーの効率を向上させます。ナレッジグラフを使用すると、ブローカーが顧客の質問に応答する速度と精度が向上します。次に、検索効果です。検索結果が少ない場合は、サイト外の物件やサイト外の人気物件をいくつか提供します。3番目は、AIによる住宅推奨です。膨大なVR住宅データに基づき、AI技術と組み合わせ、画像認識、構造処理などのアルゴリズムを通じて3次元空間情報をインテリジェントに処理し、住宅自体の理解を実現します。 AIは、周辺施設、コミュニティの状況、家の間取り構造、取引情報などの要素に基づいて、TTS(テキスト読み上げ)技術を通じてユーザーにパーソナライズされたスマートハウスナレーションサービスを提供します。 Beikeは設立以来、常にテクノロジー主導で消費者中心であり、不動産、顧客、ブローカー間のデータ相互接続をよりインテリジェントにし、産業インターネットの下で「新しい生活」の高品質サービスエコシステムを構築することに尽力しています。 2019年9月末現在、Beikeは全国103の都市と地域に進出し、32,000店舗と320,000人以上の新規ブローカーを結び付け、226以上の新規ブローカーブランドがプラットフォームに参入しています。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: マイクロソフトの年次研究レビュー: ML のブレークスルーが到来、人間とコンピューターのインタラクションがより現実的に、そして Shum 氏のお別れ
>>: 5 つの負荷分散アルゴリズムのうち、いくつ知っていますか?
この目的のために、市場で一般的なデータ モデルを見つけて整理し、分析することができます。主流のデータ...
【51CTO記者李玲玲が北京からレポート】先日、「イノベーション主導の着実な変革と共同金融」をテーマ...
2019年秋学期のキャンパスリクルートメントは終了に近づいています。近年、特にインターネット業界で...
先月、Kaggle の共同創設者兼 CTO である Ben Hamner 氏が、Kaggle、機械学...
著者: Xiao Yanghua、復旦大学コンピュータ科学技術学院准教授、博士課程指導教員、上海イン...
サイバーセキュリティにおける人工知能 (AI) は、データセキュリティにとって良いものでしょうか、そ...
序文:前回のJetson Nanoの記事では、学習のためのアイデアや教材を紹介しました。今日は、引き...
「台北市信義路バスレーン自動運転バスイノベーション実験プロジェクト」は台北市で長らくテストされており...
この記事では、機械学習アルゴリズムにおける非常に重要な知識である分類、つまり入力データが属するカテゴ...
8月8日、IT Homeは中国サイバースペース事務局から、顔認識技術の応用を標準化するため、「中華人...