[51CTO.comより引用] 2017年12月1日~2日、51CTO主催のWOTDグローバルソフトウェア開発技術サミットが深セン中州マリオットホテルで開催されます。このサミットのテーマはソフトウェア開発であり、数十名の専門家ゲストが多くの素晴らしい技術コンテンツを共有します。当時、聯家のシニアテクニカルディレクターであるFeng Yang氏は、ディープラーニングとインテリジェントアプリケーション開発サブ会場で基調講演「データと機械学習に基づくブローカーの評価と管理」をゲストと共有し、機械学習アルゴリズムの力を利用して不動産ブローカー評価システム、ブローカーレベルのステータスモデル、行動モデルなどのコンテンツを構築する方法を詳しく説明します。 51CTO は、皆様がこのカンファレンスにご参加いただき、テクノロジーがもたらす喜びを私たちと共有していただくことを心より願っております。 51CTO の記者は、カンファレンスで講演する Feng Yang 氏に独占インタビューを行いました。ブローカーの評価と管理におけるディープラーニングとインテリジェント アプリケーションの応用について、同氏がどう考えているかを少し覗いてみます。 不動産業界の特性上、より効率的な人事管理方法が必要となる 不動産業界にとって、仲介業者は企業の中核的な「資産」です。仲介業者の質は、サービスレベルと企業業績に直接影響を及ぼします。仲介業者の経営効率は、その中核的な競争力となっています。従来の多段階の手動管理方法には、客観性と包括性の両面で効率性の問題があります。聯家はすでに32都市に約15万人の仲介業者を抱え、中古住宅、新築住宅、賃貸、旅行などを扱っており、事業拡大に伴いその数も増え続けている。したがって、ブローカー管理のレベルと効率性に対する要件は非常に高くなります。 データと機械学習に基づく仲介業者管理システムの構築の出発点は、ビッグデータとアルゴリズムの機能を活用して管理者の判断と意思決定を支援し、それによって不動産仲介業者の管理レベルと効率を向上させることです。経営の実行に直接関与するのではなく、分析結果を出力して経営者の経営を支援する補助システムです。 ブローカー評価管理システムの基本構造は下図の通りです。下から順に、データ収集、オフライン分析、予測計算、結果適用の順になっています。 データ収集の目的は、ブローカーに関する基本情報、職務レベル、業績、仕事の行動など、可能な限り包括的にすべてのデータを収集し、それらを整理してブローカーを説明する特性データに処理することです。オフライン分析は、主にブローカーの特性データを分析し、ブローカーの個々のポートレートとグループ特性を説明し、異なるブローカーグループ間の典型的な違いを見つけ、手動管理経験を導入して異なるグループにラベルを付けます。予測計算は、機械学習方法を使用してさまざまな判断と予測タスクのモデルを構築し、個々のブローカーごとに予測を行います。予測結果は、これらの管理システムへの入力として対応する管理システムに出力され、ブローカーの能力構築、違反の検証と処理、人事管理、スキルトレーニングなどに役立ちます。 データと機械学習に基づくブローカー評価管理システムの利点を強調する3つの側面 従来の多段階の手動管理方法と比較して、データと機械学習に基づくブローカー評価および管理システムの利点は、主に次の 3 つの側面に反映されています。 1. ブローカーの描写はより包括的かつ客観的である 多段階の手動管理方式は、管理者のレベル、感情、心理状態などの要因に大きく影響されます。管理者の能力レベルは階層によって異なり、標準の実装やステータス評価にも比較的大きな差があります。同じマネージャーであっても、異なる感情や異なる時期における心理状態は、判断や意思決定にも影響を及ぼします。 上記の欠点は、データとアルゴリズムによって補うことができます。データとアルゴリズムによって描写されるブローカーの基準と能力は客観的なデータから得られるものであり、感情、時間、ステータスの影響を受けません。機械学習アルゴリズムは、データを包括的に収集して分析できます。 2. データから出発して、潜在的な要因を時間内に発見できる 多段階の手動管理は、上級管理者の経験によって制限され、いくつかの潜在的な要因が無視される可能性が高く、これは特に新しい問題に直面したときに顕著になります。詐欺防止を例に挙げてみましょう。住宅情報の公開方法が変わり、ブローカーが照会しやすくなった場合、どのオンライン行動特性がブローカーが住宅情報を漏らすなどの違法行為を行っていることを反映しているでしょうか? 手作業による管理では、調査とまとめにかなりの時間が必要です。このゲームプロセスでは、管理者が手作業で情報を取得する速度が、行動特性の変化に追いつけないことがよくあります。データと機械学習の手法は、データから開始して潜在的な異常要因を迅速に検出し、ブローカーの行動管理に追加の保護層を提供します。 3. データ処理効率を大幅に向上 機械学習のもう一つの利点は、データ処理の効率性です。ブローカーの日々の業務活動では、大量のデータが生成されます。このデータ生成は、事業の拡大や人員の増加に伴って非線形に増加します。この状況に対処するには、管理者のトレーニング コストによって管理効率を向上させる必要があります。データと機械学習を組み合わせることで、人件費を大幅に節約し、機械が反復的、定期的な要約、明確な判断の標準作業を完了できるようにすることで、管理者の管理効率を向上させることができます。 データと機械学習に基づくブローカー評価・管理システムの実装 ブローカー管理の観点から見ると、データと機械学習の方法は主に 2 つの重要な問題を解決します。1 つ目は、ブローカーを特徴付け、グループの観点からブローカー モデルを確立することです。 2 つ目は、ブローカーの予測を行い、一定の制約の下でブローカーの潜在的な能力、成長経路、コンプライアンス リスクを予測することです。前者は事後的な問題であり、ブローカーのあらゆる側面からの「定量化された」特性表現に相当します。データはその定量化の基礎であり、データマイニング手法を使用して最大のパターンと最も重要な特徴を発見します。後者は事前問題であり、機械学習手法を使用してブローカーの特性に基づいて予測モデルと判別モデルをトレーニングし、対応するタスクで新しいサンプルや発生していない事柄を予測します。その中でも、データは基礎であり、機械学習はデータ処理と目標達成の手法です。 データと機械学習に基づくブローカー評価・管理システムの基本原理を下図に示します。 ブローカーの特性には、静的属性特性、ステータス特性、動的動作特性などが含まれます。これらの特性は、人事、財務、契約、取引、リンク操作の終了などの一連のビジネスデータから得られます。ビジネスデータの抽出と処理により、各ブローカーを構造的に記述し、ブローカーの特性データを形成できます。特徴データの構築は、機械学習を使用してブローカー管理を支援するための基礎となります。 個々のブローカーデータで構成される特性データセットについては、一方では教師なし学習法を使用して個々のセットをグループに分割し、統計的手法を使用して差異分析を行います。人材管理の経験と組み合わせて、重要な特性を持つブローカー能力モデルを構築し、グループポートレートと能力マッピングを形成します。 一方、教師あり学習は、ステータス判定(個々のブローカーの現在のステータスのレベルを判定し、それが実際のレベルよりも良いか、同じか、悪いかを評価する)、ブローカー成長パス計画(個々のブローカーの成長に適した次の目標と、その目標を達成するために能力を向上させる必要がある領域を予測する)、ブローカーリスク予測(辞職や違反などのリスクを予測する)などの側面から、管理者の意思決定やブローカー管理を支援するために使用されます。 アプリケーションの問題を見つけて解決する ブローカー能力モデルの構築、ブローカー辞任リスク予測、違反判定、リスク予測は、データと機械学習に基づくブローカー評価および管理システムの現在の主な応用シナリオです。そのうち、ブローカー能力モデル構築には、ブローカーのサービス能力、専門スキル、成長可能性、革新能力、チーム貢献能力などの5つの側面が含まれており、10万人のブローカーと20以上の都市をカバーしています。ブローカー離職リスク予測により離職リスクがあると判断されたブローカーの半数以上は1ヶ月以内に離職し(正解率>50%)、5分の1のブローカーは離職前に適時に検出できます(リコール率>20%)。違反判定とリスク予測により、ブローカーの虚偽上場識別(モデル識別+オフライン検証)の効率は手動戦略(戦略ルール識別+オフライン検証)と比較して4倍向上しました。毎月数百件の上場漏洩事件を自動的に発見でき(その後、モデル識別+手動検証)、事前リスク警告の研究開発が現在進行中です。 申請プロセス中に最もよく発生する問題は、結果の解釈可能性と実際の効果の検証という 2 つです。 1. システムから出力される結果は、ブローカー管理の人材支援に適しており、特に違反判定など、結果の理由を説明する必要がある問題では、機械学習自体が相関計算であり、アルゴリズムモデルの複雑さが増すにつれて、結果の解釈可能性は低下します。現状では、Lianjia はデータリンクバックトラッキング方式を採用しています。リスクの高い結果については、計算中のデータリンクを遡り、リンク内の疑わしい点をチェックして判断する手動方式を導入しています。 2. 効果検証では、オフラインでテストセットのモデル効果を簡単に検証でき、その結果はブローカー管理の支援に使用されます。予測された結果に基づいてマネージャーが介入すると、実際の結果に影響が出る可能性があります(たとえば、退職の危機にあるブローカーは、マネージャーの介入により、退職の考えを断念する可能性があります)。現在、連佳の対応は、正式ローンチ前に経営介入を導入せず、結果を評価し、正式ローンチ後に大規模な時間スケールで他の関連指標の変化を比較すること(月単位の時間スケールでの売上高の前年比および前月比の比較など)、および異なる都市や地域間の比較を行うことです。 データと機械学習に基づく方法は良いが、成長するには肥沃な土壌も必要だ 馮楊先生は、データと機械学習に基づく方法を使用するには、業界におけるデータ構築の程度と、業界におけるさまざまなビジネスリンクの標準化の程度という2つの主な条件があると紹介しました。結局のところ、これらはすべてデータに対する要件です。前者はデータ量に対する要件であり、データが一定の規模とビジネスの範囲に達することが必要です。後者は、機能を効果的に定量化できるようにするためのデータ品質に対する要件です。 聯佳がデータと機械学習の手法を活用できるのは、一方では、長年の情報化を経て、オフラインの業務、行動、データの大部分がオンライン化されたためである。聯佳はオンライン情報システムを利用して、ブローカーの基本情報、行動データ、業績状況、業務プロセスなどを収集・管理し、ブローカーに関するあらゆるデータを比較的包括的に収集している。他方では、不動産分野は長年の発展と変革を経ており、その各リンクには対応する業界規範と基本的な評価基準が形成されている。 インターネットを活用して情報化のプロセスを開始する 最後に、Feng Yang氏がLianjiaの情報化プロセスについて簡単に紹介しました。聯家は2010年に情報化と標準化の実施を開始した。初期段階では、主に第三者企業との戦略的協力を通じて不動産取引の標準化を行い、オフライン情報を収集してデジタル管理していた。 Lianjia.comは2014年に正式に設立され、インターネットを通じてブローカーの運営プロセス、資産と顧客ソースの管理、情報サービスなどを完全にデジタル化し、オンライン情報アクセス、オフラインブローカーサービス、さまざまなビジネスリンクでのデータ収集と回復の完全なループを確立しました。 2015年末から、聯家は不動産ビッグデータ化のプロセスを加速させ、住宅情報から始めて、オンラインでの入力、収集、検証、リリースを組み合わせて100%リアルな住宅データベースを確立し、さまざまな業務システムに散在するデータを徐々に収集、再編成、管理し、「住宅(ハウジング)-ゲスト(クライアント)-人(エージェント)」を中核とするビッグデータネットワークを構築してきました。ネットワーク内の情報フローの効率を向上します。 現在、「聯家ドットコム-データ戦略部」は、ビッグデータ、検索プラットフォーム、NLP、戦略アルゴリズムなどのチームを擁し、聯家不動産ビッグデータの構築を担当しています。同時に、データマイニング、機械学習などの手段を組み合わせて、データ製品、戦略製品、データと能力の出力の形で不動産取引の買い手、売り手、ブローカーにサービスを提供すると同時に、ビッグデータシステムを利用して不動産取引業界の標準化プロセスを推進しています。 【講師プロフィール】
Feng Yang、北京理工大学情報工学博士、Lianjia.com データ戦略部門シニアディレクター。彼はSina Weibo、Tencent、Sogouなどのインターネット企業で推薦技術の専門家として勤務し、推薦アルゴリズムの研究や推薦システムの開発に従事していました。研究分野はデータマイニング、機械学習、推薦システムなど。ソーシャルメディアデータマイニング、ソーシャルネットワークユーザー関係モデル構築、Weibo推薦システムとシステム構築、Weibo動画意味解析システムなどを主宰し、実装。 2017年にLianjia.comに入社し、Lianjia.comのデータマイニング、ビッグデータ製品、戦略アルゴリズムなどを担当しています。 クーポンコード [2017WOTDSZ] を使用して、WOTD グローバル ソフトウェア開発テクノロジー サミットにご参加ください。 72時間限定で20%オフ!詳細については、www.wot..comをご覧ください。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: ドアを早く開けてください、ロボット先生が教えに来ます
>>: 人工知能はあなたよりも多くの XXX スターを知っている
トランプ大統領は米国の製造業がかつての栄光を取り戻すことを望んでいる。彼はロボットに狙いを定め、米国...
コンピューター ビジョンは企業に新たな希望をもたらし、良いスタートが始まったばかりです。視覚入力を視...
現在、国民経済と生活のあらゆる分野でビッグデータの理論と応用が盛んに行われています。ビッグデータの基...
人工知能の出現により、ソフトウェア開発の継続的な発展が加速しています。この強力なテクノロジーは、ソフ...
4兆度(345MeV)は、2010年に米国ニューヨークのブルックヘブン国立研究所が相対論的重イオン衝...
[[430175]]デジタル変革の波を受けて、さまざまな新興技術が急速に応用され、普及してきました...
AlphaGOとイ・セドルの人間対機械の戦いにより、ディープラーニングという言葉が再び人気を集めてい...
オープンソース モデルは、数だけでなくパフォーマンスも増加しており、活発な活力を示しています。チュー...
[[329844]]顔認識のリアルタイム パフォーマンスを向上させるために、私たちのチームは従来のニ...
この記事を読んでいただければ、確率の基本原理を機械学習に応用できる可能性が 100% あります。機械...
この記事では、まず初心者が知っておくべき機械学習 (ML) アルゴリズムのトップ 10 を紹介し、い...
数日前、アリババの研究チームは「Animate Anyone」と呼ばれる手法を構築しました。この手法...