独自のビッグデータ知識システムを迅速かつ包括的に構築するにはどうすればよいでしょうか?

独自のビッグデータ知識システムを迅速かつ包括的に構築するにはどうすればよいでしょうか?

多くの人がさまざまな種類の本を読み、ビッグデータに関する多くの記事に出会ったことがありますが、それらはすべて散在していて体系的ではなく、あまり役に立ちません。そのため、著者は時間をかけて、システム全体の観点からビッグデータ製品の設計アーキテクチャと技術戦略をすべての人に理解できるように導きます。

ビッグデータ製品は、体系的かつシステム的な観点から、主に 5 つのステップに分けられます。

  • フロントエンドでさまざまなチャネルのデータポイントが埋め込まれ、さまざまなチャネルに応じて多次元データが収集されます。これがビッグデータの最初のステップです。完全なデータがなければ、ビッグデータ分析をどのように議論できるでしょうか?
  • 2 番目のステップは、ETL を使用して、収集された多次元データに基づいてさまざまな種類のデータの構造化処理とロードを実行することです。
  • 3 番目のステップは、ETL 処理後の標準化された構造化データ用のデータ ストレージ管理サブシステムを確立し、それを基盤となるデータ ウェアハウスに集約することです。このステップは非常に重要です。データ ウェアハウスに基づいて、その内部データは基本的な同質のデータ マートに分解されます。
  • 次に、集約および分解されたさまざまなデータ マートを基に、さまざまな R 関数パッケージを使用して、データ セットのデータ モデリングとさまざまなアルゴリズム設計を実行します。アルゴリズムは自分で設計する必要があり、一部のアルゴリズムでは R 関数を使用できます。このプロセスには、ほとんどの製品および運用担当者が関与します。このステップが適切に実行されれば、多くの企業のユーザー ポートレート システムの基盤レイヤーにもなります。
  • ***確立されたさまざまなデータ モデルとアルゴリズムに基づき、フロントエンドのさまざまなチャネルのさまざまなビジネス特性と組み合わせることで、バックエンド モデルはチャネルのタッチポイントに応じて自動的にマッチングされ、ユーザーにパーソナライズされた製品とサービスを自動的に表示します。

​​

体系的なデータ収集指標システムを確立する

データ収集および分析指標システムを確立することは、マーケティングデータマートを形成するための基礎であり、マーケティングデータマートがユーザー行動データの広さと深さをカバーするための前提条件でもあります。データ収集および分析システムには、ユーザーの完全な活動行動タッチポイントデータ、ユーザーの構造化関連データ、および非構造化関連データが含まれている必要があります。データ分析指標システムに従ってのみ、分類および要約して、ユーザーの条件をフィルタリングするための属性と属性値を形成でき、これは新しいマーケティングイベントを発見するための基礎でもあります。

マーケティングデータ指標分析モデルを構築し、データ指標収集を改善およびアップグレードし、ユーザーの全プロセス行動タッチポイントに依存してユーザー行動消費特性と個人属性を確立し、ユーザー行動分析、業務運営データ分析、マーケティングデータ分析の3つの次元からユーザー行動特徴分析モデルを形成します。ユーザー ディメンション データ インジケーターは、さまざまなディメンション分析要素とユーザーのライフ サイクル全体の軌跡の各タッチ ポイントの 2 次元交差によって取得されます。

現在、ビッグデータ プラットフォームに取り組む企業が収集したデータ指標や出力する視覚的なレポートのほとんどには、いくつかの重要な問題があります。

  • 収集されたデータはチャネル、日付​​、地域別に集計されており、特定のユーザーを特定することはできません。
  • 計算された統計データはすべてスケールデータであり、スケールデータのマイニングと分析はサポートされていません。
  • データは、ユーザーの獲得、維持、マーケティングの推進のためのシステムの使用をサポートできません。

したがって、システムが収集したデータ指標がプラットフォームフロントエンドのパーソナライズされた行動分析をサポートするためには、ポートレートデザインをユーザーを中心に据える必要があります。初期のビジュアルレポートの結果に基づいて、異なるスケールの統計データをセグメント化してユーザーごとに配置して、各データにユーザー属性を持たせる必要があります。

散在し、乱雑な統計データをユーザーごとに関連付けます。既存の製品インターフェースでは、各統計データにラベルが追加されます。ラベルをクリックすると、各ユーザーの対応する行動データが表示され、他の統計データページにリンクできます。

このことから、ユーザーを主軸として、ユーザー ID 情報、ユーザーの社会生活情報、ユーザーの資産情報、ユーザーの行動嗜好情報、ユーザーのショッピング嗜好、ユーザー価値、ユーザーのフィードバック、ユーザーのロイヤルティなどのデータ収集指標ディメンションを確立できることが推測できます。確立された収集データ ディメンションに基づいて、データ指標またはデータ属性項目に細分化できます。

① ユーザーID情報ディメンション


性別、年齢、星座、居住都市、活動地域、ID情報、学歴、収入、健康状態など。


②ユーザーの社会生活情報次元


業種、職業、子供の有無、子供の年齢、乗り物、住宅の種類、通信状況、データ使用量...


③ ユーザー行動嗜好情報


オンラインショッピング行動、リスク感度、価格感度、ブランド感度、利益感度、製品嗜好、チャネル嗜好などがあるかどうか...


④ ユーザーのショッピング嗜好情報


カテゴリの好み、製品の好み、買い物頻度、閲覧の好み、マーケティング広告の好み、買い物時間の好み、1 回の買い物の最大金額...


⑤ ユーザーフィードバック情報ディメンション


ユーザーが参加するアクティビティ、参加するディスカッション、収集する製品、購入する製品、推奨する製品、レビューする製品...


​​

収集された多次元データに基づいて、ETL を使用してさまざまな種類のデータの構造化処理とロードを実行します。

  • データ補完:空データや欠損データのギャップを埋め、処理できないデータをマークします。
  • データ置換: 無効なデータを置換する
  • フォーマットの正規化: ソースデータから抽出されたデータフォーマットを、ウェアハウスに入力して処理しやすいターゲットデータフォーマットに変換します。
  • 主キー制約と外部キー制約: 主キー制約と外部キー制約を確立することで、不正なデータを置き換えたり、エラー ファイルにエクスポートして再処理したりできます。
  • データのマージ: 複数のテーブルの関連付けの実装 (関連付けられたクエリの効率性を確保するために各フィールドにインデックスが付けられます)
  • データ分割: 特定のルールに従ってデータを分割する
  • 行と列を入れ替え、シーケンス番号を並べ替え/変更し、重複レコードを削除します

データ処理層は、Hadoop クラスターで構成されています。Hadoop クラスターは、データ収集ソースから業務データを読み取り、並列コンピューティングによって業務データの処理ロジックを完了し、データをフィルタリングしてマージし、ターゲット データを形成します。

データモデリング、ユーザープロファイリング、機能アルゴリズム

マーケティングに関連する顧客、製品、サービスデータを抽出し、クラスター分析と関連分析の方法を使用してデータモデルを構築し、ユーザールール属性の構成、ルールテンプレートの構成、ユーザーポートレートのラベル付けを通じてユーザーデータルールセットを形成し、ルールエンジンを使用してマーケティングプッシュと条件トリガーのリアルタイムマーケティングプッシュを実装し、フロントエンドチャネルインタラクションプラットフォームと同期してマーケティングルールを実行し、マーケティング実行効果情報をリアルタイムでビッグデータシステムに返します。

​​

フロントエンドユーザーのさまざまなパーソナライズされた行動に基づいてルールを自動的に一致させ、プッシュコンテンツをトリガーします。

ユーザーの全プロセス活動行動軌跡に基づいて、ユーザーとオンラインおよびオフラインチャネル間のすべての行動タッチポイントを分析し、マーケティングユーザーにラベルを付け、ユーザー行動ポートレートを形成します。ユーザーポートレートに基づいて、マーケティングスクリーニングルールの属性と属性値が洗練および要約され、最終的にユーザーグループをセグメント化するための条件が形成されます。各ユーザー属性は複数の異なる属性値に対応しており、属性値はさまざまなアクティビティに応じてパーソナライズでき、ユーザーのブラックリストとホワイトリストの管理機能をサポートします。

異なるユーザー ID 特性に基づくアクティビティ ルールとモデルを事前に設定できます。現在のユーザーが設定されたマーケティング イベントをトリガーすると、データ システムは最適なマッチングの原則に従ってマーケティング ルールをリアルタイムで自動的にプッシュし、リアルタイム プッシュ機能を通じてプッシュされたアクティビティ コンテンツ、割引情報、製品情報を設定します。同時に、フロント エンドからフィードバックされた効果データを集計して、プッシュ ルールとコンテンツを最適化および調整します。

ビッグデータシステムは、既存のユーザーポートレート、ユーザー属性のラベリング、顧客とマーケティングルールの設定プッシュ、および同じタイプのユーザー特性のコレクションとサブライブラリモデルに基づいて、顧客マーケティングシステムと統合されます。将来的には、マシンディープラーニング機能を徐々に拡張します。システムは、フロントエンドのユーザーデータのリアルタイムの変更を自動的に収集して分析し、構築されたマシンディープラーニング機能モデルに基づいて、ユーザーのニーズに合った機能パラメータと対応ルールを自動的に計算します。マーケティングシステムは、計算されたルールモデルに基づいて、一致性の高いマーケティング活動とコンテンツ情報をリアルタイムで自動的にプッシュします。

​​

機械自己学習モデルアルゴリズムは、将来のビッグデータシステムにおけるディープラーニングの中核です。大規模なサンプリングトレーニング、複数のデータ検証、パラメータ調整を通じてのみ、比較的正確な機能因子とパラメータ値を最終的に決定できます。したがって、フロントエンドユーザーが生成したリアルタイムの行動データに基づいて、システムは対応するマーケティングルールと推奨モデルを自動的に計算できます。

ビッグデータシステムは、ディープセルフラーニングに加えて、今後徐々に協力概念を開拓し、外部のサードパーティプラットフォームと接続し、顧客データと行動タッチポイントの範囲を拡大し、ユーザーのライフサイクル全体にわたるオンラインとオフラインの行動軌跡を可能な限りカバーし、ユーザーの行動タッチポイントデータを把握し、顧客データマートとイベントライブラリを拡張します。このようにしてのみ、顧客のニーズ全体を深く探究し、機械のセルフラーニング機能と組み合わせて、製品の販売能力と顧客の全方位的な体験認識を根本的に向上させることができます。

<<:  ハンシのシリーズB資金調達は、「安全とインテリジェンス」ブランドをアピールすることで注目を集めている

>>:  強化学習の概念から応用まで包括的に理解する

ブログ    
ブログ    
ブログ    

推薦する

署名アルゴリズムに基づくシンプルで安全なAPI認証メカニズム

[[384489]]広告システムに取り組んでいたとき、接続されたプラットフォーム上のほとんどの広告シ...

言語は「絆」であり、イメージバインドを超えて、さまざまなモードでパンチとキックを行う

北京大学とテンセントがマルチモーダル15角形の戦士を制作しました!言語を中心に据えて、ビデオ、オーデ...

...

Python ベースのパーセプトロン分類アルゴリズムの実践

[[374354]]パーセプトロンは、バイナリ分類タスク用の線形機械学習アルゴリズムです。これは、人...

...

グラフ ネットワークをより堅牢にします。 Googleは、データのラベル付けバイアスやドメイン転送を恐れないSR-GNNを提案

グラフ ニューラル ネットワーク (GNN) は、機械学習でグラフ構造データを活用するための強力なツ...

将来に影響を与える戦略的テクノロジートレンドトップ10

常に進化するテクノロジーの世界では、企業、政府、個人にとって、常に最先端を行くことが重要です。このダ...

農業用ドローンは熱を帯び続け、今後の開発に向けた3つの大きなトレンドが浮上

農業は国民の衣食住の問題を解決する鍵であり、国民経済の発展を促進する重要な基盤でもあります。我が国は...

家主は、あなたに賃貸するかどうかを決める前に、AIを使ってあなたの犯罪歴を審査しているかもしれない。

[[351784]]ビッグデータダイジェスト制作著者: miggyようやく気に入った家が見つかり、...

...

深層強化学習探索アルゴリズムの最新レビュー: 約 200 本の論文が課題と将来の方向性を明らかにする

[[434358]]現在、強化学習(深層強化学習DRL、マルチエージェント強化学習MARLを含む)は...

知能ロボット連携システムとその主要技術

ロボットの知能化に向けた開発において、マルチロボット協働システムは包括的な技術統合プラットフォームで...

第4世代移動ロボット:凌東科技V-AMRのグローバル発売と投資促進

8月26日、北京の中関村国家自主革新モデル区展示センターで、玲東科技マックスの新製品発表会およびチャ...

COVID-19 最新情報: COVID-19 との戦いに役立つトップ 10 のイノベーション

[[320870]]迅速な感染検査から3Dプリントソリューションまで、世界中のテクノロジー企業が協力...

人工知能がフィットネス業界にもたらすイノベーション:AIパーソナルトレーナーの登場

デジタル技術によって変革されない業界を見つけるのは難しいですが、適応型セクターも例外ではありません。...