【ビッグコーヒーがやってくるエピソード5】ビッグデータミドルプラットフォームの構築方法

【ビッグコーヒーがやってくるエピソード5】ビッグデータミドルプラットフォームの構築方法

今回、「ビッグネームがやってくる」のライブ放送にゲストとして参加したのは、iResearch CTOの郭偉氏です。郭氏は「ビッグデータミドルプラットフォームの構築方法」というテーマについて、主にビッグデータミドルプラットフォームを構築する理由、技術的なビッグデータミドルプラットフォームを構築するための参照モデルと考え方、大規模・中規模プラットフォームと小規模フロントエンドのシナリオで技術者が行うべきことの3つの側面について、自身の見解を共有しました。

なぜビッグデータ プラットフォームを構築するのでしょうか?

現在および将来、ほとんどの企業は徐々にデータ企業となり、デジタルユーザー資産はこれらの企業の中核資産となり、人工知能やビッグデータなどの最先端技術もインフラストラクチャとなり、各企業のビジネスユーザーと事業ラインの急速な成長を促進します。実際、ビッグデータミドルプラットフォームは、企業が従来の情報化からデジタル化へと進化する中で必然的に生まれた産物です。

中間段階は、技術者が舞台裏から舞台前面へと移動する過渡期です。なぜそう言うのでしょうか?下の図は投資銀行を例に挙げています。

投資銀行のフロントオフィス、ミドルオフィス、バックオフィスの定義をインターネットやシステムに当てはめると、フロントオフィスはお金を稼ぐためのものであり、バックオフィスはお金の稼ぎをサポートするものであり、ミドルオフィスはより迅速なお金の稼ぎをサポートするものであることが簡単にわかります。ビッグデータミドルプラットフォーム構築の本質は、これまでバックエンドで行われていた作業をミドルプラットフォームに移行し、さらにフロントエンドをサポートしてデータ分析をより効率的に行うことです。

ビッグデータ プラットフォームが大流行していますが、なぜビッグデータ ミドル プラットフォームを構築する必要があるのでしょうか?ビッグデータ プラットフォームを構築する際には、さまざまな問題点があるためです。主なポイントは次の 3 つです。

  • ビッグデータ プロジェクトを開始するのは困難です。ビッグデータ プラットフォームの構築サイクルが長く、コストが高く、スタッフにインターネット運用の経験が不足しています。

  • ビッグデータプロジェクトの効果を実証することは困難です。ビッグデータがどのようにインターネット運用上の問題を解決できるか、ビッグデータシステム構築の結果はより多くのBIレポートであり、ビッグデータ構築のROIは測定できません。

  • ビッグデータ プロジェクトは実行が困難です。データ ソースが複雑かつ多様であり、元のシステムには複数の部門間の調整とコミュニケーションが伴い、データ ガバナンスの問題もあります。

ビッグデータ プラットフォーム全体は、データへのアクセス、計算、分析、操作から始まり、下図に示すように、各レイヤーには特定の操作プロセスを持つさまざまなモジュールがあります。

このような典型的なビッグデータ プラットフォームの構造に直面して、どうすれば効率を改善できるでしょうか?考慮すべき5つのポイントを以下に示します。

  1. ビジネスをビジネスに戻し、ビジネス担当者がオンデマンド注文に関する技術的なフィードバックを待つという時間のかかるプロセスを可能な限り回避します。

  2. オペレーターのニーズを満たすリアルタイムのデータ分析を実現します。

  3. 人工知能や拡​​張知能でカバーされる一般的なアルゴリズムをより適切にサポートできます。

  4. データ ガバナンスは、技術面ではなくビジネス面から実行する必要があります。

  5. ビジネス担当者とデータ サイエンティストが、従来のソフトウェア処理方法ではなく、直接フィードバックを確認できるようにします。

ビッグデータ プラットフォームからデータ ミドル プラットフォームへの移行は、テクノロジーからビジネスへの飛躍です。以前はテクノロジーのみに注目していましたが、ミドル プラットフォームの時代では、ビジネスの側面からテクノロジーに注目します。

技術的ビッグデータミドルプラットフォーム構築の参考モデルと考え方

ビッグデータミドルプラットフォームは、下図に示すように、ラージミドルプラットフォームとディープミドルプラットフォームの2つのモードに大別できます。

BATと同様のビッグデータミドルプラットフォームはビッグミドルプラットフォームと呼ばれ、最下層にLaaSやPaaSを展開したより拡張性の高いデータミドルプラットフォームであり、各事業ラインはこれを基盤として二次開発を行っています。しかし、中小企業の場合、各事業ラインをサポートする汎用ミドルプラットフォームを開発する人材が不足しており、各事業ラインは独自のニーズを中心に開発することしかできません。このような状況をディープミドルプラットフォームと呼びます。

深センミドルプラットフォームモデルについて語るとき、ここで言及する必要があるのはデータリバー理論です。では、データリバー理論とは何でしょうか?

データ リバー理論はデータ レイクに関連しています。データ レイクは、過去のさまざまなチャネルからのすべてのデータをまとめて、関連する計算を容易にします。ただし、時間が経つにつれて、徐々にデータ スワンプに変わり、データ操作がますます困難になります。

データ リバーの出現により、データ操作が容易になり、データの質とデータ ガバナンスが失われるデータがますます少なくなります。単一のデータ モデルがデータ リバーを流れ、データはリアルタイムでユーザーに直接流れます。さまざまなデータ リバーが企業内のデータ ウォーター エコロジーをサポートします。

深圳-中台モデルは、実際にはデータが直接流れるデータ リバー モデルです。 Data River の抽象概念は、以下に示すように IOTA アーキテクチャに実装できます。

IOTA は、固定データ モデル、データ生成時の定期的なアトミック キャリバー、ビジネス キャリバーをビジネス担当者に返す機能、エッジ コンピューティングと即時フィードバックをサポートする機能を備えた、典型的な de-ETL ディープエンド アーキテクチャです。

下図に示すように、Analysys ARGOフリーユーザーデータミドルプラットフォームサンプルの構造は、

この iResearch ARGO フリー ユーザー データ ミドル プラットフォーム サンプルでは、​​フリー部分と非コア部分がオープン ソース化されており、プライベート展開、クロスターミナル ユーザー アカウント統合、リアルタイムの複雑な計算とドリルダウン分析、および二次開発をサポートします。

IOTA アーキテクチャと同様に、技術担当者はデータが生成されると原子口径を整理し、カスタム インジケーターを介してリアルタイム クエリを実行し、ビジネス 口径をビジネス担当者に返します。

大規模、中規模、小規模のフロントエンドシナリオで技術者は何をすべきでしょうか?

皆さんも疑問に思うことがあるかもしれません。データミドルプラットフォームが普及する中、ビッグデータエンジニアやデータアナリストなど、データ関連の職種に就く人々の動向はどうなるのでしょうか。

データミドルプラットフォームの出現により、人材の技術と業務の融合と飛躍が可能になり、データ技術者はデータ技術の幅を広げるだけでなく、フロントエンド業務への理解を深め、新たなクロスドメインの「ドラゴン」種であるデータミドルプラットフォームエンジニアになることができました。データミドルオフィスエンジニアが備えていなければならない基本的なスキルは、ビジネスモデル、トラフィックモデル、データ分析システムの 3 つです。

ビジネスモデルには、注目操作、取引操作、利益操作が含まれます。注意管理: これらの製品は、メディア、ゲーム、広告を通じて収益化されるあらゆる製品にユーザーが費やす時間を最大化しようとします。フォーカスインジケーターは、UV、PV、訪問期間、訪問頻度、ユーザー訪問サイクル、訪問間隔などの粘着性です。トランザクション操作: このタイプの製品は、電子商取引プラットフォーム、さまざまな取引プラットフォーム、ライフサービス、SaaS など、ユーザーが購入の決定を下すのに役立ちます。注目すべき指標は、新製品の割合、検索された製品の割合、GMV、ARPU などの取引と取引アクティビティです。効率的な運用: このタイプの製品は、ツール、B2B などの既存のタスクやワークフローを完了するためのシンプルで信頼性の高い方法をユーザーが作成するのに役立ちます。フォーカス インジケーターは、ユーザーが完了したワークフローの数や、ユーザーがワークフローを完了するのにかかる時間など、ユーザーの使用状況の深さを示すインジケーターです。

次の図は、データセンターエンジニアにとって必須のスキルであるトラフィックモデルを示しています。

ウェブサイトを分析する場合、このグラフに従うことができます。横軸は収益化能力、縦軸はトラフィック転換能力です。さまざまな役割があります。一般的に、金融カテゴリには強力な収益化機能があり、エンターテイメントカテゴリには強力なトラフィック転換機能があり、旅行カテゴリには強力なトラフィック転換機能があります。

次の図は、データセンターエンジニアにとって必須のスキルであるデータ分析システムを示しています。

すべての製品は、MVP の有効性の検証、シード ユーザーの獲得、製品の品質向上、ユーザー エクスペリエンスの向上、収益を達成するための新規顧客の獲得、規模による利益の最大化など、最初から各段階でユーザー分析、エンゲージメント分析、チャネル分析、構成分析、収益分析などの分析を行う必要があります。

各段階ではビジネスを調査するための分析システムが必要となるため、技術者はデータ分析能力とデータ分析システムに関する知識を補う必要があります。

新しいデータミドルプラットフォームの場合、反復検証サイクルは数時間から数日の反復サイクルです。技術担当者は原子レベルの口径を確立するだけでよく、業務担当者はリアルタイムのビジネスデータ分析を行ってビジネス分析をサポートします。

データミドルプラットフォームを構築する前に、以下の手順を検討する必要があります。1つ目は、技術/ビジネスマネージャーとミドルプラットフォームが本当に必要かどうかを話し合うことです。2つ目は、ミドルプラットフォームモデルを選択することです。ディープミドルプラットフォームかシャローミドルプラットフォームかを選択します。3つ目は、データミドルプラットフォームを選択することです。どの選択をしたとしても、最終結果は、ビジネス担当者が直接関連データ分析を実行し、ビジネスをビジネスに戻し、テクノロジーにテクノロジーを実行させることでなければなりません。4つ目は、人材とアイデアの変革です。


<<:  [ビッグガイがやってくるエピソード4] データ駆動型の製品意思決定とインテリジェンス

>>:  AIスタートアップが成熟するための4つの段階と懸念事項

ブログ    
ブログ    

推薦する

AI、5G、エッジテクノロジーが製造業をリード

オフィスから作業場、製品に至るまで、製造業はテクノロジーで溢れており、コネクテッドエコノミーの導入に...

ロボットインテリジェント把持システム:いくつかの主流ソリューション

ロボット学習における典型的な問題の 1 つは、分類、つまり乱雑に積み重なったアイテムの山から目的のア...

人工知能を始める、現実的な仕事の選び方は?

[[235638]]人工知能は、誰もが「データ サイエンティスト」になるという、2、3 年前のビッ...

5 年以内に、8,000 万の仕事が機械に置き換えられるでしょう。インダストリアル インターネットは治療薬でしょうか、それとも毒でしょうか?

時代の発展は常に要求と矛盾の中で発展しています。あらゆる産業革命は発展の力をもたらすだけでなく、大き...

...

OpenAIがカスタムコマンド機能を開始、会話ごとに好みや情報を繰り返す必要がなくなる

OpenAIは7月21日、カスタム指示機能のリリースを発表しました。この機能はまずPLUSプランのベ...

Google BardとChatGPT、どちらを選ぶべきでしょうか?

こんにちは、ルガです。今日は、人工知能 (AI) エコシステムに関連するテクノロジーについて、Goo...

生成 AI は SOC アナリストにどのような力を与えるのでしょうか?

今日のサイバーセキュリティの脅威がますます深刻化する中、セキュリティ オペレーション センター (S...

生成型 AI は急速な発展期を迎えています。その応用はどのように実装されるのでしょうか?

先月、国際的に有名な学術誌「ネイチャー」が2023年のトップ10を発表しました。世界的な科学イベント...

AIは風力発電業界で深く応用されています。Kuoboのインテリジェントドローンは、わずか20分で全自動検査を行います

[原文は51CTO.comより] Cloboticsはこのほど、風力タービンブレードの全自動検査の新...

ソラのトレーニングデータが流出した疑い、ネットユーザー「UE5が間違いなく使われている」

朗報です、朗報です、本物のソラの新しいビデオがあります!通りかかったらぜひお見逃しなく! (本物のS...

ビジネス インテリジェンス戦略を成功させるための 8 つの重要な要素

ジャクソン氏は過去 8 年間にわたり、このプロジェクトを成熟させるために、社内の他の幹部と協力してき...

...

大きな AI 問題の解決: AI 操作のエネルギー消費を削減するにはどうすればよいでしょうか?

現在、AI分野で画期的な進歩を遂げているディープラーニングモデルの規模が大きくなるほど、エネルギー消...