「順序付きファネル」アルゴリズム問題は、iResearch A10サミットで新たなブレークスルーを達成すると期待されています。

新小売、新金融、新エンターテインメントなどの新しい業態の台頭により、ビッグデータの驚異的な力がインターネット生活のあらゆる側面に浸透し、ビッグデータに基づくモバイルアプリケーションが世界を変えています。技術レベルで「ファネル」のアップグレードをどのように実現し、ビッグデータの豊富なエネルギーを最大限発揮させるかは、現在のデータ応用分野における重要な課題です。

インターネットの後半に入り、モバイルアプリケーションの主な戦場は、新規ユーザーの獲得から既存ユーザーの運用へと移行しました。ユーザーの維持とアクティビティの向上が製品運用の中核となっています。ユーザーがモバイルアプリケーションを使用するとき、パスを通じて目的を達成します。たとえば、ユーザーのオンラインショッピングの行動は、「商品を閲覧する → ショッピングカートに追加する → 注文を生成する → 注文を支払う → 支払いを完了する」という経路と考えることができます。パスの各ノードではユーザー損失の度合いが異なり、層ごとに減少して、全体として漏斗型のモデルを形成します。クリティカルパスを計算する方法として、一般的に受け入れられている方法には、順序なしファネルと順序付きファネルの 2 つがあります。

順序なしファネルでは、前のイベントと後続のイベントの発生を任意に配置できます。たとえば、ユーザーは、ステップ間の論理的な順序に制約されることなく、自由にページを切り替えたり、ホームページに戻ったりできます。順序付きファネルの各ステップ間には厳密な順序制限があり、2 番目のステップのイベントは最初のステップの後に発生する必要があります。支払い処理中は、対応する支払い操作を入力する前に、購入する商品を選択する必要があります。順序付きファネルは、ショッピングの支払いや情報の登録など、厳格な論理階層要件を持つパス動作に広く存在します。ユーザーパスの重複率が極めて低い無秩序なファネルと比較すると、順序付けられたファネルのデータ調査はより価値があります。

「ファネル」モデルの計算の中核は、分解と定量化です。大量かつ複雑なユーザーデータに直面すると、「順序付けられたファネル」は論理的な制約により計算プロセスでさらに大きな課題に直面します。大量のデータをバッチ処理する場合、複雑なデータをリアルタイムで処理する効率を確保することは困難です。「ファネル」をアップグレードする際の技術的な難しさは、計算速度にあります。

一部のインターネット企業はビッグデータ分析ツールの研究開発に力を入れており、技術的なレベルから「オーダードファネル」の計算効率を飛躍的に向上させることを期待しているが、重要な成果はほとんど発表されていない。その理由は、第一に、テスト対象として十分な規模のデータを見つけることが困難であり、第二に、強力な技術的サポートが不足していることです。

[[206016]]

「2017 Analysys OLAP アルゴリズムコンペティション」では、「オーダードファンネル」の計算効率の技術的なボトルネックに共同で取り組みます。 Analysysは、Analysys WanxiangやAnalysys Qianfanなどの成熟したデータ製品をすでに所有している業界リーダーとして、データの専門家に協力してアルゴリズムの専門家を募集し、「オーダードファネル」の技術的な困難を突破するよう要求を公表しました。

主催者から聞いたところ、この iResearch OLAP アルゴリズムコンペティションに参加するためのルールは次の通りです。主催者が提供するアプリケーション変換と OLAP シナリオに基づいて、参加者はまずテストデータセットを使用して指定されたテストクラスターで実行し、テスト結果を提示します。最後に実際のテストデータを使用して、テストクラスターで全体のデータを実行し、時間ランキングを提示します。

技術的なレベルでは、競争の選択に使用される OLAP ファンネルシナリオには、大量のデータに対するリアルタイムの多次元の秩序ある分析モデルが必要です。データ処理では、データのスライスと前処理、列の保存、圧縮、辞書、インデックスを、細部における巧妙な推論と組み合わせて使用することで、計算の量と複雑さを軽減し、特定の次元のデータを正確に観察することができます。また、ドリルダウンなどの操作を通じてデータの粒度を高め、より豊富なデータの詳細を取得し、データ分析を効率的かつ詳細で価値のあるものにすることもできます。

データレベルでは、2017年第3四半期時点で、iResearchは現在、1日あたり261億のデータ項目を処理し、297分野から合計21億9000万台のスマート端末をカバーし、251万以上のモバイルアプリケーションを監視しており、データストレージ容量は5.8PBです。このコンテストは、iResearch の数十億人の膨大なデータベースを活用しており、コンテストの結果はより信頼性が高く、より実用的なものとなっています。

このコンテストのクラウドコンピューティングサービスは、UCloud によって提供されています。コンテストは現在正式に競技段階に入っており、ビジネスグループとオープンソースグループにそれぞれ約 40 チームと個人が参加する予定です。このビジネスグループには、Migu Music、Beijing Lejian Technology、Nanjing Fanruan Software、Hangzhou Daisu Technology、Beijing Runqian Information、Kyligence、AggreData、Gbase などの企業から強力な技術チームが参加しました。このオープンソースグループには、Xiaomi、Meituan、Reyun Data、Yuansu Data、LinkDoc、hulu、LeXiang Tianxia、Niuban Technology、上海瑞民、北京交通大学のデータ専門家が含まれています。

10月27日、北京でiResearch A10ビッグデータアプリケーションサミットが盛大に開幕します。その際に、このOLAPアルゴリズムコンテストの優勝チームが決定され、コンテストの優秀事例もサミットで展示されます。データ専門家の指導と国内専門家の共同の努力により、「オーダードファネル」の計算効率という難題は大きな突破口となるかもしれない。

<<: 従来のセキュリティ手法を覆し、AIがWebセキュリティを再定義

>>: クラウドコンピューティングはすべての人に利益をもたらす技術です。アリババクラウドは製造業と密接に連携し、「中国のスマート製造」を推進します。