「順序付きファネル」アルゴリズム問題は、iResearch A10サミットで新たなブレークスルーを達成すると期待されています。

「順序付きファネル」アルゴリズム問題は、iResearch A10サミットで新たなブレークスルーを達成すると期待されています。

新小売、新金融、新エンターテインメントなどの新しい業態の台頭により、ビッグデータの驚異的な力がインターネット生活のあらゆる側面に浸透し、ビッグデータに基づくモバイルアプリケーションが世界を変えています。技術レベルで「ファネル」のアップグレードをどのように実現し、ビッグデータの豊富なエネルギーを最大限発揮させるかは、現在のデータ応用分野における重要な課題です。

インターネットの後半に入り、モバイル アプリケーションの主な戦場は、新規ユーザーの獲得から既存ユーザーの運用へと移行しました。ユーザーの維持とアクティビティの向上が製品運用の中核となっています。ユーザーがモバイル アプリケーションを使用するとき、パスを通じて目的を達成します。たとえば、ユーザーのオンラインショッピングの行動は、「商品を閲覧する → ショッピングカートに追加する → 注文を生成する → 注文を支払う → 支払いを完了する」という経路と考えることができます。パスの各ノードではユーザー損失の度合いが異なり、層ごとに減少して、全体として漏斗型のモデルを形成します。クリティカル パスを計算する方法として、一般的に受け入れられている方法には、順序なしファネルと順序付きファネルの 2 つがあります。

順序なしファネルでは、前のイベントと後続のイベントの発生を任意に配置できます。たとえば、ユーザーは、ステップ間の論理的な順序に制約されることなく、自由にページを切り替えたり、ホームページに戻ったりできます。順序付きファネルの各ステップ間には厳密な順序制限があり、2 番目のステップのイベントは最初のステップの後に発生する必要があります。支払い処理中は、対応する支払い操作を入力する前に、購入する商品を選択する必要があります。順序付きファネルは、ショッピングの支払いや情報の登録など、厳格な論理階層要件を持つパス動作に広く存在します。ユーザーパスの重複率が極めて低い無秩序なファネルと比較すると、順序付けられたファネルのデータ調査はより価値があります。

「ファネル」モデルの計算の中核は、分解と定量化です。大量かつ複雑なユーザー データに直面すると、「順序付けられたファネル」は論理的な制約により計算プロセスでさらに大きな課題に直面します。大量のデータをバッチ処理する場合、複雑なデータをリアルタイムで処理する効率を確保することは困難です。 「ファネル」をアップグレードする際の技術的な難しさは、計算速度にあります。

一部のインターネット企業はビッグデータ分析ツールの研究開発に力を入れており、技術的なレベルから「オーダードファネル」の計算効率を飛躍的に向上させることを期待しているが、重要な成果はほとんど発表されていない。その理由は、第一に、テスト対象として十分な規模のデータを見つけることが困難であり、第二に、強力な技術的サポートが不足していることです。

[[206016]]

「2017 Analysys OLAP アルゴリズム コンペティション」では、「オーダード ファンネル」の計算効率の技術的なボトルネックに共同で取り組みます。 Analysysは、Analysys WanxiangやAnalysys Qianfanなどの成熟したデータ製品をすでに所有している業界リーダーとして、データの専門家に協力してアルゴリズムの専門家を募集し、「オーダードファネル」の技術的な困難を突破するよう要求を公表しました。

主催者から聞いたところ、この iResearch OLAP アルゴリズム コンペティションに参加するためのルールは次の通りです。主催者が提供するアプリケーション変換と OLAP シナリオに基づいて、参加者はまずテスト データ セットを使用して指定されたテスト クラスターで実行し、テスト結果を提示します。最後に実際のテスト データを使用して、テスト クラスターで全体のデータを実行し、時間ランキングを提示します。

技術的なレベルでは、競争の選択に使用される OLAP ファンネル シナリオには、大量のデータに対するリアルタイムの多次元の秩序ある分析モデルが必要です。データ処理では、データのスライスと前処理、列の保存、圧縮、辞書、インデックスを、細部における巧妙な推論と組み合わせて使用​​することで、計算の量と複雑さを軽減し、特定の次元のデータを正確に観察することができます。また、ドリルダウンなどの操作を通じてデータの粒度を高め、より豊富なデータの詳細を取得し、データ分析を効率的かつ詳細で価値のあるものにすることもできます。

データレベルでは、2017年第3四半期時点で、iResearchは現在、1日あたり261億のデータ項目を処理し、297分野から合計21億9000万台のスマート端末をカバーし、251万以上のモバイルアプリケーションを監視しており、データストレージ容量は5.8PBです。このコンテストは、iResearch の数十億人の膨大なデータベースを活用しており、コンテストの結果はより信頼性が高く、より実用的なものとなっています。

このコンテストのクラウドコンピューティングサービスは、UCloud によって提供されています。コンテストは現在正式に競技段階に入っており、ビジネスグループとオープンソースグループにそれぞれ約 40 チームと個人が参加する予定です。このビジネス グループには、Migu Music、Beijing Lejian Technology、Nanjing Fanruan Software、Hangzhou Daisu Technology、Beijing Runqian Information、Kyligence、AggreData、Gbase などの企業から強力な技術チームが参加しました。このオープンソース グループには、Xiaomi、Meituan、Reyun Data、Yuansu Data、LinkDoc、hulu、LeXiang Tianxia、Niuban Technology、上海瑞民、北京交通大学のデータ専門家が含まれています。

10月27日、北京でiResearch A10ビッグデータアプリケーションサミットが盛大に開幕します。その際に、このOLAPアルゴリズムコンテストの優勝チームが決定され、コンテストの優秀事例もサミットで展示されます。データ専門家の指導と国内専門家の共同の努力により、「オーダードファネル」の計算効率という難題は大きな突破口となるかもしれない。


<<:  従来のセキュリティ手法を覆し、AIがWebセキュリティを再定義

>>:  クラウドコンピューティングはすべての人に利益をもたらす技術です。アリババクラウドは製造業と密接に連携し、「中国のスマート製造」を推進します。

ブログ    

推薦する

...

機械学習は金融自動化においてどのような役割を果たすのでしょうか?

金融やその他の分野における自動化は避けられません。しかし、金融サービスの自動化は、高いレベルの注意、...

AIと自動化革命に備える10の方法

人工知能と自動化はもはやSFの世界の話ではなく、ビジネスの世界と消費者の世界の両方で非常に現実的かつ...

鉄道欠陥検出における機械学習の実用化

【51CTO.com クイック翻訳】はじめに列車が走行しているとき、線路には大きな圧力がかかることが...

...

インテリジェントタイミング、画像認識…AIがあなたの春節旅行をエスコートします!

毎年恒例の春節旅行シーズンがまたやって来ました。チケットは手に入れましたか?休暇を申請しましたか?あ...

自動運転のための不確実性を考慮した動作計画:強化学習ベースのアプローチ

[[429196]] 2021年10月1日にarXivにアップロードされた論文「強化学習を使用した不...

...

...

...

...

...

中間レビュー: 2021 年に最も注目される AI スタートアップ 10 社

[[407377]] 2021年はまだ半分しか経っていませんが、人工知能に注力する人気のスタートアッ...