「順序付きファネル」アルゴリズム問題は、iResearch A10サミットで新たなブレークスルーを達成すると期待されています。

「順序付きファネル」アルゴリズム問題は、iResearch A10サミットで新たなブレークスルーを達成すると期待されています。

新小売、新金融、新エンターテインメントなどの新しい業態の台頭により、ビッグデータの驚異的な力がインターネット生活のあらゆる側面に浸透し、ビッグデータに基づくモバイルアプリケーションが世界を変えています。技術レベルで「ファネル」のアップグレードをどのように実現し、ビッグデータの豊富なエネルギーを最大限発揮させるかは、現在のデータ応用分野における重要な課題です。

インターネットの後半に入り、モバイル アプリケーションの主な戦場は、新規ユーザーの獲得から既存ユーザーの運用へと移行しました。ユーザーの維持とアクティビティの向上が製品運用の中核となっています。ユーザーがモバイル アプリケーションを使用するとき、パスを通じて目的を達成します。たとえば、ユーザーのオンラインショッピングの行動は、「商品を閲覧する → ショッピングカートに追加する → 注文を生成する → 注文を支払う → 支払いを完了する」という経路と考えることができます。パスの各ノードではユーザー損失の度合いが異なり、層ごとに減少して、全体として漏斗型のモデルを形成します。クリティカル パスを計算する方法として、一般的に受け入れられている方法には、順序なしファネルと順序付きファネルの 2 つがあります。

順序なしファネルでは、前のイベントと後続のイベントの発生を任意に配置できます。たとえば、ユーザーは、ステップ間の論理的な順序に制約されることなく、自由にページを切り替えたり、ホームページに戻ったりできます。順序付きファネルの各ステップ間には厳密な順序制限があり、2 番目のステップのイベントは最初のステップの後に発生する必要があります。支払い処理中は、対応する支払い操作を入力する前に、購入する商品を選択する必要があります。順序付きファネルは、ショッピングの支払いや情報の登録など、厳格な論理階層要件を持つパス動作に広く存在します。ユーザーパスの重複率が極めて低い無秩序なファネルと比較すると、順序付けられたファネルのデータ調査はより価値があります。

「ファネル」モデルの計算の中核は、分解と定量化です。大量かつ複雑なユーザー データに直面すると、「順序付けられたファネル」は論理的な制約により計算プロセスでさらに大きな課題に直面します。大量のデータをバッチ処理する場合、複雑なデータをリアルタイムで処理する効率を確保することは困難です。 「ファネル」をアップグレードする際の技術的な難しさは、計算速度にあります。

一部のインターネット企業はビッグデータ分析ツールの研究開発に力を入れており、技術的なレベルから「オーダードファネル」の計算効率を飛躍的に向上させることを期待しているが、重要な成果はほとんど発表されていない。その理由は、第一に、テスト対象として十分な規模のデータを見つけることが困難であり、第二に、強力な技術的サポートが不足していることです。

[[206016]]

「2017 Analysys OLAP アルゴリズム コンペティション」では、「オーダード ファンネル」の計算効率の技術的なボトルネックに共同で取り組みます。 Analysysは、Analysys WanxiangやAnalysys Qianfanなどの成熟したデータ製品をすでに所有している業界リーダーとして、データの専門家に協力してアルゴリズムの専門家を募集し、「オーダードファネル」の技術的な困難を突破するよう要求を公表しました。

主催者から聞いたところ、この iResearch OLAP アルゴリズム コンペティションに参加するためのルールは次の通りです。主催者が提供するアプリケーション変換と OLAP シナリオに基づいて、参加者はまずテスト データ セットを使用して指定されたテスト クラスターで実行し、テスト結果を提示します。最後に実際のテスト データを使用して、テスト クラスターで全体のデータを実行し、時間ランキングを提示します。

技術的なレベルでは、競争の選択に使用される OLAP ファンネル シナリオには、大量のデータに対するリアルタイムの多次元の秩序ある分析モデルが必要です。データ処理では、データのスライスと前処理、列の保存、圧縮、辞書、インデックスを、細部における巧妙な推論と組み合わせて使用​​することで、計算の量と複雑さを軽減し、特定の次元のデータを正確に観察することができます。また、ドリルダウンなどの操作を通じてデータの粒度を高め、より豊富なデータの詳細を取得し、データ分析を効率的かつ詳細で価値のあるものにすることもできます。

データレベルでは、2017年第3四半期時点で、iResearchは現在、1日あたり261億のデータ項目を処理し、297分野から合計21億9000万台のスマート端末をカバーし、251万以上のモバイルアプリケーションを監視しており、データストレージ容量は5.8PBです。このコンテストは、iResearch の数十億人の膨大なデータベースを活用しており、コンテストの結果はより信頼性が高く、より実用的なものとなっています。

このコンテストのクラウドコンピューティングサービスは、UCloud によって提供されています。コンテストは現在正式に競技段階に入っており、ビジネスグループとオープンソースグループにそれぞれ約 40 チームと個人が参加する予定です。このビジネス グループには、Migu Music、Beijing Lejian Technology、Nanjing Fanruan Software、Hangzhou Daisu Technology、Beijing Runqian Information、Kyligence、AggreData、Gbase などの企業から強力な技術チームが参加しました。このオープンソース グループには、Xiaomi、Meituan、Reyun Data、Yuansu Data、LinkDoc、hulu、LeXiang Tianxia、Niuban Technology、上海瑞民、北京交通大学のデータ専門家が含まれています。

10月27日、北京でiResearch A10ビッグデータアプリケーションサミットが盛大に開幕します。その際に、このOLAPアルゴリズムコンテストの優勝チームが決定され、コンテストの優秀事例もサミットで展示されます。データ専門家の指導と国内専門家の共同の努力により、「オーダードファネル」の計算効率という難題は大きな突破口となるかもしれない。


<<:  従来のセキュリティ手法を覆し、AIがWebセキュリティを再定義

>>:  クラウドコンピューティングはすべての人に利益をもたらす技術です。アリババクラウドは製造業と密接に連携し、「中国のスマート製造」を推進します。

ブログ    

推薦する

未来の都市: スマートテクノロジーが持続可能な革命をリードする方法

最近の急速な技術発展により、真のスマートシティの時代が近づいてきました。人工知能、クラウドおよびエッ...

...

人工知能がリスク管理分野に参入すると、生身の人間は職を失うことになるのでしょうか?

スティーブ・ジョブズの「電話の再発明」は携帯電話を再定義しただけでなく、世界を変え、人類をモバイルイ...

量子コンピューティングの画期的な論文3本がネイチャーの表紙に登場:忠実度は99%を超え、実用レベルに到達

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

非常に厳しい CPU 制約下でも正常に動作しますか? Java におけるさまざまな圧縮アルゴリズムのパフォーマンス比較

この記事では、一般的に使用されているいくつかの圧縮アルゴリズムのパフォーマンスを比較します。結果は、...

...

速報です!画像AI企業「Huiyi Huiying」がハッキングされ、COVID-19研究成果が公開された

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

ニューロンクラスタリングはAIの学習戦略をシミュレートできる

人間や機械がタスクをよりうまく実行できるようになるたびに、証拠の痕跡が残ります。パフォーマンス向上の...

コンピュータービジョンとは何ですか?

映画『マトリックス リザレクション』(2021年)では、主人公のネオがコンピューター生成の世界「マト...

トップ 10 の AI フレームワークとリポジトリのレビュー、その長所と短所の分析

[51CTO.com クイック翻訳] 人工知能は決して新しいものではありませんが、科学の分野では古く...

...

適切なバランスを見つける: 人間と機械の知能を統合する

今日の急速に変化するデジタル環境において、顧客は独自のニーズや要望を満たす優れたサービスをますます期...

世界最強のモデル クロード3号が物理・化学を覆す!博士課程の1年間の実験の結果が2時間で解読され、ネットユーザーは「科学的研究はもう存在しない」と叫んだ。

クロード3号は今も奇跡を起こし続けています。公開からわずか数日後、ますます多くの博士号取得者が、未発...

データ拡張のための 10 個の Python ライブラリ

データ拡張は、人工知能と機械学習の分野における重要な技術です。モデルのパフォーマンスと一般化を向上さ...