テンセントは、分散ベクトル化統計分析と因果推論に使用できるデータコンポーネントであるFast-Causal-Inferenceをオープンソース化しました。

テンセントは、分散ベクトル化統計分析と因果推論に使用できるデータコンポーネントであるFast-Causal-Inferenceをオープンソース化しました。

テンセントは9月18日、同社の公式アカウント「Tencent Open Source」において、オープンソースの分散型データサイエンスコンポーネントプロジェクト「Fast-Causal-Inference」がGitHubで公開されたと発表した。

▲画像出典:テンセントオープンソース公式アカウント

これは、テンセントWeChatが開発した、SQLインタラクションを利用した分散ベクトル化に基づく統計分析および因果推論コンピューティングライブラリであると報告されています。 「ビッグデータ下での既存の統計モデルライブラリ(R / Python)のパフォーマンスボトルネックを解決し、数百億のデータを数秒で実行できる因果推論機能を提供し、SQL言語を通じて統計モデルの使用の敷居を下げ、実稼働環境での使用を容易にします。WeChatビデオアカウントやWeChat検索など、複数のWeChat社内ビジネスに適用されています。」

公式紹介:

膨大なデータから数秒で因果推論機能を提供

ベクトル化された OLAP 実行エンジン ClickHouse/StarRocks に基づいて、速度は究極のユーザー エクスペリエンスにさらに役立ちます。


シンプルなSQLの使用

SQLGateway WebServer は、SQL 言語を介して統計モデルを使用するハードルを下げ、エンジン関連の SQL 拡張と最適化を透過的に実行しながら、上位層で SQL を使用する非常に簡単な方法を提供します。

基本演算子と高階演算子の因果推論機能と、上位レベルのアプリケーションカプセル化を提供します。

ttest、OLS、Lasso、ツリーベースモデル、マッチング、ブートストラップ、DML などをサポートします。

IT Homeは、最初のバージョンではすでに以下の機能がサポートされていると担当者が述べたことも知りました。

基本的な因果推論ツール

  • デルタ法に基づくt検定、CUPEDをサポート
  • OLS、数十億行のデータ、1秒未満

高度な因果推論ツール

  • IV、OLSに基づくWLS、その他のGLS、DID、合成制御、CUPED、仲介がインキュベートされている
  • Uplift: 数千万のデータポイントを数分で計算
  • 明示的な解法なしに分散推定の問題を解決するためのブートストラップ/順列などのデータシミュレーションフレームワーク

参照する

  • オープンソースの発表 | Tencent 分散データサイエンス コンポーネント
  • Tencent/高速因果推論 — GitHub

<<:  スマートシティで人工知能の可能性を最大限に引き出すにはどうすればよいでしょうか?

>>:  AIを活用して、ナスダックは金融業界向けのSaaSプロバイダーに変革したいと考えている

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ボストン・ダイナミクスの大きな黄色い犬が石油会社に加わる! 「決して疲れない」と主張する

[[314711]]ボストン・ダイナミクス社が開発したスポットは、ノルウェーの石油会社アーケル社で独...

2023年版CV初心者ガイドの概要

コンピューター ビジョンは、驚くほど急速に発展している分野です。本質的には、コンピューターに人間と同...

...

ハイパーオートメーション: 次世代のサイバーセキュリティソリューション

[[421224]]ハイパーオートメーションがネットワークとデータ セキュリティに与えるプラスの影響...

人工知能はどこにでもありますが、計画とコーディングは始めましたか?

人々は「ソフトウェア 2.0」の時代に入りつつあります。人工知能、ディープラーニング、機械学習、高度...

...

...

...

初心者必読!畳み込みニューラルネットワークの始め方

畳み込みニューラル ネットワークは、ディープ ニューラル ネットワークの中で非常に人気のあるネットワ...

GPT-4 は AGI のきっかけとなるだけでしょうか? LLMは最終的に廃止され、世界モデルが未来となる

人間の認知においては、汎用人工知能(AGI)を人工知能の究極の形、およびその開発の究極の目標として設...

オバマが強制的に「白人化」された後、AIは芸術作品における人種的偏見というタブーを犯した

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

毎日のアルゴリズム: 文字の繰り返しのない最長の部分文字列

[[421075]]この記事はWeChatの公開アカウント「3分でフロントエンドを学ぶ」から転載した...

トラック輸送業界がIoTとAIを活用する方法

トラック輸送業界とそれを支える物流は、国内外のサプライチェーンの成功の基盤となっています。こうしたサ...

生体認証ウェアラブルでCOVID-19の発生を予測できると研究で判明

米国の研究チームは最近、ウェアラブルデバイスから得られる生体認証データを分析することで、一見健康そう...

人工知能のビジネス価値を最大限に引き出すための10の重要な役割

あらゆる業界でますます多くの企業が、ビジネス プロセスを変革するために AI を導入しています。しか...