テンセントは、分散ベクトル化統計分析と因果推論に使用できるデータコンポーネントであるFast-Causal-Inferenceをオープンソース化しました。

テンセントは、分散ベクトル化統計分析と因果推論に使用できるデータコンポーネントであるFast-Causal-Inferenceをオープンソース化しました。

テンセントは9月18日、同社の公式アカウント「Tencent Open Source」において、オープンソースの分散型データサイエンスコンポーネントプロジェクト「Fast-Causal-Inference」がGitHubで公開されたと発表した。

▲画像出典:テンセントオープンソース公式アカウント

これは、テンセントWeChatが開発した、SQLインタラクションを利用した分散ベクトル化に基づく統計分析および因果推論コンピューティングライブラリであると報告されています。 「ビッグデータ下での既存の統計モデルライブラリ(R / Python)のパフォーマンスボトルネックを解決し、数百億のデータを数秒で実行できる因果推論機能を提供し、SQL言語を通じて統計モデルの使用の敷居を下げ、実稼働環境での使用を容易にします。WeChatビデオアカウントやWeChat検索など、複数のWeChat社内ビジネスに適用されています。」

公式紹介:

膨大なデータから数秒で因果推論機能を提供

ベクトル化された OLAP 実行エンジン ClickHouse/StarRocks に基づいて、速度は究極のユーザー エクスペリエンスにさらに役立ちます。


シンプルなSQLの使用

SQLGateway WebServer は、SQL 言語を介して統計モデルを使用するハードルを下げ、エンジン関連の SQL 拡張と最適化を透過的に実行しながら、上位層で SQL を使用する非常に簡単な方法を提供します。

基本演算子と高階演算子の因果推論機能と、上位レベルのアプリケーションカプセル化を提供します。

ttest、OLS、Lasso、ツリーベースモデル、マッチング、ブートストラップ、DML などをサポートします。

IT Homeは、最初のバージョンではすでに以下の機能がサポートされていると担当者が述べたことも知りました。

基本的な因果推論ツール

  • デルタ法に基づくt検定、CUPEDをサポート
  • OLS、数十億行のデータ、1秒未満

高度な因果推論ツール

  • IV、OLSに基づくWLS、その他のGLS、DID、合成制御、CUPED、仲介がインキュベートされている
  • Uplift: 数千万のデータポイントを数分で計算
  • 明示的な解法なしに分散推定の問題を解決するためのブートストラップ/順列などのデータシミュレーションフレームワーク

参照する

  • オープンソースの発表 | Tencent 分散データサイエンス コンポーネント
  • Tencent/高速因果推論 — GitHub

<<:  スマートシティで人工知能の可能性を最大限に引き出すにはどうすればよいでしょうか?

>>:  AIを活用して、ナスダックは金融業界向けのSaaSプロバイダーに変革したいと考えている

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

「科学的シミュラクル」:人工知能とハイパーリアリティの衝突

人工知能(AI)技術の進歩は、現実と表現が区別できなくなるジャン・ボードリヤールのハイパーリアリティ...

都市と市民がスマートシティ技術から得られる恩恵

テクノロジーは非常に効率的かつ完璧なので、私たちはそれに気付くことすらありません。しかし、通勤時間が...

任意のデータセットに基づいて LLM (大規模言語モデル) ロボットを作成する

今日、偶然Embedchainというウェアハウスを見つけ、とても便利だと思ったので、皆さんとシェアし...

2020年の人工知能における最大のイノベーション

2020 年は例年とは異なる年となり、コミュニティ全体が数多くの課題に直面しました。しかし、2020...

DeepMindらが優秀論文賞を受賞、IBMスーパーコンピュータDeep Blueが古典に、IJCAI2023の賞が発表

国際人工知能合同会議(IJCAI)は、AI分野におけるトップクラスの学術会議の一つです。第1回会議は...

通信業界は最大のAI市場となり、2021年に重要な転換点を迎える

Informa傘下の世界的に有名な市場調査会社Tractica/Ovumは、30の分野で約300件の...

人工知能と教育の統合が高等教育改革を促進

[[434341]]我が国の長期的な発展と人材戦略により、質の高い人材に対する需要が急速に高まってい...

...

問題が VPN の問題であることを証明するにはどうすればよいですか?コンピュータ科学者は簡単な方法を発見した

P/NP 問題は、計算複雑性の分野における未解決の問題です。人々は、「すべての計算問題を妥当な時間内...

AIが生成した小説が静かに人気を集めている。人間ならではの創造性がAIにコピーされてしまったのだろうか?

[[408920]]編集部注:人工知能(AI)の発達により、人々は徐々に未来についてより多様な想像...

...

データとAIが現代の人事慣行をどのように変えているのか

今日の人事チームにはバランスを取ることが求められています。一方では、データと AI の力を活用してビ...

...