Alimama は曲率空間学習フレームワークと連合学習ソリューションをオープンソース化し、共通の進歩のために AI 技術を一般に公開します。

Alimama は曲率空間学習フレームワークと連合学習ソリューションをオープンソース化し、共通の進歩のために AI 技術を一般に公開します。

9月15日、Alimamaは、曲率空間学習フレームワークと連合学習ソリューションという2つのAI技術のオープンソースを発表しました。最新の 2 つの技術成果のオープンソース化は、業界のデータプライバシー保護機能の向上に役立ちます。ストレージ消費量が 80% 削減され、ユーザー要求のマッチング精度が 15% 向上すると期待されています。上記の技術は、インターネット業界以外のさまざまな科学研究やコンピューティング分野にも応用できます。

曲率学習フレームワーク(CLF)は、産業グレードのシナリオで検証された中国初の曲率空間ディープラーニングフレームワークであると理解されています。また、Elastic Federated Learning Solution(EFLS)は、数百億の産業シナリオにおける企業間コラボレーションのためのフェデレーテッドラーニングソリューションです。

本日より、世界最大のオープンソースウェブサイトであるGitHubで「Curvature-Learning-Framework」を検索し、9月30日以降は「Elastic-Federated-Learning-Solution」を検索することで、2つのプロジェクトのオープンソースファイルを閲覧できるようになります。

「AI技術は生産性の新世代です。大規模な産業シナリオへの応用が成熟した後、私たちはこれらの技術的能力を社会に開放し、AI技術の利益を最大限に共有し、共に進歩することを選びました」とアリババママのCTO、鄭波氏は述べた。

Curvature 宇宙学習フレームワーク オープンソース: AI が軌道を変更し、Curvature 宇宙船に搭乗

曲率は空間がどの程度曲がっているかを表す尺度です。曲率がゼロに近いほど、空間は平坦になります。 SF小説『三体問題』では、人類は空間の曲率の変化を利用して曲率宇宙船を建造します。

AI に必要な膨大なデータと計算は、多くの場合、曲率ゼロのユークリッド空間に基づいているため、表現能力が制限される可能性があります。 Alimama 技術チームは、曲率空間がグラフデータ構造をより正確にモデル化できることを発見しました。オープンソースの曲率空間学習フレームワークには、多様体、演算子、モデル、リーマン最適化の完全なディープラーニングプロセスが含まれています。ユーザーはモデルを曲率空間に簡単に移行できるため、AI 開発の新たな道が開かれます。

曲率空間でのモデリングは「風船を膨らませる」ようなものだと想像してください。空気が抜けた風船の表面に 10 億個のノードがあると仮定すると、非常に高密度な状態になります。風船が大きくなり膨らむにつれて、その表面はますます「湾曲」し、ノードは離れ、形状はより立体的になり、これらのノードをよりよく観察して区別できるようになります。

曲率空間は膨張した風船の表面のようなもので、同じ大きさのユークリッド空間と比べて、より多くのデータを収容でき、木やリングなどの幾何学的特徴をより包括的かつ正確に表現できます。 Cora のグラフ データに基づく実験では、ユークリッド空間を曲率空間に置き換えることで、モデルの予測精度が約 8% 向上することが示されました。

アリママの技術者は、この技術はアリママのビジネスに大きな応用可能性を示していると語った。 Taobao 検索広告のシナリオに基づいて、曲率空間は数十億の商人とユーザー間のインタラクティブな動作を正確にモデル化し、空間曲率の変化を利用してデータの「方向性増幅」と「正確なセグメンテーション」を実現します。システムが本格的に稼働した後、ストレージ消費量は 80% 削減され、ユーザー側のリクエストマッチングの精度は 15% 向上しました。

この技術は他の業界でも広く利用され、AI導入の新たな波を牽引すると期待されています。業界の専門家によると、曲率空間は地球表面の雲の移動軌跡、航空・航行ルートなどをモデル化できるほか、物流輸送マップ、資源フローマップなども表現できるという。よりタイムリーな天気予報やより正確な地図ナビゲーションから、より効率的な物流や輸送、社会資源のより公平な分配まで、この新しいテクノロジーは人々の生活を効果的に改善することができます。

オープンソースのフェデレーテッドラーニングソリューション:包括的かつすべての人に開かれている

フェデレーテッドラーニングは、2016年にGoogleが提唱したもので、端末のプライバシーを保護しながら機械学習を行うソリューションであり、広告主が企業間や複数端末への配信を実現するのに役立ちます。簡単に言えば、連合学習は、複数の師匠が弟子を一緒に訓練するようなものです。師匠はそれぞれに長所を持っていますが、お互いを警戒し、長所を共有することができません。一方、弟子はそれぞれの長所を吸収して統合し、最終的に学習で成功を収めます。

アリママが今回オープンソース化したフェデレーテッドラーニングソリューションは、プライバシー保護と暗号化コンピューティングを重視し、その上でAPPアイランド間の情報リンクを確立し、機械学習モデルを構築することで、高並列性、暗号化、使いやすさ、製品化の面でより優れたサポートを提供し、超大規模スパースシナリオで複数の当事者が協力してフェデレーテッドラーニングを実践することを容易にするものと理解されている。

具体的には、フェデレーテッド ラーニング ソリューションには次の特徴があります。
1. 大規模な高可用性: クラウドネイティブ実装ソリューションは、数百億のデータ ポイントの交差をサポートします。複数の検証方法により、最終結果の整合性と正確性が保証されます。合理化されたトレーニング相互作用プロトコルと効率的な基盤実装により、分散トレーニングの高スループットが保証されます。洗練された状態回復とモデル検証により、分散災害復旧の正確性が保証されます。
2. プライバシーを保護するための暗号化: データ セキュリティとコンピューティング セキュリティを通じてユーザーのプライバシーを保護し、複数のプライバシー保護スキームをサポートして、セキュリティとパフォーマンスの最適なバランスを実現します。
3. より強力で便利に: 水平集約と階層集約に基づく 2 つのモデルが初めてオープンソース化され、視覚的な Web インターフェイスを通じてタスク プロセスの開発、ペアリング、スケジュール設定、管理が容易になり、反復効率が大幅に向上しました。

Alimama の Unidesk 製品は、フェデレーテッド ラーニング ソリューションを活用し、PROYA、KISS ME、Winona、Huaxizi、Xiuzhen などの多くの企業がブランドとビジネスの両方の成功を達成するのに役立っています。 HuaxiziがUnidesk製品を導入してから、同社の業績は大幅に改善したと聞きました。わずか2か月でブランドROIは15%増加し、売上高も徐々に増加しています。

将来的には金融や医療の共同構築などのシナリオにも拡張でき、高い汎用性を持つ技術となるでしょう。

オープンソースを最後までやり遂げる

このオープンソースの立ち上げは、Alimama の「オープンソースを最後まで実行する」という一貫した実践を継続するものです。 2015年以来、アリママの技術チームは、大規模ディープラーニング、グラフ学習、強化学習など、数多くのAI技術を業務に深く応用し、インターネット広告分野におけるAIの探求と大規模応用をリードし、業界をリードするAIエンジニアリングシステムを数多く開発してきました。

2018 年 11 月、Alimama は、高次元スパース シナリオ向けの業界初の大規模産業グレードのトレーニング エンジンである XDL をオープンソース化し、さらに Deep Interest Network (DIN)、Deep Interest Evolution Network (DIEN)、Deep Tree Matching (TDM) など、いくつかの産業グレードの革新的なアルゴリズムもオープンソース化しました。 GitHub では、XDL プロジェクトはオープンソース化されてから 1 か月以内に 1,000 を超える星の「いいね」を獲得しました。現在までに 4,000 を超える星の「いいね」を獲得し、1,000 回近くコピーされ使用されています。

2019年1月、Alimamaの大規模グラフディープラーニングフレームワーク「Euler」が正式にオープンソース化され、業界で大きな反響を呼び、学術界からも注目を集めました。 2021年4月には、汎用性と柔軟性がさらに向上したEuler 2.0がリリースされました。 GitHub ウェブサイトでは、Euler プロジェクトには現在 2,500 を超えるスターと 500 を超えるコピーがあります。

<<:  遅い二次アルゴリズムと高速なハッシュマップについての簡単な説明

>>:  ビジネス開発における感情AIの重要性

推薦する

Huyaは人間とシーンの分離技術を使用して、顔を覆わずにスマートな弾丸スクリーンを作成します

【元記事は51CTO.comより】 「(段)幕」という言葉はシューティングゲームから生まれたもので、...

スマートホームからのプライバシー漏洩が心配ですか?エッジAIがあなたを助けてくれることを恐れないでください

アレクサ、私の話を盗み聞きしてるの? [[330887]]私はいつもAmazon Echoにこの質問...

...

...

Ctrip カスタマー サービス ロボット ASR エンジンの負荷分散の実践

著者についてCtrip の技術専門家である Yu Xiu 氏は、電話の音声およびビデオ通信やインテリ...

AIは大学入試で高得点のエッセイを書けるようになったが、小説を書くにはまだ遠い

イベントレビュー大学入試中国語テストが終了してすぐに、大学入試作エッセイのテーマが話題になりました。...

ロボット市場は飛躍の準備ができており、人間と機械の統合が主流のトレンドとなっている

最近、2021年世界ロボット大会が北京で盛大に開幕しました。ロボット分野の最先端技術と最新の成果が展...

マイクロソフトの英語音声評価機能がアメリカ英語一般版で開始され、教育業界に力を与える

発音は言語学習の重要な部分です。 Microsoft Azure Cognitive Service...

...

中国、米国、欧州における人工知能開発の現状の比較分析

1. 背景と比較方法[[393581]]人工知能は、経済、安全保障、社会の発展を促進する基礎技術です...

スタンフォード大学がトランプ政権のCTOと会談: AI、移民、技術インフラなどについて

[[282007]] ▲写真:スタンフォード大学のアイリーン・ドナホー氏(左)が、米国政府の最高技術...

OpenAI: GPT-5が危険すぎる場合、理事会はアルトマンの釈放を阻止する権利がある

OpenAIは新たな発表を行った。取締役会はアルトマン氏の決定を拒否する権限を持つようになった。特に...

機械学習の7つの大罪

機械学習実験の信頼性を損なう7つのよくある間違い[[328516]]機械学習は私たちの世界を変える素...

Google Cloud Next: カンファレンス全体を通じて人工知能について語る

最近、Google は年次カンファレンス Google Cloud Next を開催しましたが、オー...

同社はコストバランスに苦戦しており、AI部門で猛烈な採用を行い、他の部門では人員削減を行っている。

業界の専門家は、テクノロジー企業がAIへの投資を優先し、採用を急ぐため、他の分野での人員削減は202...