Alimama は曲率空間学習フレームワークと連合学習ソリューションをオープンソース化し、共通の進歩のために AI 技術を一般に公開します。

Alimama は曲率空間学習フレームワークと連合学習ソリューションをオープンソース化し、共通の進歩のために AI 技術を一般に公開します。

9月15日、Alimamaは、曲率空間学習フレームワークと連合学習ソリューションという2つのAI技術のオープンソースを発表しました。最新の 2 つの技術成果のオープンソース化は、業界のデータプライバシー保護機能の向上に役立ちます。ストレージ消費量が 80% 削減され、ユーザー要求のマッチング精度が 15% 向上すると期待されています。上記の技術は、インターネット業界以外のさまざまな科学研究やコンピューティング分野にも応用できます。

曲率学習フレームワーク(CLF)は、産業グレードのシナリオで検証された中国初の曲率空間ディープラーニングフレームワークであると理解されています。また、Elastic Federated Learning Solution(EFLS)は、数百億の産業シナリオにおける企業間コラボレーションのためのフェデレーテッドラーニングソリューションです。

本日より、世界最大のオープンソースウェブサイトであるGitHubで「Curvature-Learning-Framework」を検索し、9月30日以降は「Elastic-Federated-Learning-Solution」を検索することで、2つのプロジェクトのオープンソースファイルを閲覧できるようになります。

「AI技術は生産性の新世代です。大規模な産業シナリオへの応用が成熟した後、私たちはこれらの技術的能力を社会に開放し、AI技術の利益を最大限に共有し、共に進歩することを選びました」とアリババママのCTO、鄭波氏は述べた。

Curvature 宇宙学習フレームワーク オープンソース: AI が軌道を変更し、Curvature 宇宙船に搭乗

曲率は空間がどの程度曲がっているかを表す尺度です。曲率がゼロに近いほど、空間は平坦になります。 SF小説『三体問題』では、人類は空間の曲率の変化を利用して曲率宇宙船を建造します。

AI に必要な膨大なデータと計算は、多くの場合、曲率ゼロのユークリッド空間に基づいているため、表現能力が制限される可能性があります。 Alimama 技術チームは、曲率空間がグラフデータ構造をより正確にモデル化できることを発見しました。オープンソースの曲率空間学習フレームワークには、多様体、演算子、モデル、リーマン最適化の完全なディープラーニングプロセスが含まれています。ユーザーはモデルを曲率空間に簡単に移行できるため、AI 開発の新たな道が開かれます。

曲率空間でのモデリングは「風船を膨らませる」ようなものだと想像してください。空気が抜けた風船の表面に 10 億個のノードがあると仮定すると、非常に高密度な状態になります。風船が大きくなり膨らむにつれて、その表面はますます「湾曲」し、ノードは離れ、形状はより立体的になり、これらのノードをよりよく観察して区別できるようになります。

曲率空間は膨張した風船の表面のようなもので、同じ大きさのユークリッド空間と比べて、より多くのデータを収容でき、木やリングなどの幾何学的特徴をより包括的かつ正確に表現できます。 Cora のグラフ データに基づく実験では、ユークリッド空間を曲率空間に置き換えることで、モデルの予測精度が約 8% 向上することが示されました。

アリママの技術者は、この技術はアリママのビジネスに大きな応用可能性を示していると語った。 Taobao 検索広告のシナリオに基づいて、曲率空間は数十億の商人とユーザー間のインタラクティブな動作を正確にモデル化し、空間曲率の変化を利用してデータの「方向性増幅」と「正確なセグメンテーション」を実現します。システムが本格的に稼働した後、ストレージ消費量は 80% 削減され、ユーザー側のリクエストマッチングの精度は 15% 向上しました。

この技術は他の業界でも広く利用され、AI導入の新たな波を牽引すると期待されています。業界の専門家によると、曲率空間は地球表面の雲の移動軌跡、航空・航行ルートなどをモデル化できるほか、物流輸送マップ、資源フローマップなども表現できるという。よりタイムリーな天気予報やより正確な地図ナビゲーションから、より効率的な物流や輸送、社会資源のより公平な分配まで、この新しいテクノロジーは人々の生活を効果的に改善することができます。

オープンソースのフェデレーテッドラーニングソリューション:包括的かつすべての人に開かれている

フェデレーテッドラーニングは、2016年にGoogleが提唱したもので、端末のプライバシーを保護しながら機械学習を行うソリューションであり、広告主が企業間や複数端末への配信を実現するのに役立ちます。簡単に言えば、連合学習は、複数の師匠が弟子を一緒に訓練するようなものです。師匠はそれぞれに長所を持っていますが、お互いを警戒し、長所を共有することができません。一方、弟子はそれぞれの長所を吸収して統合し、最終的に学習で成功を収めます。

アリママが今回オープンソース化したフェデレーテッドラーニングソリューションは、プライバシー保護と暗号化コンピューティングを重視し、その上でAPPアイランド間の情報リンクを確立し、機械学習モデルを構築することで、高並列性、暗号化、使いやすさ、製品化の面でより優れたサポートを提供し、超大規模スパースシナリオで複数の当事者が協力してフェデレーテッドラーニングを実践することを容易にするものと理解されている。

具体的には、フェデレーテッド ラーニング ソリューションには次の特徴があります。
1. 大規模な高可用性: クラウドネイティブ実装ソリューションは、数百億のデータ ポイントの交差をサポートします。複数の検証方法により、最終結果の整合性と正確性が保証されます。合理化されたトレーニング相互作用プロトコルと効率的な基盤実装により、分散トレーニングの高スループットが保証されます。洗練された状態回復とモデル検証により、分散災害復旧の正確性が保証されます。
2. プライバシーを保護するための暗号化: データ セキュリティとコンピューティング セキュリティを通じてユーザーのプライバシーを保護し、複数のプライバシー保護スキームをサポートして、セキュリティとパフォーマンスの最適なバランスを実現します。
3. より強力で便利に: 水平集約と階層集約に基づく 2 つのモデルが初めてオープンソース化され、視覚的な Web インターフェイスを通じてタスク プロセスの開発、ペアリング、スケジュール設定、管理が容易になり、反復効率が大幅に向上しました。

Alimama の Unidesk 製品は、フェデレーテッド ラーニング ソリューションを活用し、PROYA、KISS ME、Winona、Huaxizi、Xiuzhen などの多くの企業がブランドとビジネスの両方の成功を達成するのに役立っています。 HuaxiziがUnidesk製品を導入してから、同社の業績は大幅に改善したと聞きました。わずか2か月でブランドROIは15%増加し、売上高も徐々に増加しています。

将来的には金融や医療の共同構築などのシナリオにも拡張でき、高い汎用性を持つ技術となるでしょう。

オープンソースを最後までやり遂げる

このオープンソースの立ち上げは、Alimama の「オープンソースを最後まで実行する」という一貫した実践を継続するものです。 2015年以来、アリママの技術チームは、大規模ディープラーニング、グラフ学習、強化学習など、数多くのAI技術を業務に深く応用し、インターネット広告分野におけるAIの探求と大規模応用をリードし、業界をリードするAIエンジニアリングシステムを数多く開発してきました。

2018 年 11 月、Alimama は、高次元スパース シナリオ向けの業界初の大規模産業グレードのトレーニング エンジンである XDL をオープンソース化し、さらに Deep Interest Network (DIN)、Deep Interest Evolution Network (DIEN)、Deep Tree Matching (TDM) など、いくつかの産業グレードの革新的なアルゴリズムもオープンソース化しました。 GitHub では、XDL プロジェクトはオープンソース化されてから 1 か月以内に 1,000 を超える星の「いいね」を獲得しました。現在までに 4,000 を超える星の「いいね」を獲得し、1,000 回近くコピーされ使用されています。

2019年1月、Alimamaの大規模グラフディープラーニングフレームワーク「Euler」が正式にオープンソース化され、業界で大きな反響を呼び、学術界からも注目を集めました。 2021年4月には、汎用性と柔軟性がさらに向上したEuler 2.0がリリースされました。 GitHub ウェブサイトでは、Euler プロジェクトには現在 2,500 を超えるスターと 500 を超えるコピーがあります。

<<:  遅い二次アルゴリズムと高速なハッシュマップについての簡単な説明

>>:  ビジネス開発における感情AIの重要性

ブログ    
ブログ    

推薦する

...

販売禁止の影で、国産GPGPUがその穴を埋めることはできるのか?

今年初め、ChatGPTはAIアプリケーションの開発を刺激する火花のようなもので、AI業界は開発の急...

...

人工知能はマーケティング業界に破壊的な影響を及ぼすだろう

ビッグデータと人工知能の市場は現在、活況を呈しています。調査会社の最近の予測によると、これら2つの技...

人工知能と宝くじの出会いは実は詐欺から始まった?

現時点で最もホットなコンセプトは何かと聞かれれば、それは人工知能であるに違いないと私は思います。 A...

LoRAShear: LLM プルーニングと知識回復に関する Microsoft の最新研究

LoRAShear は、言語モデリング (LLM) を最適化し、知識を保存するために Microso...

機械学習を使用してデータセンターの電力を管理するにはどうすればよいでしょうか?

[[249391]] [51CTO.com クイック翻訳] データセンターがますます複雑になってい...

1つのコマンドでChatGPTがさらに強力になります

GPT を使用する過程で、AI にニーズをより明確に理解させる方法が重要です。今日は、GPT をあな...

...

[NCTSサミットレビュー] Testin Xu Kun: AIが次世代のテストをリード、iTestinがテストの未来を書き換える

2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...

データサイエンティストが最もよく使用するデータマイニングアルゴリズム10選

[[192829]]図1: データサイエンティストが最もよく使用するアルゴリズムトップ10すべてのア...

2年後、マスクはついに「脳内挿管」というブラックテクノロジーをリリースし、脳コンピューターインターフェースを革新した。

設立から2年を経て、マスク氏の有名な脳コンピューターインターフェース研究会社Neuralinkがつい...

AIバーチャルアシスタント:私たちはオペレーターの新たなお気に入りです

人工知能が将来のビジネスやデジタル変革の鍵となる可能性が高いことをさまざまな分野の人々が一般的に認識...

ルールベースのAIと機械学習の主な違いは、さまざまな業界の企業が検討し、実装している点です。

さまざまな業界の企業が、ビッグデータからロボット工学まで、ビジネスプロセスの自動化、顧客体験の向上、...

英国のAIスタートアップFacultyが4250万ドルのシリーズA資金調達を完了

5月25日、英国の人工知能企業Facultyは、Apax Digital Fund(ADF)が主導す...