Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Llama2 はオープンソースであり、無料の商用利用をサポートしているため、オープンソースの大規模モデルに対する業界の強い注目を集めています。 7 月 25 日、Alibaba Cloud は中国で先陣を切って、Llama2 の全バージョンを対象としたトレーニングおよび展開ソリューションを開始しました。Alibaba Cloud では、すべての開発者が Alibaba Cloud 上で独自の大規模モデルを構築することを歓迎します。

最近、Llama2 大規模言語モデルがオープンソース化され、70 億、130 億、700 億のパラメータを持つバージョンをカバーすることが発表されました。 Llama2 は、月間アクティブ ユーザー数が 7 億人未満の研究シナリオおよび商用シナリオで無料で使用でき、企業や開発者に大規模モデル研究のための新しいツールを提供します。しかし、特にパフォーマンスが優れた大規模バージョンの Llama2 を再トレーニングして展開するには、依然として高い障壁が存在します。

開発者を支援するために、アリババクラウドの機械学習プラットフォームPAIは、中国で初めてLlama2シリーズのモデルを深く適応させ、軽量の微調整、完全なパラメータの微調整、推論サービスなどのシナリオ向けのベストプラクティスソリューションを立ち上げ、開発者がLlama2に基づいて迅速に再トレーニングし、独自の大規模モデルを構築できるように支援しました。

Alibaba Cloud が立ち上げた AI モデル コミュニティである ModelScope が、Llama2シリーズ モデルを初めてリリースしました。開発者は、MoDa コミュニティの Llama2 モデル ページで「ノートブック クイック開発」をクリックすると、Alibaba Cloud 機械学習プラットフォーム PAI をワンクリックで起動し、クラウド上でモデルを開発して展開できます。他のプラットフォームからダウンロードした Llama2 モデルも、Alibaba Cloud PAI を使用して開発できます。

特別なシナリオ要件を満たすために、開発者は多くの場合、微調整トレーニング方法を使用してモデルを「調整」し、特定の分野の専門的な能力と知識を獲得する必要があります。現時点では、PAI は開発者がクラウド上で軽量の Lora 微調整やより詳細なフルパラメータの微調整を実行できるようにサポートしています。モデルの微調整が完了したら、PAI は開発者が Web UI と API を通じて Llama2 を展開できるようにサポートし、モデルが Web ページまたは組み込みアプリケーションを通じてユーザーと対話できるようにします。

Llama2のローカルスタンドアロントレーニングと比較して、超大規模モデルの詳細な開発はAlibaba Cloud上で完了できます。プリセット環境はメンテナンスフリーで操作が簡単です。同時に、開発者は豊富なAIコンピューティングリソースと極めて高い弾力性を得ることができます。ローカルのシングルカード GPU では、Llama2 の 70 億パラメータ バージョンの軽量 Lora 微調整と推論しか実行できません。より大きなバージョンやより深いトレーニングをサポートするのは困難です。 Alibaba Cloud では、PAI Lingjun Intelligent Computing サービスが提供する分散コンピューティング機能により、Llama2 のフルサイズ バージョンの軽量かつ完全なパラメータの微調整が可能になり、効率的な展開と推論が可能になります。

Alibaba Cloud は、世界トップ 3 のクラウド ベンダーの 1 つであり、アジア最大のクラウド ベンダーとして、中国の AI ブームの重要なリーダーおよびサービス プロバイダーであり、完全な IaaS + PaaS + MaaS 統合 AI サービスを構築しています。インフラレベルでは、アリババクラウドは中国最強のインテリジェントコンピューティングパワーの備蓄を保有しています。Lingjun Intelligent Computing Clusterは、最大10万枚のGPUカードの拡張性を備え、数兆個のパラメータを持つ複数の大規模モデルの同時オンライントレーニングをサポートできます。AIプラットフォームレベルでは、アリババクラウドの機械学習プラットフォームPAIが、AI開発プロセス全体にエンジニアリング機能を提供します。PAI Lingjun Intelligent Computingサービスは、Tongyi Qianwenなどの超大規模モデルのトレーニングとアプリケーションをサポートしており、大規模モデルのトレーニングパフォーマンスを約10倍向上させ、推論効率を37%向上させることができます。モデルサービスレベルでは、アリババクラウドは中国で最も活発なAIモデルコミュニティであるMoDaを構築し、企業がTongyi Qianwenまたはサードパーティの大規模モデルに基づいて再トレーニングすることをサポートしています。

アリババクラウドは今年7月初旬、中国のビッグモデルエコシステムの繁栄を促進することを主な目標とし、ビッグモデルスタートアップにモデルのトレーニング、推論、展開、微調整、評価、製品化などを含む一連のサービスを提供し、資金と商業化の面で全面的なサポートを提供すると発表しました。

<<:  AIはイノベーションを通じて気候への影響を補うことができるでしょうか?

>>:  国内外のオープンソースモデルを競うLlama-2の初の総合評価

ブログ    

推薦する

...

機械学習の次元削減手法で「次元の呪い」を打破する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

感動して泣きました。ロボットはついに自分で服をたたむことを覚えました。

人間の子どもの最も基本的な運動知能、例えばつかむ、持ち上げる、あるいはキルトや衣服をたたむといった家...

AES暗号化アルゴリズムのハードウェア設計方法の簡単な分析

[[356976]]情報セキュリティの分野では、米国は集積回路IPコアの分野で常に独占的地位を占めて...

...

2021 年に注目すべき 3 つのデータ分析と AI のトレンド

組織が新型コロナウイルス感染症のパンデミックを乗り越えていく中で、データ分析と AI の ROI を...

EllieMae が脅威ハンティングに AI を活用する方法

より積極的な基盤を構築するために、一部の組織では、攻撃が発生する前にデータを精査して高度な持続的脅威...

Sparkに代わると期待されるリアルタイム機械学習フレームワークRay

新しいプロジェクトは、Python で記述された機械学習アプリケーションをサポートするために使用でき...

企業セキュリティのための AI 生体認証

生体認証技術は、市場に登場した最新の AI イノベーションのおかげで、特に 2021 年には長年にわ...

...

マイクロソフトのAI画像ジェネレーターが自社の従業員から報告:有害な画像を生成する可能性がある

CNBCによると、3月7日、マイクロソフトのエンジニアが米連邦取引委員会(FTC)に、同社の人工知能...

ChatGPTが使用する機械学習技術

著者 |ブライト・リャオ「プログラマーから見たChatGPT」の記事では、開発者のChatGPTに対...

教育省は小中学校の人工知能教育拠点のリストを発表し、北京洪志中学校を含む184校が選ばれた。

教育部基礎教育司は1月11日、「教育部弁公庁による小中学校向け人工知能教育拠点の推薦に関する通知」(...

Python 自然言語処理 (NLP) を使用して要約を作成する方法

たくさんのレポートを読まなければならないときに、それぞれのレポートを簡単に要約したいという状況に遭遇...

...