AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

【51CTO.com クイック翻訳】

Amazon Web Services (AWS) は、クラウドベースの機械学習プラットフォーム SageMaker の 9 つの主要な新しいアップデートを発表しました。

SageMaker は、ほぼあらゆるユースケースで ML モデルを構築、トレーニング、デプロイするために使用できる機械学習サービスを提供することを目的としています。

今年の re:Invent カンファレンスで、AWS は SageMaker の機能をさらに進化させるためのいくつかの発表を行いました。

AWS の Amazon Machine Learning 担当副社長である Swami Sivasubramanian 氏は次のように述べています。

「何千人もの開発者やデータサイエンティストが、すでに業界をリードする機械学習サービスであるAmazon SageMakerを使用して、カスタム機械学習モデルの構築、トレーニング、展開の障壁を取り除いています。SageMakerのような広く採用されているサービスがあれば、

このプロジェクトの最も優れた点の 1 つは、次の成果物の開発を推進するクライアントからの提案が多数得られることです。

本日、Amazon SageMaker 向けのツールセットを発表しました。これにより、開発者はエンドツーエンドの機械学習パイプラインを簡単に構築でき、カスタム機械学習モデルを準備、構築、トレーニング、説明、検査、監視、デバッグ、実行し、より優れたパフォーマンスを実現できます。

大規模な可視性、説明可能性、自動化。 ”

最初の発表は、機械学習用にデータを自動的に準備するように設計された機能である Data Wrangler です。

Data Wrangler を使用すると、顧客はさまざまなデータ ストアから必要なデータを選択し、ワンクリックでインポートできます。 300 を超える組み込みデータ コンバーターが含まれており、コードを記述せずに関数を標準化、変換、結合できます。

デロイトの AI エコシステムおよびプラットフォーム リーダーシップの責任者であるフランク ファラル氏は、次のようにコメントしています。

「SageMaker Data Wrangler は、新製品を市場に投入するために必要な機械学習データ準備プロセスを加速する豊富な変換ツールセットを備えており、データ準備のニーズに先駆けて対応できます。

その結果、当社のクライアントは、当社が迅速に展開を拡大できることから恩恵を受け、数か月ではなく数日でクライアントのニーズに応えて測定可能で持続可能な結果を​​提供できるようになります。 ”

2 番目の発表は、Feature Store です。 Amazon SageMaker Feature Store は、トレーニングと推論のための機械学習機能を簡単に保存、更新、取得、共有できる新しいリポジトリを提供します。

Feature Store は、複数のモデルにマップされる機能を保存するという問題を克服するために設計されています。専用の関数ライブラリにより、開発者は関数にアクセスして共有することができ、開発者チームとデータ サイエンティスト間で関数セットの命名、整理、検索、共有が容易になります。それは

AWS は、ML モデルが実行される場所に近い SageMaker Studio で、1 桁ミリ秒の推論レイテンシを実現していると主張しています。

Intuit のデータ プラットフォーム エンジニアリング担当副社長 Mammad Zadeh 氏は次のように述べています。

「Amazon SageMaker Feature Store を立ち上げる前に AWS と緊密に連携してきましたが、完全に管理された機能ストアの実現により、組織内で複数の機能リポジトリを維持する必要がなくなることを非常に嬉しく思っています。

当社のデータ サイエンティストは、中央ストア内の既存の関数を使用し、チームやモデル間で関数の標準化と再利用を推進できるようになります。 ”

次に、機械学習専用に構築された、使いやすい継続的インテグレーションおよび継続的デリバリー (CI/CD) サービスとして初めて登場した SageMaker Pipelines があります。

開発者は、データの読み込み手順、Amazon SageMaker Data Wrangler を使用した変換、Amazon SageMaker Feature Store に保存される機能、トレーニング構成、アルゴリズム設定など、エンドツーエンドの機械学習ワークフローの各ステップを定義できます。

デバッグ手順と最適化手順。 。

進行中の出来事を考慮すると、SageMaker Clarify は今週の AWS の最も重要な機能の 1 つになる可能性があります。

Clarify は、機械学習ワークフロー全体にわたってバイアス検出を提供し、開発者が ML モデルに高い公平性と透明性を組み込めるようにすることを目的としています。開発者は統合ソリューションを使用して、モデル内の逸脱に迅速に対応することができます。

通常は時間のかかるオープンソース ツール。

DFLグループのデジタルイノベーション担当エグゼクティブバイスプレジデント、アンドレアス・ヘイデン氏は次のように述べています。

「Amazon SageMaker Clarify は、Bundesliga Match Facts デジタル プラットフォームの他の部分とシームレスに統合されており、Amazon SageMaker で機械学習ワークフローを標準化するという当社の長期戦略の重要な部分を占めています。

機械学習などの AWS の革新的なテクノロジーを使用してより深い洞察を提供し、ピッチ上での一瞬の決断をファンがよりよく理解できるようにすることで、Bundesliga Live は視聴者に重要な決断に関する深い洞察を提供します。全ての試合。 ”

Amazon SageMaker のディーププロファイリングは、システムリソースの使用率を自動的に監視し、検出されたトレーニングのボトルネックに対して必要に応じてアラートを提供します。この機能はフレームワーク(PyTorch、Apache MXNet、TensorFlow)全体で利用可能で、自動的に収集します。

トレーニング スクリプトのコードを変更せずに、システムとトレーニングのメトリックを設定します。

次に、SageMaker に分散トレーニングを実装しました。AWS によると、これにより、大規模で複雑なディープラーニング モデルを現在の方法よりも最大 2 倍速くトレーニングできるようになります。

Turbine の CTO である Kristóf Szalay 氏は次のようにコメントしています。

「私たちは機械学習を使用して、Simulated Cell と呼ばれる独自のネットワーク アーキテクチャに基づいて、コンピューターでシミュレートされた人間の細胞モデルをトレーニングします。Simulated Cell は、分子レベルでさまざまな介入を正確に予測することで、新しいがん治療薬を発見したり、既存の治療法の新しいターゲットを見つけたりするのに役立ちます。」

コンビネーションパートナー。

シミュレーション トレーニングは何度も繰り返して行いますが、各トレーニングの実行には 1 台のマシンで数日かかるため、新しいアイデアを迅速に反復する能力が妨げられます。

私たちは、Amazon SageMaker での分散トレーニングに非常に期待しています。これにより、トレーニング時間が 90% 短縮され、セルラー モデル トレーニング用のクラス最高のコードベースを作成するという私たちの主な使命に集中できるようになると期待しています。

最終的に、Amazon SageMaker により、患者のための新しいがん治療薬の特定と開発という私たちの主な使命をより効果的に遂行できるようになります。 ”

SageMaker のデータ並列エンジンは、複数の GPU 間でデータを自動的に分割することで、トレーニング ジョブを単一の GPU から数百または数千に拡張し、トレーニング時間を 40% 短縮します。

エッジコンピューティングの進歩が急速に進む中、AWS は SageMaker Edge Manager でそれに追いついています。

Edge Manager は、開発者がエッジ デバイスのフリートに展開された ML モデルを最適化、保護、監視、および保守するのに役立ちます。 Edge Manager は、ML モデルの最適化とエッジ デバイスの管理を支援するだけでなく、モデルに暗号署名し、予測データをデバイス外に保つ機能も提供します。

監視と分析のために SageMaker にアップロードし、状況を追跡して視覚的なレポートを提供するダッシュボードを表示する機能。 SageMaker コンソールにデプロイされたモデル。

Lenovo の PC およびスマートデバイス向けクラウドおよびソフトウェア担当副社長の Igor Bergman 氏は次のようにコメントしています。

「SageMaker Edge Manager は、導入後のモデルの最適化、監視、継続的な改善に必要な手作業を排除するのに役立ちます。これにより、当社のモデルは他の同様の機械学習プラットフォームよりも高速に実行され、メモリ消費量が少なくなると期待しています。」

Lenovo のサービス ポートフォリオ全体にわたって AI を新しいアプリケーションに拡張していく中で、クラウドと何百万ものエッジ デバイスの両方で柔軟かつ拡張可能な高性能パイプラインが引き続き必要になります。だから私たちはAmazonを選んだのです

SageMaker プラットフォーム。豊富なエッジツークラウドおよび CI/CD ワークフロー機能により、機械学習モデルをあらゆるデバイスのワークフローに効果的に導入し、生産性を向上させることができます。 ”

最後に、SageMaker JumpStart は、機械学習の導入経験が少ない開発者でも簡単に始められるように設計されています。

JumpStart は、開発者に、クラス最高のソリューション、アルゴリズム、サンプルノートブックを見つけるための、使いやすく検索可能なインターフェースを提供します。開発者は、不正検出、顧客離脱予測、予測など、エンドツーエンドの機械学習テンプレートから選択できます。

選択して SageMaker Studio 環境に直接デプロイします。

AWS は SageMaker の改善を続けており、過去 1 年間で 50 を超える新機能を提供してきました。大規模な新機能リリースの後では、2020 年を楽しみに待つべきではないかもしれません。

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  調査レポート:2021年の人工知能開発動向予測

>>:  将来の人工知能戦争の運用概念に関する研究

推薦する

スマートカーの「ChatGPTモーメント」はどこまで進んでいるのでしょうか?

今年の「テクノロジー スプリング フェスティバル ガラ」CES で最も注目を集めたものは何かと聞かれ...

毎日のアルゴリズム: 階段登り問題

[[433205]]階段を登っているとします。建物の最上部に到達するまでに n 歩かかります。一度に...

AI と機械学習: 大きなデマか、それとも大きな希望か?

ダニング=クルーガー効果は重大なバイアスです。これは、能力の低い人が自分の軽率な決断に基づいて誤った...

人工知能とはいったい何でしょうか?映画の中で人類の支配は起こるのでしょうか?答えはここにあります

近年、人工知能は驚異的なスピードで技術が発展していることから、話題になっています。AlphaGoは囲...

...

SOA におけるソフトウェア アーキテクチャ設計とソフトウェアとハ​​ードウェアの分離方法論

次世代の集中型電子電気アーキテクチャでは、中央+ゾーン中央コンピューティング ユニットと地域コントロ...

三国志を例に挙げて分散アルゴリズムについて語るのって、気楽なことでしょうか?

[[357046]]序文「三国殺し」は、中国の三国時代を背景に、身分を手がかりにカードを形にした人...

AIが顧客関係管理を改善する3つの方法

AI には、CRM に関連する手動プロセスから組織を解放し、顧客エンゲージメント、販売分析情報、ソー...

Java 実装と読み取り/書き込みロック アルゴリズムの考え方

問題の背景: 複数のスレッドが共有リソースへの読み取りおよび書き込みアクセスを実行します。書き込みス...

...

百度、599ドルのスマートビデオスピーカーを発売

[元記事は51CTO.comより]「アリスマートスピーカーTmall Genie原価499元、クーポ...

自律型 AI エージェント: 未来の生産性エンジン

翻訳者 | 崔昊レビュー | Chonglouまとめこの記事では、タスクを自ら作成し、優先順位を付け...

AIは賢くなり、これらの新しい技術は流行の防止と生産の再開に役立つだろう

新型コロナウイルス肺炎の流行状況の変化に伴い、企業や機関の業務と生産の再開が現在の仕事の新たな焦点と...

...

マーケティングにおける人工知能の 4 つの実際の応用

人工知能 (AI) は誕生以来長い道のりを歩み、大きな進歩を遂げています。これは、Amazon や ...