AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

【51CTO.com クイック翻訳】

Amazon Web Services (AWS) は、クラウドベースの機械学習プラットフォーム SageMaker の 9 つの主要な新しいアップデートを発表しました。

SageMaker は、ほぼあらゆるユースケースで ML モデルを構築、トレーニング、デプロイするために使用できる機械学習サービスを提供することを目的としています。

今年の re:Invent カンファレンスで、AWS は SageMaker の機能をさらに進化させるためのいくつかの発表を行いました。

AWS の Amazon Machine Learning 担当副社長である Swami Sivasubramanian 氏は次のように述べています。

「何千人もの開発者やデータサイエンティストが、すでに業界をリードする機械学習サービスであるAmazon SageMakerを使用して、カスタム機械学習モデルの構築、トレーニング、展開の障壁を取り除いています。SageMakerのような広く採用されているサービスがあれば、

このプロジェクトの最も優れた点の 1 つは、次の成果物の開発を推進するクライアントからの提案が多数得られることです。

本日、Amazon SageMaker 向けのツールセットを発表しました。これにより、開発者はエンドツーエンドの機械学習パイプラインを簡単に構築でき、カスタム機械学習モデルを準備、構築、トレーニング、説明、検査、監視、デバッグ、実行し、より優れたパフォーマンスを実現できます。

大規模な可視性、説明可能性、自動化。 ”

最初の発表は、機械学習用にデータを自動的に準備するように設計された機能である Data Wrangler です。

Data Wrangler を使用すると、顧客はさまざまなデータ ストアから必要なデータを選択し、ワンクリックでインポートできます。 300 を超える組み込みデータ コンバーターが含まれており、コードを記述せずに関数を標準化、変換、結合できます。

デロイトの AI エコシステムおよびプラットフォーム リーダーシップの責任者であるフランク ファラル氏は、次のようにコメントしています。

「SageMaker Data Wrangler は、新製品を市場に投入するために必要な機械学習データ準備プロセスを加速する豊富な変換ツールセットを備えており、データ準備のニーズに先駆けて対応できます。

その結果、当社のクライアントは、当社が迅速に展開を拡大できることから恩恵を受け、数か月ではなく数日でクライアントのニーズに応えて測定可能で持続可能な結果を​​提供できるようになります。 ”

2 番目の発表は、Feature Store です。 Amazon SageMaker Feature Store は、トレーニングと推論のための機械学習機能を簡単に保存、更新、取得、共有できる新しいリポジトリを提供します。

Feature Store は、複数のモデルにマップされる機能を保存するという問題を克服するために設計されています。専用の関数ライブラリにより、開発者は関数にアクセスして共有することができ、開発者チームとデータ サイエンティスト間で関数セットの命名、整理、検索、共有が容易になります。それは

AWS は、ML モデルが実行される場所に近い SageMaker Studio で、1 桁ミリ秒の推論レイテンシを実現していると主張しています。

Intuit のデータ プラットフォーム エンジニアリング担当副社長 Mammad Zadeh 氏は次のように述べています。

「Amazon SageMaker Feature Store を立ち上げる前に AWS と緊密に連携してきましたが、完全に管理された機能ストアの実現により、組織内で複数の機能リポジトリを維持する必要がなくなることを非常に嬉しく思っています。

当社のデータ サイエンティストは、中央ストア内の既存の関数を使用し、チームやモデル間で関数の標準化と再利用を推進できるようになります。 ”

次に、機械学習専用に構築された、使いやすい継続的インテグレーションおよび継続的デリバリー (CI/CD) サービスとして初めて登場した SageMaker Pipelines があります。

開発者は、データの読み込み手順、Amazon SageMaker Data Wrangler を使用した変換、Amazon SageMaker Feature Store に保存される機能、トレーニング構成、アルゴリズム設定など、エンドツーエンドの機械学習ワークフローの各ステップを定義できます。

デバッグ手順と最適化手順。 。

進行中の出来事を考慮すると、SageMaker Clarify は今週の AWS の最も重要な機能の 1 つになる可能性があります。

Clarify は、機械学習ワークフロー全体にわたってバイアス検出を提供し、開発者が ML モデルに高い公平性と透明性を組み込めるようにすることを目的としています。開発者は統合ソリューションを使用して、モデル内の逸脱に迅速に対応することができます。

通常は時間のかかるオープンソース ツール。

DFLグループのデジタルイノベーション担当エグゼクティブバイスプレジデント、アンドレアス・ヘイデン氏は次のように述べています。

「Amazon SageMaker Clarify は、Bundesliga Match Facts デジタル プラットフォームの他の部分とシームレスに統合されており、Amazon SageMaker で機械学習ワークフローを標準化するという当社の長期戦略の重要な部分を占めています。

機械学習などの AWS の革新的なテクノロジーを使用してより深い洞察を提供し、ピッチ上での一瞬の決断をファンがよりよく理解できるようにすることで、Bundesliga Live は視聴者に重要な決断に関する深い洞察を提供します。全ての試合。 ”

Amazon SageMaker のディーププロファイリングは、システムリソースの使用率を自動的に監視し、検出されたトレーニングのボトルネックに対して必要に応じてアラートを提供します。この機能はフレームワーク(PyTorch、Apache MXNet、TensorFlow)全体で利用可能で、自動的に収集します。

トレーニング スクリプトのコードを変更せずに、システムとトレーニングのメトリックを設定します。

次に、SageMaker に分散トレーニングを実装しました。AWS によると、これにより、大規模で複雑なディープラーニング モデルを現在の方法よりも最大 2 倍速くトレーニングできるようになります。

Turbine の CTO である Kristóf Szalay 氏は次のようにコメントしています。

「私たちは機械学習を使用して、Simulated Cell と呼ばれる独自のネットワーク アーキテクチャに基づいて、コンピューターでシミュレートされた人間の細胞モデルをトレーニングします。Simulated Cell は、分子レベルでさまざまな介入を正確に予測することで、新しいがん治療薬を発見したり、既存の治療法の新しいターゲットを見つけたりするのに役立ちます。」

コンビネーションパートナー。

シミュレーション トレーニングは何度も繰り返して行いますが、各トレーニングの実行には 1 台のマシンで数日かかるため、新しいアイデアを迅速に反復する能力が妨げられます。

私たちは、Amazon SageMaker での分散トレーニングに非常に期待しています。これにより、トレーニング時間が 90% 短縮され、セルラー モデル トレーニング用のクラス最高のコードベースを作成するという私たちの主な使命に集中できるようになると期待しています。

最終的に、Amazon SageMaker により、患者のための新しいがん治療薬の特定と開発という私たちの主な使命をより効果的に遂行できるようになります。 ”

SageMaker のデータ並列エンジンは、複数の GPU 間でデータを自動的に分割することで、トレーニング ジョブを単一の GPU から数百または数千に拡張し、トレーニング時間を 40% 短縮します。

エッジコンピューティングの進歩が急速に進む中、AWS は SageMaker Edge Manager でそれに追いついています。

Edge Manager は、開発者がエッジ デバイスのフリートに展開された ML モデルを最適化、保護、監視、および保守するのに役立ちます。 Edge Manager は、ML モデルの最適化とエッジ デバイスの管理を支援するだけでなく、モデルに暗号署名し、予測データをデバイス外に保つ機能も提供します。

監視と分析のために SageMaker にアップロードし、状況を追跡して視覚的なレポートを提供するダッシュボードを表示する機能。 SageMaker コンソールにデプロイされたモデル。

Lenovo の PC およびスマートデバイス向けクラウドおよびソフトウェア担当副社長の Igor Bergman 氏は次のようにコメントしています。

「SageMaker Edge Manager は、導入後のモデルの最適化、監視、継続的な改善に必要な手作業を排除するのに役立ちます。これにより、当社のモデルは他の同様の機械学習プラットフォームよりも高速に実行され、メモリ消費量が少なくなると期待しています。」

Lenovo のサービス ポートフォリオ全体にわたって AI を新しいアプリケーションに拡張していく中で、クラウドと何百万ものエッジ デバイスの両方で柔軟かつ拡張可能な高性能パイプラインが引き続き必要になります。だから私たちはAmazonを選んだのです

SageMaker プラットフォーム。豊富なエッジツークラウドおよび CI/CD ワークフロー機能により、機械学習モデルをあらゆるデバイスのワークフローに効果的に導入し、生産性を向上させることができます。 ”

最後に、SageMaker JumpStart は、機械学習の導入経験が少ない開発者でも簡単に始められるように設計されています。

JumpStart は、開発者に、クラス最高のソリューション、アルゴリズム、サンプルノートブックを見つけるための、使いやすく検索可能なインターフェースを提供します。開発者は、不正検出、顧客離脱予測、予測など、エンドツーエンドの機械学習テンプレートから選択できます。

選択して SageMaker Studio 環境に直接デプロイします。

AWS は SageMaker の改善を続けており、過去 1 年間で 50 を超える新機能を提供してきました。大規模な新機能リリースの後では、2020 年を楽しみに待つべきではないかもしれません。

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  調査レポート:2021年の人工知能開発動向予測

>>:  将来の人工知能戦争の運用概念に関する研究

ブログ    
ブログ    

推薦する

自然言語処理 (NLP) とは何ですか?

[[399636]] 【51CTO.com クイック翻訳】自然言語処理 (NLP) の定義自然言語...

ディープラーニング(CNN RNN Attention)を使用して大規模なテキスト分類問題を解決する - 概要と実践

[[188373]]著者は最近、深層学習を応用してタオバオ商品のカテゴリー予測問題を解決するプロジェ...

2021 年を総合的に振り返ると、これら 10 社の AI スタートアップには「材料」がある!

今年の AI スタートアップ リストには、AI 音声アシスタントを構築するためのコード不要の Web...

Apple、Googleなど大企業のAI面接の質問を入手しました。あなたは挑戦してみますか?

何?大手テクノロジー企業の面接の質問が漏洩した?そんなわけないですよね~。海外の有名なブログプラット...

...

マスク氏の最新チップ:脳とコンピューターの相互作用に特化し、視覚障害者が「見る」ことを可能にする

自分で認めなさい!マスク氏のニューラリンクはチップを開発している。この技術は「数年以内」にリリースさ...

...

...

人工知能人材の需要は倍増し、アルゴリズム人材の不足は170万人に達した

デジタル経済と実体経済の融合と発展が加速する中、デジタル経済の重要な技術モジュールとしての人工知能の...

アルトマンの巨大な AI 帝国を深く探ります。核融合プラントから不死技術センターまで、その規模は驚異的です。

制御された核融合から AGI、そしてチップ業界全体の再編まで、アルトマン氏の将来の AI 展望は、も...

Facebook、MITなどが共同で451ページの原稿を発表:「第一原理」を使ってDNNを説明する」

Facebook、プリンストン大学、MITのAI研究者らは最近、ディープラーニングが実際にどのよう...

人工知能開発の重要な要素と気候変動への影響

人工知能は世界的な流行語となり、ほぼすべての企業のデジタル変革計画に不可欠な要素となっています。 A...

教師なし機械学習は産業オートメーションにどのようなメリットをもたらすのでしょうか?

現代の産業環境にはセンサーやスマート コンポーネントが満載されており、それらすべてが組み合わさって大...

...

Adobe が超強力な人工知能ブラックテクノロジーをリリース、アーティストたちは職を失うかもしれない!

Adobe Make itのシェアを聞いて、Adobeの人工知能ブラックテクノロジーに衝撃を受けま...