オブジェクトストレージがAIの最大の課題を克服するのに理想的な理由

オブジェクトストレージがAIの最大の課題を克服するのに理想的な理由

2020 年のコロナウイルスのパンデミックは、データの迅速な分析と解釈の重要性、そして情報に基づいた意思決定を行う上で人工知能と機械学習が果たす重要な役割を浮き彫りにしました。医療研究機関がワクチンを開発するにつれ、機械学習がどのように人命を救うために活用されるかという現実世界の応用が人々の目に留まり、リアルタイム推論に必要なデータトレーニングと AI モデルの継続的な微調整が推進されています。

より適切にトレーニングされたモデルはより高速で正確な AI システムを生み出すことができるため、AI が直面する最大の課題は機械学習モデルを適切にトレーニングすることです。

[[380214]]

トレーニングされた機械学習モデルは、適応して改善できるように、安定したデータストリームを取り込む必要があります。トレーニング データ セットが大きくなるにつれて、学習アルゴリズムのパフォーマンスが向上し、精度も高まります。つまり、データが多ければ多いほど、結果は良くなります。当然のことながら、膨大な量のデータにアクセスするには大量のストレージ スペースが必要ですが、この場合、すべてのストレージ ソリューションが同じように作成されるわけではありません。組織が AI/ML アプリケーションを最適に導入する方法を評価する際には、そのプロセスでストレージ インフラストラクチャを見落とさないことが不可欠です。

組織がモデル トレーニングに必要な、膨大かつ増え続けるデータセットから実用的な洞察をうまく選別して収集できるかどうかは、そのストレージ アーキテクチャがデータ パイプラインの各段階の非常に厳しい要件を満たすことができるかどうかにかかっています。

効果的な機械学習モデルをサポートするためにオブジェクト ストレージが不可欠な 7 つの理由

率直に言って、オブジェクト ストレージは AI/ML モデルのトレーニングの課題を解決するのに役立つ唯一のソリューションです。オブジェクト ストレージが最適な理由は次のとおりです。

1. 無制限の拡張性

大量のデータには大量のストレージが必要であり、AI/機械学習のワークロードには、データの増加に応じて無限に拡張できるソリューションが必要です。従来のファイルおよびブロック ストレージ ソリューションは、数百テラバイトを超えるとスケーラビリティの上限に達します。オブジェクト ストレージは、単一のグローバル名前空間で数十ペタバイト以上に無限に拡張できる唯一のタイプのストレージです。いつでもどこでも中断することなく新しいノードを展開し、需要に応じて柔軟かつシームレスに拡張できることは大きな利点です。

2. 組み込みデータ保護

ペタバイト単位のトレーニング データセットを定期的にバックアップするのは、時間がかかるだけでなく、非現実的です。設計上、ほとんどのオブジェクト ストレージ システムではバックアップは必要ありません。それどころか、保存されるデータには十分な冗長性があるため、常に保護されます。オブジェクト ストレージ ソリューションは通常、分散アーキテクチャ (特定のサービスを提供または管理するための特別なマシンを必要とせず、並列に実行される分散サーバーの集合) として設計されるため、すべての責任が分離され、中央の「制御」マシンは必要ありません。したがって、そのアーキテクチャにおける単一障害点 (SPOF) のリスクはゼロです。分散オブジェクト ストレージ システムは自己修復機能を備えており、非常に高いデータ耐久性を提供できます。システムは、複数のノードまたは分散データセンターでの障害に耐えるように構成できます。

3. 固有のメタデータ検索と分類

効果的な機械学習モデルの構築とトレーニングに必要なデータ準備フェーズでは、データのタグ付け、検索、特定、分析を簡単に行うことができる詳細な記述メタデータが不可欠です。ストレージ アーキテクチャは、メタデータを収集する機能に影響します。ファイル システムとブロック システムは、アプリケーションまたはユーザー定義の拡張属性をサポートしていませんが、オブジェクト ストレージ システムは、非常に豊富でカスタマイズ可能なメタデータを使用してデータを識別する独自の方法を提供します。制限のない性質により、ラベル付けが容易になり、強力で高速な検索が可能になり、大規模なデータセットを効率的に管理できます。

4. マルチテナント

マルチテナントでワークロードを分離し、複数のデータ サイエンティストのチームが互いに影響を与えたりリソースを競合したりすることなく、同じデータ ソースを同時に操作できるようにします。マルチテナントのユースケースに対応するように設計されたオブジェクト ストレージ システムにより、スケーラブルな AWS S3 互換インターフェイスからテナント データを安全に管理することが簡単になります。

5. 持続的なスループット性能によりトレーニング時間が短縮される

データ パイプラインを最適な速度で維持する機能は、機械学習モデルのトレーニングに不可欠です。結果を迅速に得るにはインフラストラクチャの効率性が必要です。そうでないと、膨大なデータセットで実行される計算が遅くなったり中断されたりします。最新のオブジェクト ストレージ システムは、高いデータ スループットを維持できるだけでなく、スケールアウトしてシステム全体の容量とパフォーマンスを独立して直線的に向上させることができます。これは、コンピューティング (CPU とメモリ) と容量 (フラッシュと HDD) を提供し、ストレージ ソフトウェアによって単一のストレージ プールとして管理できるストレージ サーバーの形式でシステム リソースを追加することで実現できます。

6. AI/MLアルゴリズムはクラウドで実行される

データがどこに保存されているかに関係なく、パブリック クラウドとの統合は重要です。特に、パブリック クラウド プラットフォームでは AI/ML 用の魅力的な既成のツール セットがいくつか提供されるためです。アーキテクチャ的には、オブジェクト ストレージは、事実上の言語である AWS S3 API を使用してオンプレミス/プライベート クラウド環境とパブリック クラウド ストレージ間でシームレスにアクセスおよび移動できるため、機械学習モデルのトレーニングとチューニングに適しています。最適なオブジェクト ストレージ ソリューションにより、ユーザーはクラウドベースとオンプレミスのデータを統合された名前空間で管理できるようになり、データ サイロが排除され、機能を損なうことなくリソースの連携と交換が可能になります。

7. 総所有コスト(TCO)の削減

AI/ML ワークロード向けに設計されたストレージ インフラストラクチャは、容量とパフォーマンスを提供するだけでなく、最適なモデルをトレーニングするために必要なペタバイト単位のデータの保存、移動、管理においてコスト効率も高くなければなりません。標準のサーバー テクノロジと単一システムでの大規模な運用機能を活用することで、従来の独自のエンタープライズ ストレージのコストの数分の 1 のコストで、オブジェクト ストレージを大量に提供できます。ソフトウェア定義ソリューションは、低コストの標準 x86 サーバー上でホストでき、複数世代のハードウェアにわたって進化してコストを削減できます。

AI アプリケーションの価値を最大限に実現したい組織は、機械学習モデルを適切にトレーニングし、微調整することの重要性と潜在的な課題を理解する必要があります。賢明な組織は、コンピューティングのニーズを選択するのと同じように、適切なストレージ インフラストラクチャを選択する際にも注意を払います。そして、オブジェクト ストレージ ソリューションは、最終的に高速かつ正確な分析情報を抽出し、人命を救うなど、さまざまな目的に最適な基盤を提供します。

<<:  DeepGlint: 顔認識の最新の進歩と産業グレードの大規模な顔認識の実践に関する議論

>>:  IBM TRIRIGA統合ワークプレイス管理システムに新機能が追加

ブログ    
ブログ    
ブログ    

推薦する

...

機械学習の成功事例9つを詳しく見る

かつては企業にとって「空約束」と考えられていた人工知能(AI)と機械学習(ML)が、今では主流になっ...

エッジコンピューティングが企業のコスト削減と効率向上にどのように役立つか

エッジ コンピューティングへの期待が高まる中、業界では「エッジがクラウドを飲み込む」や、医療、小売、...

Google は、MLM 損失で直接事前トレーニングされた 24 個の小さな BERT モデルをリリースしました。

[[318598]] Google は最近、24 個の合理化された BERT モデルをダウンロード...

マルウェア対策アルゴリズムを活用し、サイバーセキュリティ企業Menlo Securityが1億ドルを調達

組織をサイバー脅威から保護するエンドポイントレス クラウド ソリューションのプロバイダーである Me...

...

...

AIは実は人々の思考や視野を制限している

[[252987]] AIは徐々に成熟し、さまざまな産業に導入され、人々の生活を微妙に変えています。...

ベイジアンディープラーニングと大規模ベースモデルの融合: 効率的で説明可能な AI のための戦略

人工知能 (AI) には、コンピューターサイエンス、数学、統計、心理学、生物学など、複数の学問分野が...

2021 年の人工知能の最新動向を示す 15 のグラフ

2021年AIインデックスレポートは、スタンフォード大学の人間中心AI研究所と、ハーバード大学、経済...

データサイエンスを始めるにはどの程度のレベルの数学が必要ですか?

基礎科目として、数学はデータサイエンスと機械学習の両方において欠かせない役割を果たします。数学的な基...

中国は人工知能チップの開発において「偏り」を持つことはできない

[[269826]] 「設計アーキテクチャだけを見れば、国産の人工知能チップは外国製のものより劣って...

産業用ロボットとは何ですか?

産業用ロボットとは何ですか?工業生産で使用される産業用ロボットには、溶接ロボット、研削・研磨ロボット...

AIの諸刃の剣:質問を検索するために写真を撮ることと不正行為を支援すること

子どもを指導しているとき、圧倒されたり、怒りすぎて気が狂いそうになったりすることがありますか? [[...

人工知能は 5 大製造業にどのような変化をもたらすのでしょうか? AIプロジェクトを成功に導く5つのステップ

今日、デジタル変革はビジネス存続の基盤となっています。自動化された工場から人工知能 (AI) 品質管...