データセンターは効率性を向上させるためにさらなる機械学習を必要としている

データセンターは効率性を向上させるためにさらなる機械学習を必要としている

世界経済フォーラムによると、2025年までに世界では毎日463EBのデータが生成されることになります。増え続けるデータの急増に対処するために、データセンター運営者は、稼働時間の最大化、エネルギー使用の最適化、潜在的なリスクの検出、サイバー攻撃からの保護という 4 つの主要目標を達成するための新しい方法を模索しています。機械学習 (ML) 技術を活用することは、重要な潜在的な解決策です。

[[410106]]

機械学習と人工知能の導入は簡単なことのように思えるかもしれませんが、企業の経営者は慎重に進める必要があります。課題としては、投資収益率の不確実性、データ共有に関する複雑なポリシー、上級管理職の認識とサポートの欠如などが挙げられます。しかし、企業がデータにどれほど依存しているかを考えると、テクノロジーリーダーは、特に稼働時間の維持に関しては、機械学習やその他の AI アプリケーションの重要性を無視することはできません。

企業はダウンタイムに高い代償を払う

データ センターの計画外のダウンタイムによるコストは、企業の規模や業種に応じて、1 時間あたり 140,000 ドルから 540,000 ドルまで幅広くなります。ブリティッシュ・エアウェイズは2017年に大規模なデータセンター障害に見舞われ、7,500万ドル以上の損害を被った。機械学習とよりスマートなインフラストラクチャの進歩により、今日のデータセンターでは稼働時間運用を大幅に簡素化できます。

市場調査会社International DataCorpによると、2022年までにデータセンターの技術の50%以上が、組み込みの人工知能と機械学習機能を使用して自律的に動作できるようになるとのことです。機械学習を使用してデータセンターの運用を強化する 4 つの方法は次のとおりです。

(1)エネルギー効率の最大化

世界のデータセンターは世界のエネルギー使用量の 1% を消費しています。これは小さな数字のように聞こえるかもしれませんが、運用効率がわずかに改善されるだけでも、大幅なコスト削減につながり、何百万トンもの二酸化炭素が大気中に放出されるのを防ぐことができます。幸いなことに、エネルギー管理は機械学習を実装するのが最も簡単な分野の 1 つです。たとえば、Google は DeepMind を使用してエネルギーを約 30% 節約し、間接費を大幅に削減しました。

(2)正確なキャパシティプランニング

増大するワークロードに対応するために、データ センター管理者はコンピューティング リソースの需要を事前に正確に予測する必要があります。これらの予測は、環境条件の変化を反映するためにリアルタイムで更新する必要があります。高度な機械学習アルゴリズムを使用して構築された予測モデルは、ペタバイトレベルの膨大な量のデータを処理し、容量とパフォーマンスの使用率をインテリジェントに予測できます。この計画により、データ センターはダウンタイムを引き起こし、運用に影響を及ぼす可能性のあるリソース不足を回避できます。

(3)リスク分析の迅速化

機械学習は、人間よりも速く正確に異常を検出するようにトレーニングできます。データセンターのスタッフが何かを発見するまでに長い時間がかかる場合があり、さらに悪いことに、異常を完全に見逃してしまうこともあります。たとえば、一部のデータセンター管理サービス (DMaaS) プログラムでは、電源管理や冷却システムなどの主要なデータセンター機器のパフォーマンス データを分析し、障害が発生する時期を予測できます。機械学習テクノロジーは、データセンターの機器管理者に差し迫った障害を事前に通知することで、ダウンタイムを最小限に抑えることができます。

(4)サイバー攻撃への抵抗力

分散型サービス拒否 (DDoS) 攻撃から保護するには、高速検出と低い誤検出率が求められます。これらの検出方法は、特徴ベースと異常ベースの 2 つのカテゴリに大別できます。シグネチャベースの検出は、一般的なトラフィックでは既知の特性があり、広く実装され、使用されています。異常ベースの検出は、通常のトラフィック パターンを超えています。機械学習回帰モデルを使用すると、トラフィックの異常の種類を識別し、誤検知を最小限に抑えることができます。

課題を克服する

一部のデータセンターでは AI と機械学習のパイロット プロジェクトを実施していますが、他のデータセンターではそれらを完全に導入するのに苦労しています。これは、パイロット プロジェクトではより小さなデータ セットが使用され、実験室条件下で実行されるためです。たとえば、現実の世界では、数テラバイトのデータを数分で処理する必要がある場合があります。したがって、AI を研究室から現場に拡張することは、データ センターが克服しなければならない大きな課題です。その他の課題としては、モデルをトレーニングするための高品質データへのアクセスの難しさ、精度を達成するための実装時間が長いこと、データ共有に関する複雑な法的ポリシーに準拠していることなどが挙げられます。

では、データ センターはこれらの課題をどのように克服するのでしょうか? 万能のソリューションは存在しません。企業は AI ロードマップから始める必要があります。驚くかもしれませんが、多くの企業はこのステップを見落としています。企業は、データの可用性と取得、およびデータの正確なラベル付けに重点を置いた包括的なデータ戦略を作成する必要があります。

次に、機械学習を簡単に拡張できるように、エンタープライズ グレードのパフォーマンスを備えた機械学習モデルを使用します。データ センター インフラストラクチャを使用した自動化およびコンテナ化されたアルゴリズムのトレーニング。これも簡単に拡張可能になります。データの品質に重点を置き、AI パイロット向けのテスト センター オブ エクセレンスまたは同様の構造を確立します。これには、ビジネスに関連する技術的スキル、専門知識、能力を考慮する必要があります。パイロットをより幅広いアプリケーションに拡大するのを支援することで、より大きな影響がもたらされます。

データセンターは、この変化する環境の中でどのように運用するかを再考する必要があります。今日のつながりのある社会では、データセンターは競争に遅れをとったり、圧倒されたりしないように、機械学習の限界を押し広げ続ける必要があります。

<<:  世界で最も引用率の高い中国の AI ジャーナルではどのような研究が行われていますか?

>>:  これらの6つのヒントを活用してAIガバナンスの問題を解決しましょう

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

開発に重点を置き、革新を追求します。 LeaTech Global CTO Leadership Summit が始まりました!

[51CTO.comより]デジタル経済時代の到来が加速し、「第14次5カ年計画」が発表されるにつれ...

決定木からランダムフォレストへ: ツリーベースアルゴリズムの原理と実装

この記事では、決定木の数学的詳細(およびさまざまな Python の例)とその長所と短所について説明...

DeepMind: 畳み込みネットワークは ViT ほど優れていないと誰が言ったのですか?

ディープラーニングの初期の成功は、畳み込みニューラル ネットワーク (ConvNet) の開発による...

ブロックチェーン技術を活用してディープフェイク動画の脅威に対抗する方法

デジタル革新が主流の時代において、ディープフェイク動画の増加は広く懸念されるようになっている。ディー...

...

2021 年に注目すべき 3 つのデータ分析と AI のトレンド

組織が新型コロナウイルス感染症のパンデミックを乗り越えていく中で、データ分析と AI の ROI を...

大規模モデルのモデル融合法についてお話しましょう

モデル融合は、特に判別モデルにおいて、これまで頻繁に使用されてきました。これは、常に着実に改善できる...

YouTube、有名歌手の真似をしたり、テキストやハミングで曲を作曲できるAIツールをリリース

YouTube は 11 月 16 日に、ユーザーがテキストを入力したりメロディーをハミングしたりす...

人工知能を学ぶには、このコア技術を知っておく必要があります!

自然言語処理 (NLP) は、コンピューター サイエンスと人工知能の分野における重要な方向性です。自...

ChatGPTから何を学びましたか?

GPTとはGPT は「Generative Pre-Training」の略で、画像とテキストの入力...

...

AIによるサイバーセキュリティの自動化

データが組織の生命線となっている今日のデジタル時代では、サイバーセキュリティが極めて重要になっていま...

Google、写真を撮るだけで皮膚疾患を検出するAIツールの新機能を発表

5月19日、Googleの開発者会議I/O 2021が開幕した。完全オンライン形式を採用し、Goog...