データセンターは効率性を向上させるためにさらなる機械学習を必要としている

世界経済フォーラムによると、2025年までに世界では毎日463EBのデータが生成されることになります。増え続けるデータの急増に対処するために、データセンター運営者は、稼働時間の最大化、エネルギー使用の最適化、潜在的なリスクの検出、サイバー攻撃からの保護という 4 つの主要目標を達成するための新しい方法を模索しています。機械学習 (ML) 技術を活用することは、重要な潜在的な解決策です。

[[410106]]

機械学習と人工知能の導入は簡単なことのように思えるかもしれませんが、企業の経営者は慎重に進める必要があります。課題としては、投資収益率の不確実性、データ共有に関する複雑なポリシー、上級管理職の認識とサポートの欠如などが挙げられます。しかし、企業がデータにどれほど依存しているかを考えると、テクノロジーリーダーは、特に稼働時間の維持に関しては、機械学習やその他の AI アプリケーションの重要性を無視することはできません。

企業はダウンタイムに高い代償を払う

データセンターの計画外のダウンタイムによるコストは、企業の規模や業種に応じて、1 時間あたり 140,000 ドルから 540,000 ドルまで幅広くなります。ブリティッシュ・エアウェイズは2017年に大規模なデータセンター障害に見舞われ、7,500万ドル以上の損害を被った。機械学習とよりスマートなインフラストラクチャの進歩により、今日のデータセンターでは稼働時間運用を大幅に簡素化できます。

市場調査会社International DataCorpによると、2022年までにデータセンターの技術の50%以上が、組み込みの人工知能と機械学習機能を使用して自律的に動作できるようになるとのことです。機械学習を使用してデータセンターの運用を強化する 4 つの方法は次のとおりです。

（１）エネルギー効率の最大化

世界のデータセンターは世界のエネルギー使用量の 1% を消費しています。これは小さな数字のように聞こえるかもしれませんが、運用効率がわずかに改善されるだけでも、大幅なコスト削減につながり、何百万トンもの二酸化炭素が大気中に放出されるのを防ぐことができます。幸いなことに、エネルギー管理は機械学習を実装するのが最も簡単な分野の 1 つです。たとえば、Google は DeepMind を使用してエネルギーを約 30% 節約し、間接費を大幅に削減しました。

（２）正確なキャパシティプランニング

増大するワークロードに対応するために、データセンター管理者はコンピューティングリソースの需要を事前に正確に予測する必要があります。これらの予測は、環境条件の変化を反映するためにリアルタイムで更新する必要があります。高度な機械学習アルゴリズムを使用して構築された予測モデルは、ペタバイトレベルの膨大な量のデータを処理し、容量とパフォーマンスの使用率をインテリジェントに予測できます。この計画により、データセンターはダウンタイムを引き起こし、運用に影響を及ぼす可能性のあるリソース不足を回避できます。

（３）リスク分析の迅速化

機械学習は、人間よりも速く正確に異常を検出するようにトレーニングできます。データセンターのスタッフが何かを発見するまでに長い時間がかかる場合があり、さらに悪いことに、異常を完全に見逃してしまうこともあります。たとえば、一部のデータセンター管理サービス (DMaaS) プログラムでは、電源管理や冷却システムなどの主要なデータセンター機器のパフォーマンスデータを分析し、障害が発生する時期を予測できます。機械学習テクノロジーは、データセンターの機器管理者に差し迫った障害を事前に通知することで、ダウンタイムを最小限に抑えることができます。

（４）サイバー攻撃への抵抗力

分散型サービス拒否 (DDoS) 攻撃から保護するには、高速検出と低い誤検出率が求められます。これらの検出方法は、特徴ベースと異常ベースの 2 つのカテゴリに大別できます。シグネチャベースの検出は、一般的なトラフィックでは既知の特性があり、広く実装され、使用されています。異常ベースの検出は、通常のトラフィックパターンを超えています。機械学習回帰モデルを使用すると、トラフィックの異常の種類を識別し、誤検知を最小限に抑えることができます。

課題を克服する

一部のデータセンターでは AI と機械学習のパイロットプロジェクトを実施していますが、他のデータセンターではそれらを完全に導入するのに苦労しています。これは、パイロットプロジェクトではより小さなデータセットが使用され、実験室条件下で実行されるためです。たとえば、現実の世界では、数テラバイトのデータを数分で処理する必要がある場合があります。したがって、AI を研究室から現場に拡張することは、データセンターが克服しなければならない大きな課題です。その他の課題としては、モデルをトレーニングするための高品質データへのアクセスの難しさ、精度を達成するための実装時間が長いこと、データ共有に関する複雑な法的ポリシーに準拠していることなどが挙げられます。

では、データセンターはこれらの課題をどのように克服するのでしょうか? 万能のソリューションは存在しません。企業は AI ロードマップから始める必要があります。驚くかもしれませんが、多くの企業はこのステップを見落としています。企業は、データの可用性と取得、およびデータの正確なラベル付けに重点を置いた包括的なデータ戦略を作成する必要があります。

次に、機械学習を簡単に拡張できるように、エンタープライズグレードのパフォーマンスを備えた機械学習モデルを使用します。データセンターインフラストラクチャを使用した自動化およびコンテナ化されたアルゴリズムのトレーニング。これも簡単に拡張可能になります。データの品質に重点を置き、AI パイロット向けのテストセンターオブエクセレンスまたは同様の構造を確立します。これには、ビジネスに関連する技術的スキル、専門知識、能力を考慮する必要があります。パイロットをより幅広いアプリケーションに拡大するのを支援することで、より大きな影響がもたらされます。

データセンターは、この変化する環境の中でどのように運用するかを再考する必要があります。今日のつながりのある社会では、データセンターは競争に遅れをとったり、圧倒されたりしないように、機械学習の限界を押し広げ続ける必要があります。

<<: 世界で最も引用率の高い中国の AI ジャーナルではどのような研究が行われていますか?

>>: これらの6つのヒントを活用してAIガバナンスの問題を解決しましょう

アプリケーション開発コンサルティングは、企業が人工知能を最大限に活用できるよう支援します

データセンターは効率性を向上させるためにさらなる機械学習を必要としている

企業はダウンタイムに高い代償を払う

課題を克服する

アプリケーション開発コンサルティングは、企業が人工知能を最大限に活用できるよう支援します

Pika、Gen-2、ModelScope、SEINE…AIビデオ生成で最高なのはどれでしょうか?このフレームワークは理解しやすい

マイクロソフトリサーチアジア、ウェイ・フル氏：人工知能における基礎イノベーションの第2次成長曲線

2023 年の ICML カンファレンスが開催されます! Google DeepMindの最新研究を簡単に見てみよう

AIは大学入試で高得点のエッセイを書けるようになったが、小説を書くにはまだ遠い

錬金術をより形而上学的にしましょう！蘇州大学の博士課程では「天の幹と地の枝」を使ってランダムシードを生成しており、このプロジェクトはオープンソース化されている。

機械分野では人材不足が起きているのでしょうか？人工知能の時代はあなたが思っているよりもずっと早く来ています!

MITはレーザー彫刻機にAIを搭載し、材料を自動的に識別し、98%の精度で彫刻の強度を判定した。

不動産業界における人工知能のメリットトップ10

GPT や Llama などの大規模モデルには「反転の呪い」があります。このバグを軽減するにはどうすればよいでしょうか?

推薦する

中山大学が偏りのない視覚的質問応答データセットを公開、その論文はトップジャーナルTNNLSに掲載される

2020年のライフスタイルに関する2008年の予測：そのほとんどが実現

人気の説明: キャッシュ、キャッシュアルゴリズム、キャッシュフレームワークの概要

説明可能な不正防止AIについてお話しましょう

AIGC時代のビデオ普及モデル、復旦チームらが分野初のレビューを発表

ディープラーニングフレームワークの簡単な歴史: TFとPyTorchは二大勢力であり、次の10年は黄金時代を迎える

Text2Image: NLP への新しいアプローチ

ChatGPTはオンラインモードを緊急にシャットダウンし、有料のウェブページに無料でアクセスできることが一度明らかになった。

人工知能をより深く理解するための人工知能と機械学習の12のキーワード