人工知能を使用して自動化されたデータセンターを構築する方法

人工知能を使用して自動化されたデータセンターを構築する方法

現在、人工知能 (AI) に関する議論のほとんどは、自動運転車、チャットボット、デジタル ツイン、ロボット工学、および大規模なデータ セットからビジネス インサイトを抽出するための AI ベースのスマート システムの使用に焦点を当てています。しかし、企業のデータセンターのサーバーでは人工知能と機械学習が重要な役割を果たすでしょう。

[[339042]]

データセンターの効率性を向上させ、ビジネスを拡大する AI の可能性は、主に次の 4 つのカテゴリに分けられます。

  • 電力管理: AI ベースの電力管理により、暖房および冷房システムを最適化できるため、電気代の削減、スタッフの削減、効率の向上につながります。この分野の代表的なサプライヤーとしては、シュナイダーエレクトリック、シーメンス、バーティヴ、イートンなどが挙げられます。
  • 機器管理: AI システムは、サーバー、ストレージ デバイス、ネットワーク機器の状態を監視し、AI システムが正しく構成されていることを確認し、機器が故障する時期を予測できます。調査会社ガートナーによると、AIOps IT インフラストラクチャ管理 (ITIM) カテゴリーのベンダーには、OpsRamp、Datadog、Virtana、ScienceLogic、Zenoss などが含まれます。
  • ワークロード管理: AI システムは、データセンター内とハイブリッド クラウド環境の両方で、オンプレミス、クラウド、エッジ コンピューティング環境間で、ワークロードをより効率的なインフラストラクチャにリアルタイムで自動的に移動できます。 Redwood、Tidal Automation、Ignio など、AI ベースのワークロード最適化サービスを提供する中小企業が増えています。 Cisco、IBM、VMware などの大手ベンダーもこのような製品を提供しています。
  • セキュリティ: AI ツールは、通常のネットワーク トラフィックの様子を学習し、異常を検出し、セキュリティ担当者の注意を必要とするアラートを優先順位付けし、インシデント後の分析を支援し、企業のセキュリティ侵害に関する防御策の推奨事項を提供できます。この機能を提供するベンダーには、VectraAI、Darktrace、ExtraHop、Cisco などがあります。

要約すると、AI は、企業が人間の介入をほとんど必要とせず、より高い効率性と回復力で運用できる、高度に自動化され、安全な自己修復型データ センターを構築するのに役立ちます。

デル テクノロジーズのグローバル CTO オフィスの著名なエンジニアであるサイード タベット氏は、次のように説明しています。「AI 自動化テクノロジーは、人間のデータ解釈能力を超えるレベルにまで拡張でき、エネルギー使用の最適化、ワークロードの分散、効率の最大化に必要な洞察を収集して、データ センターの資産利用率を高めます。」

自動運転車が実現するのと同じように、自動運転データセンターもまだ実現していません。データセンターにおける AI アプリケーションのブレークスルーには、技術的、運用的、人的障壁が数多く存在します。 AI テクノロジーの導入は今日始まったばかりですが、その潜在的なメリットを理由に、行動を起こす機会を探している企業も出てくるでしょう。

電源管理はサーバーのワークロード管理を活用する

データセンターは世界の電力の 3% を消費し、温室効果ガス排出量の約 2% を占めていると推定されています。そのため、コスト削減のためであれ、省エネや環境保護のためであれ、多くの企業がデータセンターの電力管理を真剣に研究しています。

451 Researchのシニアアナリスト、ダニエル・ビゾ氏は、AIベースのシステムは、空気の流れを妨げる高密度キャビネットによる冷気供給不足、精密空調ユニットの性能不足、暖気通路と冷気通路間の冷気供給不足など、データセンター運営者が現在または潜在的な冷却の問題を理解するのに役立つと述べた。

ビゾ氏は、AIシステムは精密な空調システムのデータと環境センサーの測定値を相関させることで施設について学習できると述べた。

IT コンサルティングおよびアドバイザリー会社 StorageIO の創設者 Greg Schulz 氏は、「電源管理は簡単に実現できる。電源装置をよりスマートに動作させることを意味する」と付け加えた。

企業はキャパシティプランニングの観点も持つ必要があります。 AI システムは、ホットスポットとコールドスポットを見つけるだけでなく、データセンターが適切な数の物理サーバーに電力を供給していることを確認し、電力需要が一時的に急増した場合に新しいサーバーを起動およびシャットダウンする機能も備えています。

シュルツ氏は、電力管理ツールはデバイスやワークロードを管理するシステムとの接続を開発していると付け加えた。たとえば、サーバーが過熱していることをセンサーが検出した場合、AI システムは、ミッションクリティカルなアプリケーションに影響を及ぼす可能性のある中断を回避するために、ワークロードをあまり使用されていないサーバーに迅速かつ自動的に移行する可能性があります。 AI システムは、サーバーが過熱している理由を調査できます。原因としては、ファンが故障している (HVAC の問題)、物理コンポーネントが故障しそうになっている (機器の問題)、またはサーバーが単に過負荷になっている (ワークロードの問題) などが考えられます。

AIによるヘルスモニタリング、構成管理監視

データセンターには、定期的なメンテナンスが必要な物理的な機器が多数あります。 AI システムは、データ センターの定期的なメンテナンスを支援し、テレメトリ データを収集して分析し、すぐに対応が必要な特定の領域を特定できます。 「AI ツールは、こうしたデータや異常をすべて調べることができます」とシュルツ氏は言います。「データ センターの健全性の監視は、機器が正しく構成され、期待どおりに動作しているかどうかを確認することから始まります。大規模なデータ センターには何千もの IT キャビネットと何万ものコンポーネントがあるため、これらのタスクは労働集約的であり、必ずしもタイムリーかつ徹底的に実行されるとは限りません。」

彼は、大量のセンサーデータログに基づく予測的な機器故障モデル化により、差し迫ったコンポーネントまたは機器の故障を検出し、サービスの中断につながる可能性のある容量損失を回避するために即時のメンテナンスが必要かどうかを評価できると指摘しました。

ジュニパーネットワークスのエンタープライズおよびクラウドマーケティング担当副社長、マイケル・ブッソン氏は、エンタープライズデータセンターの運営者は人工知能を取り巻く過剰な宣伝を無視すべきだと考えている。

「おそらくいつの日か、AI システムが作業員にどこで問題が発生したかを伝え、修正できるようになるかもしれません」とブション氏は言う。

依存関係マッピングは、人工知能が役立つ分野でも重要です。データ センターの管理者がファイアウォールやその他のデバイスのポリシーを変更する場合、予期しない結果はどうなりますか? 「変更を提案すると、非常に役立つ変更が行われる可能性があります」と Bushong 氏は言います。

機器をスムーズかつ安全に稼働させるためのもう 1 つの重要な側面は、構成ドリフトと呼ばれるものを制御することです。これは、時間の経過とともに問題を引き起こす可能性のある一時的な構成変更を指すデータ センター用語です。 AI は追加の安全性チェックとして機能し、構成ベースのデータセンターの差し迫った問題を特定できると Bushong 氏は言います。

人工知能とセキュリティ

Bizo は、AI と機械学習によってイベントを迅速に分類およびクラスタリングし、重要なイベントを識別して分離することで、インシデント処理 (インシデント対応) を簡素化できると考えています。根本原因分析が迅速化することで、運用スタッフは十分な情報に基づいて意思決定を行い、対処できるようになります。

シュルツ氏は、AIはリアルタイムの侵入検知に特に役立つと付け加えた。 AI ベースのシステムは脅威を検出し、ブロックし、隔離することができ、その後、フォレンジック調査を実施して何が問題だったのかを正確に判断することができます。

セキュリティ オペレーション センター (SOC) で働くセキュリティ専門家は、アラートに圧倒されることがよくありますが、AI ベースのシステムでは、大量のテレメトリ データとログ情報をスキャンして日常的なタスクをクリアできるため、セキュリティ専門家はより詳細な調査に取り組めるようになります。

AIベースのワークロード最適化

アプリケーション層では、オンプレミスでもクラウドでも、AI によってワークロードを適切な着陸地点に自動的に移動できる可能性があります。 「AIと機械学習は将来、パフォーマンス、コスト、ガバナンス、セキュリティ、リスク、持続可能性に関するさまざまな仕様に基づいて、ワークロードをどこに配置するかをリアルタイムで決定するはずです」とビゾ氏は語った。

たとえば、サーバーが最高の効率 (70% ~ 80% の使用率) で稼働していることを保証しながら、ワークロードをエネルギー効率の高いサーバーに自動的にシフトできます。 AI システムではパフォーマンス データを組み込むことができるため、時間に敏感なアプリケーションを効率的なサーバー上で実行しながら、迅速に実行する必要がないアプリケーションが過剰なエネルギーを消費しないようにすることができます。

AI ベースのワークロード最適化は MIT の研究者の注目を集めており、同研究者らは昨年、数千台のサーバーにわたるデータ処理操作のスケジュール方法を自動的に学習できる AI システムの開発を発表しました。

しかし、ブション氏が指摘するように、現実には、ワークロードの最適化は現在、エンタープライズ データ センターではなく、Amazon、Google、Azure などのハイパースケーラーにとって優先事項となっています。これには多くの理由があります。

AI導入の課題

データセンターの最適化と自動化は、進行中のデジタル変革イニシアチブの不可欠な部分です。デルのタベット氏は次のように付け加えた。「パンデミックの結果、多くの組織がさらなる自動化を目指しており、AI主導で自己修復が可能な『デジタルデータセンター』というアイデアを推進している。」

Googleは2018年に、自社のハイパースケールデータセンター数か所の冷却システムの制御をAIプログラムに委託したと発表し、AIアルゴリズムによる推奨によりエネルギー使用量が40%削減されたと報告した。

しかし、多くの企業にとって、データセンターに人工知能技術を導入することは非常に野心的なことです。 「イベント処理、インフラストラクチャの健全性、冷却の最適化には、AI と ML の機能の一部が利用可能です」と Bizo 氏は言います。「しかし、今日の標準的な DCIM で可能な範囲を超えて、AI と ML モデルでさらなるブレークスルーを実現するには何年もかかるでしょう。」

「障壁としては、システムを管理するために適切なスタッフを雇用またはトレーニングする必要があることが挙げられます。注意が必要なもう 1 つの問題は、データ標準と関連アーキテクチャの必要性です。AIOps プラットフォームの成熟度、IT スキル、運用の成熟度が大きな障壁です。高度な導入が直面しているその他の新たな課題としては、データ品質、IT インフラストラクチャおよび運用チームのデータ サイエンス スキルの不足などがあります」と Tabet 氏は述べています。

ブション氏は、最大の障害は常にスタッフであると付け加えた。彼は、データサイエンティストの採用は多くの企業にとって課題であり、既存の従業員のトレーニングも問題であると指摘した。多くの従業員は長い間、自分たちのコントロールを奪うテクノロジーに抵抗してきました。彼は、ソフトウェア定義ネットワーク (SDN) テクノロジが登場してから 10 年経つが、IT 運用の 75% 以上が依然としてコマンドライン インターフェイス (CLI) 主導であると指摘しました。

「あらゆる種類のインフラの運営者がAIに制御を委ねる準備ができているという確信が広がっている」とブション氏は語った。 ”

そのため、ブション氏は企業に人工知能の導入を推奨している。

<<:  AIアプリケーションのための実用的なフレームワークを構築するための5つのステップ

>>:  自動運転車は交通事故の3分の1しか解決できない、と研究が示す

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

フェイフェイ・リーがリストに載っています!バイデン氏、AI研究者にデータを公開するため12人からなるタスクフォースを設置

バイデン政権は木曜日、国家人工知能研究リソース(NAIRR)作業部会の設立を発表した。ワーキンググル...

機械学習ソート入門 LTR - 線形モデル

[[207418]]多くの検索専門家は、「機械学習を通じて最適な重みを取得し」、それを検索クエリに使...

GPT-4 は AGI です! Googleとスタンフォード大学の科学者が、大規模モデルがいかにして超知能化できるかを明らかに

汎用人工知能(AGI)は実際に実現されているのでしょうか?最近、Google Research と ...

AIコードツールが人気、複雑な操作が数秒で簡単になり、ネットユーザー:VS Codeを放棄

最近、AIコードエディタCursorが人気になってきました—— GPT-3.5/GPT-4 に接続す...

...

4つの業界は人工知能がもたらす混乱に注意を払う必要がある

2020 年には、AI と機械学習のテクノロジーが新興産業に継続的な影響を与え、企業だけでなく消費者...

...

ディープラーニングによって変革された5つのコンピュータービジョン技術

概要: この記事では、主にコンピューター ビジョンにおける 5 つの主要テクノロジ、つまり画像分類、...

ロボットは購入するよりもレンタルした方が良いのでしょうか?新モデルの普及には「4段階をクリア」する必要がある

ロボットの重要性は明らかです。ロボットは効率的で柔軟性があり、安定した動作特性を備えているため、人間...

...

中国の人工知能は現在、世界の中でどの程度のレベルにあるのでしょうか?

総じて、人工知能は世界の新世代の技術革命と産業転換の原動力となっており、その発展は我が国の産業構造の...

人工知能が動物を理解するにはどれくらいの時間がかかるのでしょうか?

[[405241]]ビッグデータダイジェスト制作出典: engadget現在、オーストラリアに生息...