3 つの AIOps プラクティス: 可視化、自動化からインテリジェンスまで

3 つの AIOps プラクティス: 可視化、自動化からインテリジェンスまで

2018年5月18日〜19日、51CTO主催のグローバルソフトウェアおよび運用技術サミットが北京で開催されました。このサミットは、人工知能、ビッグデータ、モノのインターネット、ブロックチェーンなど12の核心的なホットトピックに焦点を当て、国内外から60人の第一線の専門家を集めています。これはハイエンドの技術の饗宴であり、トップクラスのIT技術者が学び、ネットワークを拡大するための見逃せないプラットフォームです。

「コンテナにおける AIOps」セッションでは、Xinju Networks のディレクター兼副ゼネラルマネージャーである Cheng Yongxin 氏が、「AIOps 実践の 3 つの軸: 可視化、自動化からインテリジェンスへ」と題した素晴らしい講演を行いました。程永馨氏は、20年近く運用保守管理に携わり、IT技術アーキテクチャ、運用保守管理モデル、ツールの変遷を目の当たりにしてきました。今回の講演では、エンタープライズレベルのAIOpsの進化の軌跡を詳しく説明し、実際のシナリオから突破口を開き、AIOpsの実装を中心に展開しました。

AIOps プラットフォームの製品化における困難を克服する方法

モビリティ、ビッグデータ、クラウドコンピューティング、人工知能などの新しいテクノロジーの推進により、IT テクノロジー アーキテクチャは、従来の「IOE アーキテクチャ」から「インターネット アーキテクチャ」へと静かに変化してきました。インターネット アーキテクチャに関係するネットワーク要素、テクノロジー スタック、サービスなどの要素の数は飛躍的に増加しており、運用と保守のプレッシャーはますます大きくなっています。この流れの中で、運用保守管理モデルはITILからDevOpsへと進化し、運用保守管理ツールもITOM、ITOAからAIOpsへと破壊的な変化を遂げてきました。

ガートナーは AIOps プラットフォームのマーケットガイドを提供していますが、データ管理、モデルアルゴリズム、シナリオ駆動の 3 つの要素に基づいて AIOps プラットフォームを実装できるのでしょうか。実はそうではありません。このプロセスには複数の困難があります。まず、開発が得意な開発者は運用保守が得意ではなく、運用保守が得意な運用保守担当者は開発が得意ではありません。次に、垂直方向に複数の反復と水平方向に大規模な反復を経験してきた、さまざまな規模の多くの歴史的なシステムは、AIOps と完全に互換性があるでしょうか。第三に、AIOps プラットフォームの製品化では、過去と将来の両方のニーズを考慮し、静的安定性とアジャイル開発のニーズを満たし、規模と業界の境界を超越できる必要があります。

Xinju Networkは2006年の設立以来、通信、電力、航空、金融などの大手企業や機関に運用・保守管理サービスを提供してきました。程永馨氏は、業界の実務経験を組み合わせて、可視化、自動化、インテリジェンスという3つのAIOps実装戦略を提案しました。Xinju NetworkによるAIOpsインテリジェント運用保守プラットフォームの構築を例に挙げ、シナリオ主導がAIOpsを実装する最良の方法であることを確認しました。

AIOps を実装するための 3 つの重要なステップの視覚化

視覚化はなぜそれほど重要なのでしょうか?なぜなら、計測はすべてのマネジメントの始まりであり、可視化はマネジメントの結果の提示だからです。 AIOps 実装のプロセスにおいて、欠かせないリンクは、できるだけ多くの指標を定量化し、指標を視覚化することです。このプロセスでは、企業はビジネスからリソースまでの3次元的かつ詳細な相関分析を実現するために、3次元視覚監視システムを構築する必要があります。

図1 新居ネットワーク可視化インテリジェント監視システムのフレームワーク

図 1 に示すように、Xinju Network のインテリジェント監視および警報システムは、オペレーティング システム、データベース、仮想化、ネットワーク機器、ミドルウェア、ストレージなどの統合データを収集し、ユーザーが監視画面を通じてさまざまなシステム指標の状態をリアルタイムで確認できるようにします。さらに、インテリジェントなアルゴリズムを通じて構築されたビジュアルヘルスモデルにより、システム監視がインテリジェントなスコアリング形式に簡素化され、監視の決定が簡素化されます。

自動化: AIOps を実装するための 3 つの重要なステップ

AIOps を実装する 2 番目のステップは自動化です。インストール、展開、パッチ配布、検査操作など、頻繁に行われる多数の操作については、自動化によって運用および保守担当者の作業負荷を軽減できます。

AIOps シナリオ: 自動障害分析

図2 リアルタイム障害経路解析

図 2 に示すように、ビッグデータとインテリジェント分析機能が自動処理プロセスに導入され、運用と保守におけるリアルタイムの障害経路分析と迅速な障害箇所特定を実現し、複雑なシステムにおける「点、線、面」障害の影響を分析します。

AIOpsシナリオ: データベースの運用と保守の自動化

図3 データベースのインテリジェントな運用と保守、インテリジェントなSQL最適化

すべての PaaS の中核はデータベースにあり、データベースの運用保守作業は運用保守全体の中で非常に大きな割合を占めています。図3に示すように、Xinju NetworksはDPMデータベースインテリジェント運用保守プラットフォームを具体的に立ち上げました。現在、Oracle、DB2、MySQL、SQL Serverなどの複数の一般的なデータベースをサポートし、1つのプラットフォームで複数のデータベースのインテリジェントな運用保守管理を実現します。問題を迅速に発見して特定し、最適化の提案を提供するだけでなく、アプリケーションのバージョン変更プロセスによって発生するSQLの問題に対してターゲットを絞った最適化の提案を行い、リスクの高いSQLを自動的に識別してレビューし、アプリケーションの起動によってもたらされるリスクを軽減します。

AIOps実装の3つの成果:インテリジェンス

可視化と自動化の段階を経て、企業の運用と保守の問題の 80% が解決されました。では、次はインテリジェンスに向けてどのように進むべきでしょうか?突破口はシナリオ主導にあります。 Xinju Network は、エンタープライズレベルの運用保守サービス市場での 10 年以上の実績に基づき、インテリジェント検査、リソース管理、アプリケーション容量、ネットワーク セキュリティ、ユーザー エクスペリエンス、障害診断、災害復旧切り替え、セキュリティ監査など、自動化からインテリジェンスに移行できる 8 つの主要な運用保守シナリオをまとめました。

図4 インテリジェント実装の前提条件:運用と保守のビッグデータ

図4に示すように、程永馨氏は特に、インテリジェンス化の前提条件である運用と保守のビッグデータの重要な役割を強調しました。新居ネットワークを例に挙げると、新居ネットワークは、統一された収集、多次元、3次元の視覚監視システムを備え、8つの運用保守シナリオの自動化を実現した後、新居ネットワークが独自に開発したIVORYビッグデータログ分析プラットフォームに基づいて、AIOpsリアルタイム運用保守データ分析に重点を置き、障害の早期警告、異常な隠れた危険のタイムリーな発見、傾向分析を実現しました。 IVORY は、業界での長年の運用と保守の経験を​​組み合わせ、アラームの自己修復や自動障害回復などの機能を徐々に探求し、モバイル オペレーターと金融業界での生産慣行を実装しました。

Xinju Networks AIOps エンタープライズレベルの実践と進化の道

新居ネットワークのAIOpsエンタープライズレベル実践の全体的な実践と進化の道筋は、運用保守プラットフォームの基本機能、運用保守ビッグデータとツール機能、AIOps機能とシナリオ実装の3つの段階に分かれています。各段階の関連する構築と対策を図5に示します。

図 5 Xinju Network AIOps エンタープライズレベルの実践と進化のロードマップ

程永馨氏は講演の中で、国家商業銀行データベースのインテリジェント運用・保守、金融リスク管理データ展開のためのビッグデータ分析アプリケーション、金融企業に提供される全体的なAIOpsインテリジェント運用・保守プラットフォームなど、Xinju Networksが複数の金融企業クライアントのAIOps実装を支援した事例についても言及した。金融業界の情報構築において、新居ネットワークは「企業レベルの製品+地域化されたサービス」の両輪駆動戦略を堅持し、10年以上にわたって大規模な企業の運用・保守サービスで豊富な経験を積み、金融技術の革新を推進し、金融業界における新技術の応用を加速しています。

<<:  人間の生理学的パラメータのモニタリング分野に焦点を当て、Pulse Geekはウェアラブルでこの分野に参入し、AIを活用して心臓の守護者となる

>>:  MIT は、思考を通じて機械にタスクを実行させるブラックテクノロジーを開発

ブログ    
ブログ    
ブログ    

推薦する

...

OSPFはSPFアルゴリズムを使用してルートを伝播します

SPF アルゴリズムは、各ルータをルートとして使用して、各宛先ルータまでの距離を計算します。各ルータ...

2023 年に最も影響力のある 10 のオープンソース大規模言語モデル

2023 年は、大規模言語モデル (LLM) の台頭により、オープンソース分野にとって極めて重要な年...

...

デジタルヒューマンブラック技術が公開、わずか数分で話す動画を再現可能に

デジタルヒューマンと共存できるサイバーパンクの世界への準備はできていますか?将来の仮想世界で多くのア...

2Dラベルのみを使用してマルチビュー3D占有モデルをトレーニングするための新しいパラダイム

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

AIによる自動思考の隠れたコストについて

[[273454]]多くの薬と同様に、精神を明晰に保つために特に使用される薬であるモダフィニルには、...

5つの産業用類似アルゴリズム

1. はじめに広告主は通常、ユーザー タグに基づいて広告のターゲット ユーザーを定義します。たとえば...

Nature: 衣服をマイクとして使う?新しい素材は銃声の方向を検知し、胎児の心拍を監視できる

FPS ゲームをプレイしたことがある人なら、音で位置を識別できるはずですよね?銃声と足音は敵の方向...

...

Google、AIロボットが人間に危害を加えないことを保証する「ロボット憲法」を起草

グーグルのディープマインドは1月5日、3つの新たな開発を発表した。その1つは、AIロボットが人間に危...

ライフル銃で動くロボット犬の発明者が恐怖を巻き起こす:プログラミング制御は恐れる必要はない

[[429985]]先週、米国陸軍協会(AUSA)の会議がワシントンで開催されました。アメリカのロボ...

...

AIはインフルエンサーマーケティングにどのような影響を与えているのでしょうか?

2017年10月、ケンブリッジ・アナリティカのスキャンダルが発覚した直後、FacebookはIns...

...