WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

情報技術 (IT) 運用管理は、ミッションクリティカルなビジネス アプリケーションをサポートするために IT システムに依存しているほとんどの組織にとって頭痛の種です。

エンジニアの善意、巧みな設計、堅実な開発手法にもかかわらず、重要なビジネス アプリケーションを実行するために企業に導入されているソフトウェア システムとハードウェア システムは停止しやすく、毎年何百万ドルもの労働力、収益、顧客の不満の損失が生じています。

IT ダウンタイムをより正確に予測して対応するために、IT チームはトポロジ、ログ、チケット、アラートなどのソースから取得したデータを精査し始めます。しかし、これらの異なるデータ ソースとさまざまなツールがあっても、チームは単一の共有された視点から停止のトラブルシューティングを行うのに苦労していました。幸いなことに、IBM Cloud Pak for Watson AIOps を使用すると、これらすべてが可能になります。

ログ異常予測

Watson AIOps の最新の特許出願中のログ異常検出テクノロジーは、Splunk、Humio、LogDNA、Logstash などのログ集約ツールからの IT アプリケーションおよびインフラストラクチャ ログを自動的に解析し、リアルタイムで異常を自動的に検出します。これは、しきい値や誤った文字列一致タイプに基づく従来のアラート技術よりもはるかに高速であり、インシデントを診断する平均時間を大幅に短縮します。ログ解析中にログから特徴を抽出し、異常予測を実行するためにディープラーニングアルゴリズムを使用します。ユーザーは、異常を検出するために静的なしきい値や手動のルールを設定する必要はありません。 IT 運用スタッフが積極的に関与して異常を診断し、インシデントを解決します。さらに、選択した IT ツールセットを通じて明らかにされた洞察を解釈し、IT 運用スタッフが将来同じタイプのインシデントを自動的に解決できるようにします。

指標異常予測

Watson AIOps のメトリックベースの異常検出テクノロジーは、New Relic、AppDynamics、SolarWinds などのさまざまなシステムからのメトリック データを分析し、企業内のメトリックの正常な動作を自動的に学習して、その中で異常を検出します。実証済みの時系列アルゴリズムスイートを使用して、季節性や重要な傾向を捉え、予測を実行します。

イベントのグループ化

イベントは、IT 運用環境で発生した注目すべき出来事を表します。たとえば、アプリケーションが利用できない、またはディスクがいっぱい/十分な容量がないなどです。イベントのグループ化と分類の目的は、IT 運用管理者が気を散らすものを減らし、すぐに対応する必要がある重要なイベントの解決に集中できるようにすることです。 Watson AIOps は、時間、空間、関連ルール マイニングなどの複数のアルゴリズムを使用して、メトリック、ログ、チケットから検出された異常をグループ化することで、インシデントのグループ化を可能にします。

静的および動的トポロジ管理

アプリケーションおよびネットワーク トポロジとは、企業内のさまざまなミッション クリティカルなアプリケーション間の接続を示すマップまたは図を指します。静的トポロジとは、アプリケーションとインフラストラクチャ コンポーネントの情報が展開され、上記の上に構築されたマップを指します。対照的に、動的トポロジとは、実行時に環境が変化するにつれてリソースとその関係をキャプチャし、ほぼリアルタイムで同じ可視性を提供する動的マップを指します。

Watson AIOps の Topology Manager を使用すると、現在のトポロジーと履歴トポロジーを比較して、「何が起こったのか?」や「何が起きているのか?」などの質問に答えることができます。これは、インシデントに至るまでの詳細を調査し、時間の経過に伴ってトポロジ (および状態) がどのように変化するかを確認するのに役立ちます。さらに、断層の位置を位相的に特定することもできます。

断層の位置と爆発半径

エンティティ メンションは、例外ログ、アラート、チケット、イベントで参照されるリソース名 (サービスまたはアプリケーション コンポーネント名、サーバー名、サーバー IP アドレス、ポッド ID、ノード ID など) です。イベントがグループ化された後、イベント内の異常ログ、メトリック、アラート、およびエンティティの言及が抽出されます。これらのエンティティは、質問を見つけ、識別されたエンティティを、エンティティの言及が見つかった時刻と一致する対応する動的トポロジ インスタンスに配置するために、トポロジ リソースを使用して解決できます。アプリケーション、インフラストラクチャ、ネットワーク層のトポロジ グラフを走査することで、影響を受けるコンポーネント (爆発半径) を特定できます。

インシデント解決

Watson AIOps は、ServiceNow などのツールに接続して以前のインシデント チケット データを抽出およびマイニングし、現在診断されている問題に対する最善の対応策についてタイムリーで適切な推奨事項を提供します。現在のイベント機能を使用すると、インデックス付けされたチケット データを照会して、最も重要な関連する以前のイベント レコードを検索して取得できるだけでなく、関連する各レコードから重要なエンティティとアクション (名詞と動詞) のフレーズを抽出して、SRE が推奨されるアクションを簡単かつ迅速に理解できるようにすることもできます。ルールベースのシステムを含むさまざまな自然言語処理技術を適用して、エンティティとアクションフレーズを抽出します。

洞察と行動を提供する

Watson AIOps では、上記のすべての洞察が ChatOps とダッシュボードを通じて提供されます。リアルタイムの洞察は、ChatOps を介して SRE が作業する場所に直接配信されます。 ChatOps は、洞察の証拠を探索するだけでなく、他の共同作業者とのやり取りや、厳選されたインシデント解決の提案の共有もサポートします。 ChatOps を使用すると、SRE はログ、メトリック、チケット監視ツールを起動して、より詳細な情報を取得できます。同様に、SRE はインタラクティブなダッシュボードを起動して、イベント、イベント グループ、メトリックの異常、トポロジを詳細に調査できます。該当するアクション/ランブックは、ランブック実行によって自動的に実行されます。

AIモデルのライフサイクル管理に関する注意事項

Watson AIOps は、代表的なメトリック、ログ、チケット データのセットを使用して、教師なしモデルをトレーニングおよび構築します。これらのモデルは、環境内の最新のデータを使用して継続的に学習し、ユーザーからのフィードバックに基づいて改善するように設定されています。信頼を得るには、すべての AI モデルが透明性と説明可能性を備えている必要があります。AI 予測とモデルに信頼性と透明性を提供することは、世界中の企業にとって依然として最大の関心事です。

Watson AIOps の AI パイプライン。

Watson AIOps の今後の展開は?

次世代の Watson AIOps ソリューションでは、完全に機能し、監視可能で、自己認識できるだけでなく、自動化され、自律的な IT 運用環境を構想しています。 AIOps ソリューションは、リアクティブ モードで問題を解決するだけでなく、「開発、セキュリティ、運用 (DevSecOps)」ライフサイクル アクティビティを最初から設計することで、効率的な運用を可能にし、問題が発生する前に回避します。たとえば、インテリジェントなチェックとゲートにより、リスクの高いデプロイメントが実稼働環境に入るのを防ぎ、十分にテストされていないコード モジュールや危険なセキュリティ脆弱性を持つコードがデプロイメント段階に到達するのをブロックできます。私たちは未来を形作るのを心待ちにしており、この旅にぜひご参加ください。

IBM の詳細については、 http://cloud..com/act/ibm2021q3/cloud#p2 をご覧ください。

<<:  Google が新たなブラック テクノロジー プロジェクトを立ち上げました。産業用ロボットへの賭け

>>:  人工知能、機械学習、ディープラーニングの違いと関連性

ブログ    

推薦する

教師なし機械学習の基本ガイド

[51CTO.com クイック翻訳] 教師なし機械学習と人工知能は、組織のビジネス成長に役立つことは...

AIは消費者行動にどのような影響を与えるのでしょうか?

著者: ユン・チャオ[51CTO.com からのオリジナル記事]コンピュータ プログラミングを使用し...

多くの銀行は顔認識の安全性を確保する方法について警告を発している。

11月28日、北京ビジネスデイリーの記者は、今年初めから、平安銀行、中国光大銀行、綿陽市商業銀行、...

ビジネス開発における感情AIの重要性

世界が人工知能技術に依存する未来に向かって進むにつれ、人々はこれまで以上に感情を必要としています。人...

ソフトウェアプログラマー試験: 最もシンプルなコード実装による最速のソートおよび検索アルゴリズム

アルゴリズムの中心的な問題はソートと検索です。これら 2 つの分野は最も広く使用され、最も徹底的に研...

年間100万ドルの給料でも、このタイプの才能のギャップを埋めることはできません。 AI業界も「人手不足」

年収100万の仕事に就くことを夢見たことがありますか?人工知能業界に参入して、あなたの夢を現実にしま...

ディープラーニング? 「ブラックボックス」である必要はない

ディープニューラルネットワークのパラメータネットワークは非常に大きく複雑であり、これによりマシンはこ...

人工知能が動物を理解するにはどれくらいの時間がかかるのでしょうか?

[[405241]]ビッグデータダイジェスト制作出典: engadget現在、オーストラリアに生息...

無料の Python 機械学習コース 1: 線形回帰アルゴリズム

最も基本的な機械学習アルゴリズムは、単一の変数を持つ線形回帰アルゴリズムです。現在、非常に多くの高度...

2万本の論文が過去5年間の機械学習の変遷を物語る

[[188225]] arXiv.org は、物理学、数学、コンピューターサイエンス、生物学の論文の...

MITが世界の画期的な技術トップ10をランク付け、アリババはそのうち4つを研究中

2月22日のニュース:昨日、権威あるアメリカの科学雑誌「MITテクノロジーレビュー」は、2018年の...

AIイノベーションセンタートラックのリーディングカンパニー:智源匯が成都のスマート鉄道輸送の構築を支援

9月1日、成都地下鉄全線で「スマート旅客サービスプラットフォーム」がオンラインで開始されました。この...

Amazon SageMaker について

Amazon SageMaker は、開発者やデータサイエンティストがあらゆる規模の機械学習モデルを...

人工知能の未来を見据えて:2020年のAIの8つの主要トレンド

人工知能は、最も急速に成長し、最も予測不可能な産業の 1 つです。ディープラーニング、AI 駆動型機...

2020 年の人工知能に関するトップ 10 の予測

[[318614]] [51CTO.com クイック翻訳] 2019年、世界中の意思決定者の53%が...