ドミノ倒し: DataOps、AI、機械学習だけがマイクロサービスと分散システムを無敵にできる

ドミノ倒し: DataOps、AI、機械学習だけがマイクロサービスと分散システムを無敵にできる

[[440885]]

[51CTO.com クイック翻訳]次のようなシナリオを想像してみてください。IT 運用および保守担当者がコーヒーを楽しもうとしているときに、突然の緊急アラームが彼らの良い気分を乱します。たとえ不断の努力によって大量のアラームメッセージを解決できたとしても、そのような膨大な作業負荷により、運用・保守担当者は疲弊してしまいます。次のような疑問を抱かずにはいられません。なぜシステムは問題をインテリジェントに予測し、アラームが発行される前に修正できないのでしょうか。IT 運用担当者がハイブリッド クラウド上の複雑な IT システムとアプリケーションを使用してアラーム情報を処理するとどうなるか想像してみてください。間違いなく、彼らは「アラームの泥沼」にはまり込んでしまい、抜け出すことができなくなるでしょう。

以下の目標を達成するために、マイクロサービス向けにカスタマイズされた新しいアーキテクチャが誕生しました。


  • ビジネス機能のサポート
  • アプリケーションをサービスとして自動的に展開する
  • エンドポイントインテリジェンス
  • 言語とデータの分散制御

どのアプリケーションでもマイクロサービスは密接に接続される傾向があり、ドミノ効果を引き起こす可能性があります。アプリケーションの遅延や変更は、予期しない速度で他のサービスに影響を及ぼす可能性があります。すべてのデジタルネイティブビジネスは、データと分散システムという 2 つの要素に依存しています。エンタープライズ アプリケーションでサービスを完全に配信するには、2 つの要素が必要です。デジタルネイティブ組織が成熟するほど、使用する分散システムが増え、所有するデータも増えます。

成熟したクラウドネイティブ企業が直面するもう 1 つの問題は、データの断片化です。これを解決するには、全体的なアプリケーション ソリューションを構築する必要があります。 Gartner は、IT インフラストラクチャによって生成されるデータの量は毎年 2 ~ 3 倍に増加すると予測しています。

このような状況で、なぜ人間がアプリケーションの障害の責任を負わなければならないのでしょうか? ここで、基本的な構成とアラート ソリューションについて疑問が生じます。

現代のマイクロサービスの世界では何を変える必要があるのでしょうか?

1. ログを準備する

集中化されたサイロ化されたアーキテクチャを分解し、ログを 1 つのシステムに集約します。保存する場合でも表示する場合でも、同じデータ ソースに保存するようにしてください。マイクロサービスによって生成されるデータが大量にある場合、単一ビューのアプローチによりログを簡単に検索できるようになります。これは、最新のマイクロサービス監視へのアプローチをアップグレードするための基本です。

2. 分散ネットワークを管理する

分散ネットワークとその通信は無視できません。それはあらゆる組織にとって不可欠な部分です。過度なダウンサンプリング (サンプルを再度ダウンサンプリングし、余分なサンプルを破棄する) によってデータの粒度を犠牲にすることなく、履歴データを長期間保存できるクラスター ソリューションを使用します。オープンソースと SaaS クラウド サービスにより、このソリューションはさらに複雑になります。しかし、サードパーティのプラットフォームに大規模で動的なエコシステムがある場合でも、監視システムをサードパーティのプラットフォームと統合すると、完全な監視可能性が確保されます。

3. 動的なログ/トレースデータを管理する

マイクロサービス ベースのアプリケーションが進化し変化すると、生成されるデータも静かに変化します。この場合、監視システムも異常を検出する必要があることを考慮すると、手動で作成されたアラーム ルールだけに頼ることはできません。最も重要なことは、ログ データの作成または更新によって重大なアラームが無視されないことです。

インテリジェンスとロボットデータ自動化 (RDA)

ロボティック データ オートメーション (RDA) は、データ処理を自動化し、監視システムとプロセスをよりスマートにしてアラームを管理するように設計されています。機械学習アルゴリズムは、履歴データと既存の学習モデルを使用して、いつでもどこでも新しいアラート ルールを作成できます。基礎となるマシン データとアラームを処理して、アラーム処理プロセスを最適化するための推奨事項を提供します。 RDA はアラーム処理プロセスをインテリジェントにして、人間の介入を減らします。

マイクロサービスの新しい世界へ

古い監視方法から移行する 4 つの理由は次のとおりです。

1. クラウドに導入されるアプリケーションが増えています。

2. 反復がより頻繁になり、プログラムに小さな変更を加えるたびに、アプリケーション全体を再コンパイルしてリリースする必要が生じます。

3. すべての変更は他のモジュールに影響を及ぼします。諺にあるように、小さな変更でも全体に影響を及ぼします。

4. 古い監視拡張方法を使用すると、アプリケーション全体に影響が及びますが、実際には、監視拡張のニーズを満たすには、一部のリソースのみを拡張する必要があります。

同時に、新しいマイクロサービス アーキテクチャ モデルでは、サービス検出、構成管理、負荷分散、メッセージングなどに重点を置く必要があります。データを取得し、サードパーティのシステムと統合する機能が必要です。 RDA の AIOps (人工知能による運用と保守) 方式は、ハイブリッド IT システムのパフォーマンスと可用性の監視に役立ちます。

翻訳者紹介

Cui Hao: 51CTO コミュニティ エディター、シニア アーキテクト。ソフトウェア開発とアーキテクチャで 18 年、分散アーキテクチャで 10 年の経験があります。元HPの技術専門家。彼は情報を共有することに積極的で、60 万回以上読まれている人気の高い技術記事を多数執筆しています。 『分散アーキテクチャの原則と実践』の著者。

原題: ドミノ倒し: マイクロサービスと分散システムが立ち上がるにはインテリジェントな DataOps と AI/ML が必要、著者: Srinivas Miriyala

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]


<<:  自動化を推進するAIテストツール

>>:  AIoT: 次世代コンバージェンスの利点と用途を理解する

ブログ    
ブログ    

推薦する

産業用ロボットは高給ですか?

産業用ロボットの雇用見通しはどうですか?近年、世界の産業用ロボット産業と市場は急速に発展しています。...

「地表」から「宇宙」まで、探査ロボットが未知の領域の秘密を解き明かす

ロボットは現代社会で生み出された新しい種です。科学技術の進歩により、ロボットの開発はもはや人間の能力...

...

GPU を通じて Pandas のパフォーマンスを高速化するもう 1 つのデータ処理ツールです。

NVIDIA の RAPIDS cuDF は、データの読み込み、結合、集約、フィルタリング、その他...

Python を使ってシンプルな遺伝的アルゴリズムをゼロから実装する

遺伝的アルゴリズムはランダムなグローバル最適化アルゴリズムです。人工ニューラル ネットワークと並んで...

2元で何千枚もの顔写真が買える、AIブラック業界の真実はそれ以上だ!

最近では、「顔スキャン」、つまり顔認識技術を使うことで、解決できることが増えています。買い物の際の「...

2021 年のデジタル トランスフォーメーションの 10 大トレンド

2020 年に私たちがどうなるかは誰も予測できませんでした。過去 6 か月だけでも、過去 10 年間...

...

人工知能が教育評価の近代化に貢献

教育評価は、教育の質の継続的な向上を促進する「牛の鼻」として、確立された教育目標に基づき、一定の教育...

世界経済フォーラムの報告: 5年以内に8,500万の仕事が機械に置き換えられる可能性がある

世界経済フォーラム(WEF)のウェブサイトが21日に報じたところによると、同組織はこのほど「仕事の未...

...

フォーカス | 機械学習に役立つ 7 つのクラウド コンピューティング サービス

データ分析は、多くの組織がクラウド コンピューティング プラットフォーム上で実行する主要なコンピュー...

AIと行動科学がワクチン接種への躊躇にどう対処できるか

Fractal Analytics の共同創設者 Ram Prasad 氏は、AI が問題領域の特定...