AIはアプリケーションとそれをサポートするアプリケーション/インフラストラクチャの管理方法を再定義します。

AIはアプリケーションとそれをサポートするアプリケーション/インフラストラクチャの管理方法を再定義します。

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discovery)から転載したものです。

人工知能ベースの運用 (AIOps) は、AI と従来のアクティブ メッセンジャー (AM、またはインスタント メッセンジャー、IM) テクノロジを組み合わせたものです。 AI が他のすべての分野に革命をもたらしたように、運用管理にも大きな影響を与えるでしょう。 AI のパワーが運用に適用されると、アプリケーションとそれをサポートするアプリケーション/インフラストラクチャの管理方法が再定義されます。

[[323666]]

複数のアプリケーションを同時に実行すると、大量のデータが生成されます。データはネットワーク層で生成され、非表示の API インターフェースを通じてエンドユーザーに届きます。ユーザーは完璧なアプリケーションエクスペリエンスを期待しており、いかなる障害も許容しません。

完全に異なるレイヤーからデータを収集し、それを洞察に富んだリポジトリに変換することが可能になります。運用の複雑さにより、インテリジェントな運用および保守プラットフォームが誕生しました。インテリジェントな運用および保守プラットフォームは、AI および ML テクノロジーを使用して監視データから洞察を獲得し、人間の意思決定を強化することで自動化されたソリューションを推進します。

重要な応用事例とソリューション

1. 障害箇所の特定

ソフトウェア品質の管理は、ソフトウェア開発ライフサイクルにおける重要な懸念事項です。ほとんどすべてのソフトウェアは、リリース後に何らかの不具合が発生します。障害が本番環境に入る前に検出して修正することが重要です。生産に失敗するとコストが大幅に増加します。利用可能なリソースが限られている場合、障害箇所の特定は最も時間がかかり、困難な作業であると考えられます。したがって、ソフトウェア エンジニアは、手動デバッグ プロセスを改善するための半自動/全自動のテクニックを必要とします。開発者が障害の発生場所に関するヒントを得ることができれば、デバッグはより効率的になります。

解決

多くのグラフ マイニング アルゴリズム/テクニックは、開発者がソフトウェアの障害を見つけるのに役立ちます。これらの技術は、検出失敗記録と合格記録間の判別グラフに依存します。障害がまれなコード パターンで発生しない場合は、これらのアプローチは適切ではない可能性があります。一方、多くのアプローチでは、主にエラーの可能性があるプログラム コンポーネント (ステートメント インターフェイスや述語インターフェイスなど) をスクリーニングし、疑いの度合いに応じてこれらのコンポーネントをランク付けし、制御フロー グラフに従って実行トレースのコンテキストを配置します。

2. ベンチマークの達成

パフォーマンス ベンチマークは、さまざまな負荷条件下でのアプリケーション コンポーネントとインフラストラクチャのパフォーマンスを決定します。負荷条件には、通常負荷、作業負荷、準負荷、ピーク負荷、ブレークポイント負荷などがあります。ベンチマークとは、特定の範囲内で変動するさまざまなパラメータのルールとしきい値のセットです。従来のアプローチは、一定期間のパフォーマンス データを収集し、機械学習アルゴリズムを通じて上記の関係のモデルを構築し、パフォーマンスの逸脱が発生したときに通知できるようにすぐに展開することです。このアプローチは動きの遅いコンポーネントには適していますが、急速な最新の開発方法は「不合理」になります。

解決

ハイパーコンバージド インフラストラクチャ管理、ドメイン駆動型アプリケーション開発、分散コンピューティングの台頭、多言語プログラミングとメンテナンスにより、ソフトウェア コンポーネントの開発および展開の方法が変わりました。継続的に更新されるソフトウェア コンポーネントは、動的にスケーリングされる基盤インフラストラクチャ上に継続的に展開する必要があります。このパラダイムシフトには、アプリケーションおよびインフラストラクチャ コンポーネントの最新の変更に対応するほぼリアルタイムのデータを使用してモデルを構築する必要があります。これらのモデルでは、新しいルールを学習し、継続的な進化を実現するために、リアルタイムの入力データが必要です。

3. アプリケーション監視

アプリケーション メトリックは、応答時間、1 分あたりのリクエスト数、時間の経過に伴うエラー率を追跡し、傾向を特定します。さらに、CPU 使用率、メモリ使用率、負荷などのインフラストラクチャ パラメータは、インフラストラクチャ層がアプリケーションのさまざまな負荷条件にどのように適応するかを理解するのに役立ちます。アプリケーションの複雑さが増すにつれて、予想されるパターンからの異常の検出が難しくなります。異常を検出できない場合は、プログラムが中断される潜在的なリスクがある可能性があります。

解決

アプリケーション層、サービス層、トランザクション層、外部依存関係など、さまざまな層で変更パターンを検出し、分析できます。まず、正常なシステム動作を構成するものを決定し、次に正常なシステム動作からの逸脱を特定します。インテリジェントな運用では、リソースを正確に検索することで外れ値を正確に特定できるため、リアルタイムの根本原因分析 (RCA) をより適切に実行し、潜在的な停止やインフラストラクチャの障害を回避するのに役立ちます。

4. 早期警告の問題

アプリケーション パフォーマンス モニター (APM) ソフトウェアのインテリジェント アラートは、異常を動的に検出できます。アラートをインテリジェントにするには、検出ソフトウェアがアプリケーションの特性と動作を理解して異常を検出できるように構成可能である必要があります。サービス要求の応答時間が 3 秒を超えた場合にアラートを設定するなど、静的しきい値を設定するのが一般的です。ただし、さまざまなアプリケーションの使用パターンに対して監視する必要がある重要なパラメータとそのしきい値を特定することは、非常に面倒な作業です。したがって、アプリケーションの通常状態のベースラインを設定し、異常な動作が発生したときに通知するためのインテリジェントなアプローチが必要です。

解決

アルゴリズム技術が進歩するにつれて、アラートは非常にスマートになってきています。予備的なデータ分析を実行し、標準偏差、パーセンテージ、予測分析などの予測指標に基づいてアラートを発行できます。今日では、検出ソフトウェアはアプリケーションの動作を理解してベースラインを設定できるほどスマートであり、分析要求が開発者のベースラインから逸脱した場合に開発者が独自の分析戦略を定義し、開発者の注意を必要とする実際の問題がある場合にインテリジェントなアラートを発行できます。

[[323667]]

出典: Pexels

5. 取引追跡

アプリケーション接続間の単純なポイントツーポイントの同期情報交換から、より複雑な非同期通信まで、すべてがビジネス業務の範囲内に含まれます。トランザクションの追跡には、高度な追跡および監視ソリューションが必要です。長期にわたる複数ステップの非同期トランザクションでは、IT インフラストラクチャを転送したり、複数のテクノロジや層にまたがることなどが必要になる場合があります。

解決

複雑なトランザクションは変動性が高く分散していることが多く、ラベル付けや統計的サンプリング手法によって標準的な追跡や分析が役に立たなくなります。インテリジェントな運用と保守は、メソッド呼び出しと個々の情報ペイロード コンテンツを調べることによってトランザクションを関連付け、予想される動作とパフォーマンスにおける今後の脆弱性または既存の脆弱性を直感的に視覚的に表現します。

<<:  専門家レベルの機械学習ツールの推奨事項。専門家と同じものを入手しましょう。

>>:  YOLOプロジェクト復活!マスターが後を継ぎ、YOLOの父が2か月間引退し、v4バージョンが正式にリリースされました

ブログ    

推薦する

強化学習は AGI を実現するのに十分でしょうか?サットン:報酬メカニズムはさまざまな目標を達成するのに十分です

[[405185]]人工知能の分野では、何十年もの間、コンピューター科学者が視覚、言語、推論、運動能...

機械学習が金融業界に与える影響

過去 10 年間で、金融業界ではこれまでにない最先端のテクノロジーが数多く導入されました。この変化は...

...

AIが70年間で急成長した理由が明らかに!タイム誌の4枚の写真がアルゴリズムの進化の謎を明らかにする

過去 10 年間の AI システムの進歩のスピードは驚くべきものでした。 2016年の囲碁対局でアル...

AI ナンバープレート認識 ANPR テクノロジーは人類にどのようなメリットをもたらしますか?

調査によると、世界のANPRシステム市場は2021年から2023年の間に年間9.6%成長すると予想さ...

...

産業用ロボットの開発動向

産業用ロボットは、さまざまな産業用タスクを自動的に実行できる一種の機器として、製造、組み立て、梱包、...

NLPモデル「包括的分析+評価ランキング」、CMUの最新ツールが優れたアイデアを見つけるのに役立ちます

[[396522]] CMU は、復旦大学とオハイオ州立大学の研究者と共同で、モデルの理解度分析と...

AI開発と倫理におけるリアリズムの役割

人工知能(AI)は、最初のコンピュータが発明されて以来、長い道のりを歩んできました。今日、人工知能は...

すべてのデータ サイエンティストが知っておくべき 19 の機械学習アルゴリズム

【51CTO.com 速訳】機械学習アルゴリズム入門機械学習アルゴリズムの分野では、分類には通常次の...

...

今後5年間の15の主要なテクノロジートレンド

私たちの生活、仕事、交流の仕方に革命をもたらす技術の進歩によって、未来は常に形を変えています。今後 ...

...

...

ウーバーの安全担当者が世界初の自動運転車による死亡事故で有罪を認め、3年間の保護観察処分を受ける

海外メディアInsiderによると、8月1日、世界初となる自動運転車による死亡事故でついに判決が下さ...