JVM チューニングの概要: 新世代のガベージコレクションアルゴリズム

ガベージコレクションのボトルネック

従来の世代別ガベージコレクション方式では、ある程度、アプリケーションに対するガベージコレクションの負担が最小限に抑えられ、アプリケーションのスループットが限界まで押し上げられていました。しかし、彼が解決できない問題の 1 つは、Full GC によって引き起こされるアプリケーションの停止です。リアルタイム要件が高い一部のアプリケーションシナリオでは、GC 一時停止によって発生する要求の蓄積と要求の失敗は許容されません。このようなアプリケーションでは、リクエストの戻り時間が数百ミリ秒、場合によっては数十ミリ秒以内であることが求められる場合があります。世代別ガベージコレクション方式でこの指標を達成するには、最大ヒープ設定を比較的狭い範囲に制限することしかできません。ただし、これによりアプリケーション自体の処理能力が制限されるため、これも受け入れられません。

世代別ガベージコレクション方式では、リアルタイム要件が考慮され、最大一時停止時間の設定をサポートする同時実行コレクターが提供されます。ただし、世代別ガベージコレクションのメモリパーティショニングモデルの制限により、その効果はあまり理想的ではありません。

リアルタイム要件を満たすために (実際、Java 言語の元の設計は組み込みシステムにも適用されていました)、短い一時停止時間と大きなメモリ空間の割り当ての両方をサポートする新しいガベージコレクションメソッドが登場しています。従来の生成方法によって引き起こされる問題を効果的に解決できます。

増分収集の進化

増分コレクション方式は、従来の世代別方式によって発生する問題を理論的に解決できます。インクリメンタルコレクションは、ヒープスペースを一連のメモリブロックに分割します。使用時には、まずその一部が使用されます（すべてが使用されるわけではありません）。ガベージコレクション中、以前使用された部分の生き残ったオブジェクトは、最後にある未使用スペースに移動されます。これにより、使用しながらコレクションする効果が得られ、従来の世代別方法では、全体が使用された後に回復が中断される状況を回避できます。

もちろん、従来の世代別コレクション方式でも並行コレクションは提供されますが、ヒープ全体をメモリブロックとして扱うという致命的な欠陥があります。一方では、断片化が発生します (圧縮できません)。他方では、各コレクションはヒープ全体のコレクションであり、選択を行うことはできません。一時停止時間の制御は依然として非常に弱いです。インクリメンタル方式では、メモリ空間をブロックに分割することで上記の問題を解決できます。

ガーベッジファイアスト（G1）

この部分の内容は主にこちらを参考にしています。この記事はG1アルゴリズム論文の解釈です。何も追加しませんでした。

ターゲット

設計目標の観点から見ると、G1 は大規模なアプリケーションに完全に対応しています。

非常に高いヒープ スループットをサポート-- 複数の CPU とガベージ コレクション スレッドをサポート -- メイン スレッドが一時停止しているときに並列コレクションを使用 -- メイン スレッドの実行中に同時コレクションを使用リアルタイム目標: N ミリ秒以内に最大 M ミリ秒のガベージ コレクションを実行するように構成可能

もちろん、リアルタイム要件を満たすために、G1 では従来の世代リサイクルアルゴリズムに比べてパフォーマンスが多少低下します。

アルゴリズムの詳細な説明

G1は多くの企業の強みを学び、完璧を目指して努力してきたと言えます。増分コレクションを活用し、ヒープ全体を同じサイズの領域に分割します。メモリの回復と分割はリージョンに基づいています。同時に、CMS の特性も吸収し、ガベージコレクションプロセスをいくつかの段階に分割して、ガベージコレクションプロセスを分散します。さらに、G1 は世代別ガベージコレクションの考え方にも賛同しており、異なるオブジェクトには異なるライフサイクルがあり、異なる方法で収集できると考えています。そのため、世代別ガベージコレクションもサポートしています。リサイクル時間の予測可能性を実現するために、G1 は領域をスキャンした後、その中のアクティブオブジェクトのサイズをソートし、最初にアクティブオブジェクトが小さい領域を収集して、スペースをすばやく再利用します (コピーするアクティブオブジェクトが少ない)。アクティブオブジェクトは小さいため、そのほとんどはガベージと見なすことができます。そのため、この方法は Garbage First (G1) ガベージコレクションアルゴリズム、つまりガベージ優先コレクションと呼ばれます。

リサイクル手順:

初期マーキング

G1 は各領域に 2 つのマーキングビットマップを保存します。1 つは前のマーキングビットマップ、もう 1 つは次のマーキングビットマップです。ビットマップには、オブジェクトの開始点を指すアドレス情報のビットが含まれています。

初期マーキングを開始する前に、まず次のマーキングビットマップを同時にクリアし、すべてのアプリケーションスレッドを停止し、各領域でルートから直接アクセスできるオブジェクトをスキャンして識別し、領域のトップ値をマーク開始時の次のトップ (TAMS) に入れて、すべてのアプリケーションスレッドを再開します。

このステップの実行をトリガーする条件は次のとおりです。

G1 は、JVM ヒープサイズのパーセンテージしきい値 h と、(1-h)*ヒープサイズである別の H を定義します。現在、h の値は固定されていますが、G1 は将来的にこれを動的に変更し、JVM の動作に応じて動的に調整する可能性があります。世代モードでは、G1 は u とソフトリミットも定義し、ソフトリミットの値は Hu*ヒープサイズです。ヒープで使用されるメモリがソフトリミット値を超えると、クリーンアップが完了した後、アプリケーションで許可されている GC 一時停止時間内にこのステップができるだけ早く実行されます。純粋モードでは、G1 はマーキングとクリーンアップでリングを形成し、クリーンアップがマーキング情報を十分に活用できるようにします。クリーンアップがリサイクルを開始すると、最初にメモリスペースを最も多く使用できる領域がリサイクルされます。クリーンアップを複数回実行した後、スペースの少ない領域がリサイクルされると、G1 はマーキングとクリーンアップで構成される新しいリングを再初期化します。

同時採点

前回の初期マーキングによってスキャンされたオブジェクトは、これらのオブジェクトの基になるオブジェクトのアクティブステータスを識別するためにトラバースされます。この期間中にアプリケーションスレッドによって同時に変更されたオブジェクトの依存関係は、記憶セットログに記録されます。新しく作成されたオブジェクトは、トップ値よりも高いアドレス範囲に配置されます。これらの新しく作成されたオブジェクトのデフォルトステータスはアクティブであり、トップ値は同時に変更されます。

最終採点一時停止

アプリケーションスレッドの記憶セットログがいっぱいでない場合は、いっぱいになった RS バッファーには格納されません。この場合、これらの記憶セットログに記録されたカードの変更は更新されるため、この手順が必要になります。この手順で実行する必要があるのは、アプリケーションスレッドで記憶セットログの内容を処理し、それに応じて記憶セットを変更することです。この手順では、アプリケーションを一時停止して並行して実行する必要があります。

ライブデータのカウントとクリーンアップ

G1 では、クリーンアップステップは必ずしも最終マーキング一時停止の実行後に実行されるわけではないことに注意してください。このステップではアプリケーションを一時停止する必要があるため、準リアルタイム要件を満たすには、G1 はユーザーが指定した最大 GC 一時停止時間に基づいてクリーンアップをいつ実行するかを適切に計画する必要があります。さらに、このステップの実行をトリガーする状況は他にもいくつかあります。

G1 はコピー方式を使用して収集し、その都度「to space」のスペースが十分であることを確認する必要があります。そのため、G1 が採用する戦略は、使用済みメモリスペースが H に達したときに Cleanup ステップを実行することです。完全ヤング世代モードと部分ヤング世代モードの G1 では、Cleanup の実行をトリガーする状況もあります。完全ヤングモードでは、G1 はアプリケーションの許容可能な一時停止時間とヤングリージョンのリサイクルに必要な時間に基づいて、ヤングリージョンの数を推定します。JVM 内のオブジェクトに割り当てられたヤングリージョンの数がこの値に達すると、Cleanup が実行されます。部分ヤングモードでは、アプリケーションの許容可能な一時停止時間の範囲内で可能な限り頻繁に Cleanup が実行され、ヤングでないリージョンの Cleanup は最大限に実行されます。

見通し

将来的には、JVM のチューニングでは G1 アルゴリズムにさらに重点を置く必要があるかもしれません。

オリジナルリンク: http://pengjiaheng.iteye.com/blog/548472

【編集者のおすすめ】

JVM チューニングの概要: 一般的な構成例
JVM チューニングの概要: 世代別ガベージコレクションの詳細
JVM チューニングの概要: ガベージコレクションが直面する問題
JVM チューニングの概要: 基本的なガベージコレクションアルゴリズム
JVM チューニングの概要: いくつかの概念

<<: 簡単なアルゴリズムからアセンブリ言語の予備的研究

>>: JVM チューニングの概要: 基本的なガベージコレクションアルゴリズム

世界自動運転年間「強さ」リストが発表、百度がウェイモを抜いて首位に、ウェイモ：評価基準に反対

ブログ

JVM チューニングの概要: 新世代のガベージコレクションアルゴリズム

世界自動運転年間「強さ」リストが発表、百度がウェイモを抜いて首位に、ウェイモ：評価基準に反対

Microsoft と Meta が提携し、Bing 検索を Meta AI チャットボットに統合

マスク氏のChatGPTバージョンが急成長中！ Pythonなしで11人が2か月間懸命に働いた

AIの次の目的地：洗練された生活シナリオのインテリジェント時代

LLaMA のコアオリジナルクリエイターのほとんどが辞職し、Meta AI の内部事情が暴露されました!計算能力をめぐる争いが勃発し、大規模モデルチームのメンバーは3度も入れ替わった

Metaverse と Web3 は似ていますが、最も重要な違いは何でしょうか?

ディープラーニングと機械学習の違いを理解する

大規模モデルの推論速度が 3.6 倍に向上しました。「Medusa」の論文はこちらです。Jia Yangqing: 最もエレガントな加速推論ソリューションの 1 つ

推薦する

機械学習のパフォーマンスを最適化するために必要な 6 つの指標

HAProxy ロードバランサの構成とアルゴリズム

人工知能と機械学習の違いと影響は何ですか?

【WOT2018】蘇寧ドットコム高超：AI技術＋短編動画を電子商取引プラットフォームに応用

世界のトラフィック量上位50のAIウェブサイトが発表：ChatGPTなどの会話型製品が目立ち、ユーザーは主にライトな体験を利用

C#アルゴリズムに関する面接の質問の簡単な分析

5Gのサポートにより、AIの顔を変えること以外に人工知能は何ができるのでしょうか?

9つの思考フレームワーク：ChatGPTの使用能力を100倍向上させる

AIとIoTが交通管理をどう変えるのか

機械学習の落とし穴を避ける: データはアルゴリズムよりも重要

機械学習の4つの異なるカテゴリの概要