Linux カーネルのメモリ管理アルゴリズム Buddy と Slab

[[251667]]

バディ割り当てアルゴリズム

これはページフレームの連続セクションであると仮定します。網掛け部分は、使用されているページフレームを示します。次に、5 つのページフレームの連続セクションを申請する必要があります。この時点で、このメモリセグメント内に 5 つの連続した空きページフレームが見つからない場合は、別のメモリセグメントを使用して 5 つの連続したページフレームを検索します。これにより、時間の経過とともにページフレームが無駄になります。この状況を回避するために、Buddy システムアルゴリズムが Linux カーネルに導入されました。すべての空きページフレームは 11 個のブロックリストにグループ化され、各リストには 1、2、4、8、16、32、64、128、256、512、および 1024 個の連続したページフレームのサイズのページフレームブロックが含まれます。最大 1024 の連続ページフレームを適用でき、これは 4 MB の連続メモリに相当します。各ページフレームブロックの最初のページフレームの物理アドレスは、図に示すように、ブロックサイズの整数倍になります。

256 ページフレームのブロックを申請する場合、まず 256 ページフレームのリンクリストで空きブロックを探します。見つからない場合は、512 ページフレームのリンクリストで探します。見つかった場合は、ページフレームブロックを 256 ページフレームの 2 つのブロックに分割し、1 つはアプリケーションに割り当て、もう 1 つは 256 ページフレームのリンクリストに移動します。 512 ページフレームのリンクリストにまだ空きブロックがない場合は、1024 ページフレームのリンクリストの検索を続行します。それでも空きブロックがない場合は、エラーが返されます。ページフレームブロックが解放されると、連続する 2 つのページフレームブロックがアクティブにマージされ、より大きなページフレームブロックになります。

上記から、Buddy アルゴリズムがページフレームを分割および結合していることがわかります。 Buddy アルゴリズムは、世界中のあらゆる正の整数が 2^n の合計で構成できるという事実を利用している点で優れています。これは、空きページテーブルを管理する Buddy アルゴリズムの本質でもあります。

次のコマンドで空きメモリ情報を取得できます。

また、 echo m > /proc/sysrq-trigger を使用して、/proc/buddyinfo の情報と一致する buddy ステータスを観察することもできます。

ＣＭＡ

注意深い読者は、Buddy アルゴリズムがメモリを分割して結合すると断片化が発生し、メモリには連続した大きなメモリブロックがなくなり、小さなメモリブロックのみになることに気付くでしょう。もちろん、これはアプリケーションには影響しません (前述したように、ページテーブルを使用すると、不連続な物理アドレスを仮想アドレスで連続させることができます)。ただし、カーネルモードで連続したメモリの大きなブロックを取得する方法はありません (たとえば、DMA、カメラ、GPU はすべて、連続した物理アドレスを持つ大きなメモリブロックを必要とします)。

CMA は、上記の問題を解決するために、組み込みデバイスで一般的に使用されます。 CMA の正式名称は連続メモリアロケータです。その動作原理は、メモリのセクションがドライバーが使用するために予約されていますが、ドライバーが使用されていない場合は、CMA 領域をユーザープロセスに割り当てて、匿名メモリまたはページキャッシュとして使用できるというものです。ドライバーが使用する必要がある場合、プロセスによって占有されているメモリはリサイクルまたは移行され、ドライバーが使用するために以前に占有されていた予約済みメモリが解放されます。

スラブ

Linux では、バディシステムがページ単位でメモリを管理および割り当てます。しかし、実際の需要はバイト単位です。20 バイトを適用する必要がある場合、1 ページを割り当てることはできません。これはメモリの重大な無駄になります。では、どのように割り当てるのでしょうか? 小さなメモリ割り当て用に特別に設計されたスラブアロケータが誕生しました。スラブアロケータはバイト単位でメモリを割り当てます。ただし、スラブアロケータはバディシステムから逸脱するものではなく、バディシステムによって割り当てられた大きなメモリを小さなメモリ割り当てにさらに細分化します。まずは写真を見てみましょう

kmem_cache は、キャッシュを記述する cache_chains のリンクリストです。各 cache_chains には、通常は連続したメモリブロックであるスラブのリストが含まれます。スラブには 3 つの種類があります。

slabs_full (完全に割り当てられたスラブ)
slabs_partial (部分的に割り当てられたスラブ)
slabs_empty (空のスラブ、またはオブジェクトが割り当てられていません)。

スラブはスラブアロケータの最小単位です。実装では、スラブは 1 つ以上の連続した物理ページ (通常は 1 ページのみ) で構成されます。単一のスラブをスラブリスト間で移動できます。たとえば、半分いっぱいのスラブがオブジェクトの割り当て後にいっぱいになった場合、そのスラブは slabs_partial から削除され、slabs_full に挿入されます。

さらに詳しく説明すると、struct kmem_cache 構造体によって記述されるメモリのセクションがスラブキャッシュプールと呼ばれることを示す例がここにあります。スラブキャッシュプールは牛乳の箱のようなものです。箱の中には牛乳のボトルがたくさん入っており、それぞれの牛乳のボトルがオブジェクトになっています。メモリを割り当てるときは、牛乳パックからボトルを取り出すようなものです。いつかすべてがなくなる日が来るでしょう。箱が空になったら、スーパーマーケットに行って別の箱を買う必要があります。スーパーマーケットは部分リンクリストに相当し、スーパーマーケットには牛乳の箱がたくさん保管されています。スーパーマーケットで商品が売り切れた場合は、当然メーカーから商品を仕入れて販売することになります。メーカーはパートナーシステムに相当します。

次のコマンドを使用して、スラブキャッシュ情報を表示できます。

要約する

メモリ DDR をさまざまなゾーンに分割することから、CPU がアクセスするページをページテーブルを介してゾーンにマッピングすること、そしてこれらのページを Buddy アルゴリズムと Slab アルゴリズムを介して管理することまで、次の図を感覚的な観点から理解できるはずです。

<<: 「人工バカ」、いつまで我慢できるの？

>>: マイクロソフト、機械学習モデル向けの高性能推論エンジン ONNX をオープンソース化

ブログ

米国の5大テクノロジー企業は研究開発に22億ドルを費やしました。アマゾンは732億で世界1位、メタは30%で最高割合を占める

Linux カーネルのメモリ管理アルゴリズム Buddy と Slab

米国の5大テクノロジー企業は研究開発に22億ドルを費やしました。アマゾンは732億で世界1位、メタは30%で最高割合を占める

マイクロソフトが小型モデルに推論の高度なバージョンを教える: Orca 2 のパフォーマンスはパラメータモデルの 10 倍に匹敵し、オープンソース化

快手科技のY-tech AI Labが「2019 CCF科学技術賞」を受賞

研究者は特別な画像を使って人工知能を「毒する」

OpenAI取締役会の爆発的な活動が暴露される！投資家は訴訟の準備をしている、ネットユーザー：GPT-4はあなたよりも人を解雇するのが得意

人工知能システムが薬剤耐性菌を殺す新しい抗生物質を発見

推薦する

フロントエンド人工知能: 機械学習による関数方程式の導出 - プラチナ III

シリコンバレーの天才たちの没落: 才能から始まり、利益に転落し、「賢さ」のせいで失敗した

米国は中国のAI企業に対する制裁で目的を果たせなかったのか？

アリババDAMOアカデミーが新しいオープンソースフレームワークを開設：プライバシー保護コンピューティングの分野に参入し、フェデレーテッドラーニングが大手プレーヤーを迎える

エッジ vs. クラウド: どちらの AI インフラストラクチャを選択すべきか?

5つのリソースカテゴリー：大規模言語モデルのリソース効率を向上させる方法、超詳細なレビューはこちら

データサイエンティストが最もよく使用するアルゴリズム10選

王小川の大型模型製作の秘密のレシピが初めて公開されました。5つのステップ、完成まで2か月

固有値分解から共分散行列へ: PCA アルゴリズムの詳細な分析と実装

AIとIoTの相互運用性に対する需要は2021年も増加し続ける

持続可能なAI: イノベーションと環境責任のバランス

iOS 18はAIネイティブシステムの第1世代となるか？ AppleはAIをシステムに導入することを急いでおり、史上最大のアップデートを先導している。