Java プログラミングスキル - データ構造とアルゴリズム「多方向検索ツリー」

Java プログラミングスキル - データ構造とアルゴリズム「多方向検索ツリー」

[[391530]]

二分木問題の分析

バイナリツリーは動作効率が高いですが、問題点もあります。次のバイナリツリーをご覧ください

バイナリツリーをメモリにロードする必要があります。バイナリツリーのノード数が少ない場合は問題ありません。ただし、バイナリツリーのノード数が多い場合 (たとえば 1 億)、次の問題が発生します。

バイナリツリーを構築する場合、複数の I/O 操作が必要となり (大量のデータがデータベースまたはファイルに保存されます)、ノードの数が膨大になるとツリーの構築速度に影響します。
ノードの数が多いとバイナリツリーの高さも非常に高くなり、操作速度が低下します。

多枝ツリー

バイナリツリーでは、各ノードにはデータ項目と最大 2 つの子ノードがあります。各ノードにさらに多くのデータ項目とノードを含めることができる場合、それは多方向ツリーです。
たとえば、2-3 ツリーと 2-3-4 ツリーは多分岐ツリーです。多分岐ツリーは、ノードを再編成し、ツリーの高さを減らすことで、バイナリツリーを最適化できます。
例えば（下の2-3ツリー）は多分岐ツリーです

Bツリーの基本的な紹介

B-Tree ツリーは B ツリーであり、B は Balanced (バランス) の略です。 MySQL では、特定のタイプのインデックスは、次に示すように B ツリーまたは B+ ツリーに基づいています。

Bツリーの説明:

B ツリーの次数は、ノードの子ノードの最大数です。たとえば、2-3 ツリーの次数は 3 で、2-3-4 ツリーの次数は 4 です。
B ツリー検索: ルートノードから開始して、ノード内のキーワード (順序付き) シーケンスに対してバイナリ検索を実行します。ヒットが見つかった場合、検索は終了します。ヒットしない場合は、クエリキーワードが属する範囲に子ノードを入力します。対応する子ポインタが空になるか、すでにリーフノードになるまで繰り返します。
キーワードセットはツリー全体に分散されます。つまり、リーフノードと非リーフノードの両方にデータが格納されます。
検索は非リーフノードで終了する可能性がある
その検索パフォーマンスは、キーワードのセット全体に対してバイナリ検索を実行するのと同等です。

B ツリーは、ノードを再編成し、ツリーの高さを減らし、I/O 読み取りと書き込みの数を減らすことで効率を向上させます。

図に示すように、B ツリーはノードを再編成することでツリーの高さを削減します。
ファイルシステムおよびデータベースシステムの設計者は、ディスク事前読み取りの原則を使用して、ノードのサイズをページと同じサイズ (ページサイズは通常 4k) に設定し、各ノードを 1 回の I/O だけで完全にロードできるようにします。
ツリーの次数 M (ツリー内の親ノードが持つ子ノードの最大数) を 1024 に設定します。600 億の要素のうち、必要な要素は最大 4 回の I/O 操作で読み取ることができます。B ツリーは、ファイルストレージシステムやデータベースシステムで広く使用されています。

B+ツリーの基本紹介

B+ ツリーは B ツリーのバリエーションであり、多方向検索ツリーでもあります。

B+ツリーの説明:

B+ ツリーの検索は基本的に B ツリーと同じです。違いは、B+ ツリーはリーフノードのみにヒットできることです (B ツリーは非リーフノードにヒットできます)。そのパフォーマンスは、キーワードセット全体に対するバイナリ検索と同等です。
すべてのキーワードは、リーフノードのリンクリストに表示されます (つまり、データはリーフノード (高密度インデックスとも呼ばれます) にのみ存在します)。また、リンクリスト内のキーワード (データ) は順序付けられています。
非リーフノードをヒットすることは不可能です。
非リーフノードはリーフノードのインデックス (スパースインデックス) に相当し、リーフノードは (キーワード) データを格納するためのデータレイヤーに相当します。
ファイルインデックスシステムに適しています。
B ツリーと B+ ツリーにはそれぞれ独自のシナリオがあります。B+ ツリーが B ツリーよりも完全に優れているとは言えませんし、その逆も同様です。

B*ツリーの基本紹介

B* ツリーは B+ ツリーのバリエーションであり、B+ ツリーのルート以外のノードとリーフ以外のノードに兄弟へのポインターを追加します。

Bツリーの説明: *

B* ツリーでは、非リーフノードキーワードの数が少なくとも (2/3)*M であること、つまり最小ブロック使用量が 2/3 であることが定義されていますが、B+ ツリーの最小ブロック使用量は 1/2 です。
最初の特性から、B* ツリーでは新しいノードが割り当てられる確率が B+ ツリーよりも低く、スペース利用率が高いことがわかります。

2-3 ツリーの基本的な紹介（最も単純な B ツリー）

2-3 ツリーは最も単純な B ツリー構造であり、次の特性があります。

2-3 ツリーのすべてのリーフノードは同じレベルにあります。（Bツリーであればこの条件は満たされます）
2 つの子ノードを持つノードは 2 ノードと呼ばれます。2 ノードには子ノードがないか、子ノードが 2 つあります。
3 つの子ノードを持つノードはトリプルノードと呼ばれます。トリプルノードには子ノードがないか、または 3 つの子ノードがあります。
2-3は2つのノードと3つのノードで構成されるツリーです。

2-3 ツリー挿入ルール:

2-3 ツリーのすべてのリーフノードは同じレベルにあります。 (B ツリーである限り、この条件は満たされます)。
2 つの子ノードを持つノードは 2 ノードと呼ばれます。2 ノードには子ノードがないか、子ノードが 2 つあります。
3 つの子ノードを持つノードはトリプルノードと呼ばれます。トリプルノードには子ノードがないか、または 3 つの子ノードがあります。
ルールに従ってノードに数字が挿入されたとき、上記の 3 つの要件を満たせない場合は、解体する必要があります。まず上に向かって解体します。上層がいっぱいの場合は、現在の層を解体します。解体後も、上記の 3 つの条件が満たされている必要があります。
3 ノードのサブツリーの値のサイズは、依然として (BST バイナリソートツリー) の規則を満たしています。

<<: 人工知能：「全能」ではない

>>: 倉庫の自動化は人気が高い。ソフトバンクは28億ドルを投じてオートストアの40％を買収した。

ブログ

JD.com は今後 10 年間で従業員の 50% を解雇するでしょうか?ジャック・マー氏も人工知能が仕事を奪うことについて言及している

JD.com は今後 10 年間で従業員の 50% を解雇するでしょうか?ジャック・マー氏も人工知能が仕事を奪うことについて言及している

ブログ

マイクロモード動的顔認識制御システムソリューション

マイクロモード動的顔認識制御システムソリューション

ブログ

ブログ

ロボットは電気羊の夢を見るか？Google AI 従業員の辞職から AI 倫理について何を学ぶことができるか？

ロボットは電気羊の夢を見るか？Google AI 従業員の辞職から AI 倫理について何を学ぶことができるか？

ブログ

OpenAI が深夜に 5 つのモデルアップデートを割引価格でリリースします。

OpenAI が深夜に 5 つのモデルアップデートを割引価格でリリースします。

ブログ

自然言語処理の核心：シーケンス学習

自然言語処理の核心：シーケンス学習

ブログ

ブログ

顔認識は安全ですか?どのような個人情報を慎重に保護すべきでしょうか?

顔認識は安全ですか?どのような個人情報を慎重に保護すべきでしょうか?

ブログ

脳と機械の統合の時代が到来し、人類の文明は急速に発展するだろう

脳と機械の統合の時代が到来し、人類の文明は急速に発展するだろう

ブログ

推薦する

...

トランスフォーマー後継モデル！ MSRA が新しい大規模モデルインフラストラクチャを提案: 推論速度が 8 倍に向上し、メモリ使用量が 70% 削減

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載...

人工知能開発の現状と将来動向の分析

人工知能、またはよく「AI」（英語の正式名称：Artificial Intelligence）と呼ば...

私の国の人工知能の医療応用シナリオは非常に人気があり、既存の実践では依然として3つのボトルネックを突破する必要があります。

[[261498]]私の国には1,100社以上の人工知能企業があります。人工知能の最もホットな分野...

IBMの人工知能システム「プロジェクト・ディベーター」が両討論会で勝利

海外メディアの報道によると、IBMは人工知能システム「プロジェクト・ディベーター」をリリースし、経験...

左に狂気、右に合理性、真ん中にアルゴリズム

著者: Qianshan校正：ウー・ムーテクノロジーの進歩により、AIは大きな発展の可能性を示してい...

20年後にはロボットが手術を行えるようになる

「1か月で10年分の変化を目撃しました。」 COVID-19パンデミック中に遠隔医療の利用が加速した...

より良い生活を実現するために、Hongheの2019年の新製品が発売されました

最近、「Honhe AI、生活をより良くする--Honheグループ2019年新製品発表会」が成都で開...

...

...

...

...

協働ロボットは従来のロボットとどう違うのでしょうか?

協働ロボットは従来のロボットとどう違うのでしょうか? [[418520]]本質的には、協働ロボットと...

Google が 3,300 万ドルを投じて 5 年間の脳プロジェクトを開始!マウスの脳の2～3%をマッピング、エベレスト山とほぼ同じデータ量

人間の脳は、数十億個の細胞のネットワークで構成された、存在する最も複雑なコンピューターです。これまで...

トポロジカルデータ分析（TDA）は、人工知能のブラックボックスを破ると期待される魔法のアルゴリズムです。

本稿では、トポロジカルデータ分析 (TDA) の基本原理を紹介し、事例を示し、この方法が視覚分析を効...