MySQLインデックスの背後にあるデータ構造とアルゴリズムの原理

MySQLインデックスの背後にあるデータ構造とアルゴリズムの原理

序文

プログラミングの分野では、「プログラム = データ構造 + アルゴリズム」というよく知られたルールがあります。私は個人的にこの意見にあまり賛成できません (プログラムは単なるデータ構造とアルゴリズムの組み合わせではないと思うため) が、日々の勉強や仕事の中で、データ構造とアルゴリズムの重要性を感じています。多くのことにおいて、もう少し深く掘り下げる気があれば、間違いなくさまざまなデータ構造とアルゴリズムの知識に直面することになります。たとえば、ほぼすべてのプログラマーはデータベースを扱う必要があります。データベースがデータの保存、テーブルの作成、インデックスの作成、追加、削除、変更、クエリの実行にのみ使用される場合、データ構造はこれとは何の関係もないと思うかもしれません。しかし、ある日突然、もっと詳しく知りたくなり、データベースを最適化する方法を勉強したいと思ったら、必然的にインデックスの原理を勉強しなければなりません。インデックスの仕組みと、インデックスを合理的に使用してデータベースを最適化する方法を本当に理解したいのであれば、必然的に、さまざまなデータ構造とアルゴリズムに巻き込まれることになります。したがって、「プログラムの中核となる基礎=データ構造+アルゴリズム」と言われれば、私も全く同感です。 達人を目指すプログラマーは、プログラムの中核となる基礎を必ず学ぶでしょう。

さて、ここまで述べてきましたが、私が実際に言いたいのは、データベースのインデックスを明確に学びたいのであれば、データ構造とアルゴリズムを入り口として学ぶ必要があるということです。残念ながら、私はまだインターネット上でデータベースのインデックスを原理レベルから紹介する資料を見つけていません(ここでは学術論文ではなく、一般的な資料のみを参照しています)。ハイレベルのプログラマーがいないわけではありませんが、この点を徹底的に説明できるデータベースの専門家は当社にたくさんいます。ただ、仕事が忙しかったり個人的な興味があったりするため、これらの専門家にはこのテーマに関する記事を書く時間も興味もありません。仕事の都合で、半端なプログラマーである私も、MySQL データベースのインデックスについて急いで勉強してきました。この点についての私の理解は大物たちの理解にはるかに及ばないものの、それでもこの浅い知識をここでまとめておきたいと思います。

まとめ

この記事では、MySQL データベースを研究対象として取り上げ、データベース インデックスに関連するいくつかのトピックについて説明します。 MySQL は多くのストレージ エンジンをサポートしており、さまざまなストレージ エンジンがインデックスに対して異なるサポートを提供していることに特に注意することが重要です。そのため、MySQL データベースは、BTree インデックス、ハッシュ インデックス、フルテキスト インデックスなど、複数のインデックス タイプをサポートしています。混乱を避けるため、この記事では BTree インデックスのみに焦点を当てます。これは、MySQL を使用するときに扱う主なインデックスだからです。ハッシュ インデックスとフルテキスト インデックスについては、この記事では説明しません。

記事の主な内容は3つの部分に分かれています。

***パート 1 では、主にデータ構造とアルゴリズム理論の観点から、MySQL データベース インデックスの数学的基礎について説明します。

パート 2 では、クラスター化インデックス、非クラスター化インデックス、カバーリング インデックスなどのトピックと、MySQL データベースの MyISAM および InnoDB データ ストレージ エンジンのインデックス アーキテクチャ実装の組み合わせについて説明します。

パート 3 では、上記の理論的基礎に基づいて、MySQL でインデックスを高パフォーマンスで使用する戦略について説明します。

コンテンツリンク

MySQL インデックスの背後にあるデータ構造とアルゴリズムの基礎

インデックスの性質

B ツリーと B+ ツリー

B-Tree (B+Tree) を使用する理由は何ですか?

MySQL インデックスのデータ構造とアルゴリズム: インデックスの実装

MyISAM インデックスの実装

InnoDB インデックスの実装

MySQLインデックスの背後にある使用戦略と最適化

サンプルデータベース

最左接頭辞原理と関連する最適化

インデックスの選択性とプレフィックスインデックス

InnoDB 主キーの選択と挿入の最適化

【編集者のおすすめ】

  1. MySQL でインデックス組織構造を作成し最適化するためのアイデア
  2. Weibo: データベースをどのように最適化しますか?
  3. MySQL のヒント: 関連パラメータによる制限の最適化
  4. MySQL データベースの最適化 (パート 2) MySQL データベースの高可用性アーキテクチャ ソリューション
  5. MySQL データベースの最適化 (パート 1) 単一マシンの MySQL データベースの最適化

<<:  STLコンポーネントアルゴリズム

>>:  パフォーマンス最適化技術: アルゴリズム

ブログ    

推薦する

...

「機械学習」CNNを徹底理解

[[212238]]前世紀、科学者は視覚神経のいくつかの特性を発見しました。視神経には局所的な知覚が...

SMOTE アルゴリズムを使用せずに、マルチクラスの不均衡なデータをどのように処理できますか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

企業で文明的な AI を推進するための 6 つのヒント

「文明化された AI」への期待が高まるにつれ、コンサルタントは公平で偏見のないアルゴリズムを作成する...

ドローンを飛ばすことはいつでもできるわけではない

[[354481]]古来より人々は鳥のように青い空を飛ぶことを夢見てきました。子供の頃の紙飛行機であ...

Microsoft Office Family Bucket Edition GPT-4 の価格は月額 30 ドル、Azure は Llama 2 と提携

ここ数カ月、国内外のテクノロジー大手は大規模モデルをめぐって動きを見せているが、OpenAIを所有す...

企業の78%が2022年までにAIを主要な収益源と見なしている

SambaNova Systems が調査した企業の大多数は、2022 年までに AI を主要な収...

機械学習がサイバー脅威に対する最善の武器である理由

攻撃対象領域が拡大し続け、攻撃手法がより高度化するにつれ、セキュリティ業界は現在、深刻な「セキュリテ...

...

シンプルでスマートなアプローチ: Python による顔認識

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

グッドホープ・リンユンは並外れた知恵とビジョンを持っています丨2021グッドホープ・パートナーサミットが桂林で開催されました

2021年9月9日、「大空に舞い上がる希望、素晴らしいビジョンを持つ」2021年グッドホープパートナ...

時空間アルゴリズム研究に基づくビジネス意思決定分析

[[191733]]諺にもあるように、「時間と空間は予測不可能である」。自然界では、時間と空間が急速...