面接でコンシステントハッシュアルゴリズムについて再度質問されました。この答えは面接官を即死させるでしょう!

面接でコンシステントハッシュアルゴリズムについて再度質問されました。この答えは面接官を即死させるでしょう!

[[284994]]

データシャーディング

まずは例を見てみましょう。

多くの場合、キャッシュには Redis を使用し、データ負荷を軽減するために一部のデータをそこに配置します。

データ量が少なく、アクセス負荷が大きくない場合は、通常 1 つの Redis で処理できます。高可用性を実現するには、マスター スレーブで十分です。

データ量が増え、同時実行数が増えると、キャッシュされたデータをすべて 1 台のマシンに置くことが難しくなります。結局のところ、マシンのリソースには限りがあります。通常は、各 Redis にデータをできるだけ均等に分散するクラスター環境を構築します。たとえば、クラスターには 4 つの Redis があります。

では、これらの 4 つの Redis サーバーにデータをできるだけ均等に配置するにはどうすればよいでしょうか。最も簡単な方法は、モジュロ アルゴリズムです。

hash( key ) % N、N は Redis の数です。ここでは N = 4 です。

この方法を使用すると、データを 4 つの Redis サーバーに均等に保存できるため、非常に便利です。新しいリクエストが届いたときに、データがどの Redis サーバーにあるかを特定できるため、キャッシュされたデータを正確にクエリできます。

02データシャーディングで発生する問題

しかし、4 台の Redis サーバーでは不十分であり、さらに 4 台の Redis サーバーが必要です。

剰余アルゴリズムは次のようになります: hash( key ) % 8;

したがって、現在のキャッシュの場所のほとんどは間違っていると想像できます。極端な場合には、キャッシュの雪崩が発生します。

03一貫性ハッシュアルゴリズム

一貫性のあるハッシュ アルゴリズムはこの問題を非常にうまく解決できます。その一般的なプロセスは次のとおりです。

0を始点、2^​​32-1を終点として直線を描き、始点と終点を一致させます。直線は円になり、方向は小さい方から大きい方へ時計回りになります。 0 の右側の最初の点は 1、次は 2 というようになります。

3 つのサーバーの IP アドレスまたはその他のキーワードをハッシュし、モジュロ 2^32 をとった後、それらは必然的にこの円のどこかに収まり、Node1、Node2、および Node3 として記録されます。

次に、データ キーに対して同じ操作を実行すると、必然的に円上のどこかに落ちます。その後、時計回りに進むと、このキーが保存されるサーバーである特定のノードを見つけることができます。

サーバーを追加または削除すると、データの一部のみが影響を受けます。

ただし、ノード数が少なすぎたり、分散が不均一だったりすると、データの偏り、つまりほとんどのデータが特定のサーバーに集中する状態が発生しやすくなります。

データの偏りの問題を解決するために、コンシステント ハッシュ アルゴリズムでは、各サービス ノードに対して複数のハッシュを計算し、それらを円上の異なる位置に配置する [仮想ノード] を提案します。

もちろん、一貫性のあるハッシュ アルゴリズムではほとんどのデータの問題を解決できることもわかります。

<<:  今日の人工知能はすでに販売業界に混乱をもたらしている

>>:  サイバーセキュリティにおける人工知能の役割と6つの製品オプション

ブログ    
ブログ    

推薦する

ChatGPT が 1 周年を迎えました: 革新、論争、AI のブレークスルーの 1 年

テクノロジーの世界を永遠に変えたかもしれない GenAI チャットボットである OpenAI の C...

...

...

...

バッチ正規化の呪い

バッチ正規化は、確かにディープラーニングの分野における大きな進歩の 1 つであり、近年研究者によって...

Google MITの最新の研究は、高品質のデータを入手することは難しくなく、大規模なモデルが最適な方法であることを証明しています。

高品質なデータの取得は、現在の大規模モデルのトレーニングにおける大きなボトルネックとなっています。数...

行列乗算の最適化と畳み込みにおけるその応用

導入天気予報、石油探査、原子物理学などの現代の科学技術は、主にコンピュータシミュレーションに依存して...

...

気候ガバナンスの年、希望はAIにある

[[391671]]気候変動は今日世界が直面している最大の課題となっています。国連は、2021年が地...

近似アルゴリズムとは何ですか?どのような問題に適用されますか?この記事でその答えが分かります

COVID-19パンデミックは世界に多大な変化をもたらし、世界中の科学者や研究者が効果的なワクチンの...

...

台風を恐れる必要はありません。人工知能はすでに私たち自身と敵を理解するのに役立っています。

以前、河南省鄭州市は「花火」がもたらした大雨により洪水災害に見舞われた。こうした背景から、「花火」の...

AIの未来: 汎用人工知能

人工知能を真に理解するために、研究者は、環境に対する人間のような理解を再現できる基礎的な AGI 技...

米国の学区は校内暴力を防ぐためにAIを活用し、脅迫的な言葉を検知して管理者に通知しているが、事前診断率はわずか25%に過ぎない。

アメリカでまた銃撃事件が発生。 5月24日、テキサス州ユバルデのロブ小学校で銃撃事件が発生し、少なく...

多くの人がまだブロックチェーンについて漠然とした理解しか持っていない中、これらのブロックチェーンの応用シナリオはすでに実装されている。

1.ブロックチェーン + IP著作権最近、フェニックスオンライン書店は「フェニックスエッグ」と呼ば...