エントリーレベルのデータベースアルゴリズム [パート 2]

エントリーレベルのデータベースアルゴリズム [パート 2]

前回の記事「エントリーレベルのデータベースのアルゴリズム [I]」では、いくつかのデータ アルゴリズムを紹介しました。ここでは、引き続きいくつかの基本的なソート アルゴリズムを紹介します。

バブルソート

使用条件:コレクションの要素はサイズを比較できます

アルゴリズムのアイデア:ソートするレコードを継続的にスキャンします。スキャンするたびに、最小のレコードが見つかり、それが一番上に近づきます。各スキャンではレコードが最終的な最も正しい位置に配置されるため、次のスキャンではレコードを再確認する必要がありません。

プログラミング例: int b[10]={77,1,65,13,​​81,93,10,5,23,17} はバブルソートされます(ここで概念を混同していました。指摘してくれた zdd に感謝します)

  1. //バブルソート 
  2. voidバブル( int b[10])
  3. {
  4.     整数温度;
  5.     整数i;
  6.      (i=9;i>0;i--)の場合
  7. {
  8.          ( int j=0;jの場合
  9. {
  10.              (b[j]>b[j+1])の場合
  11. {
  12. temp = b[j];
  13. b[j] = b[j+1];
  14. b[j+1] = 一時;
  15. }
  16. }
  17. }
  18. cout<< "ソートは次のようになります:" ;
  19.      ( int i=0;i<10;i++ )の場合
  20. {
  21. カウント< " " ;
  22. }
  23. カウント<
  24. }

パフォーマンス分析:時間計算量 O(n^2)

シェルソート

使用条件:コレクションの要素はサイズを比較できます

アルゴリズムのアイデア:まず、ソートするレコードのシーケンス全体をいくつかのサブシーケンスに分割し、それぞれに対して直接挿入ソートを実行します。シーケンス全体のレコードが「基本的に順序付けられている」場合は、すべてのレコードに対して直接挿入ソートを実行します。サブシーケンスは単に「セグメントに分割」されるのではなく、特定の「増分」で区切られたレコードによってサブシーケンスが形成されます。そのため、比較して並べ替えるときに、キーワードが小さいレコードは段階的に前に進むのではなく、一定の増分で移動します。「増分」は減少傾向を示し、最終的にこの「増分」は常に 1 になります。このとき、シーケンスは基本的に順序付けられており、並べ替えを完了するために必要な比較と移動はわずかです。シェルソートの増分設定がわかりにくい。一般的に、8 つの数字の「増分」を 4、2、1 に設定することを検討します。 (これはシェルソートの一般的な設定です)。次に、「増分」h(n+1)=3*h(n)+1 を計算する式を作成します (h>N/9 で停止)。この式は増分には最適ではないかもしれませんが、一般的な「増分」設定には適用できます。数字が 8 個ある場合、ここでの増分は 1 です。

プログラミング例: int b[10]={77,1,65,13,​​81,93,10,5,23,17}はシェルをソートする

//ヒルソートの自動増分は自分で選択する必要があります

  1. void シェルソート( int b[10])
  2. {
  3.    整数h,i;
  4.    整数n=10;
  5. //このループを通して、1と4への増分を計算します
  6.     (h=1;h<=n/9;h=3*h+1)の場合
  7. //インクリメントループ
  8.     (;h>0;h/=3)の場合
  9. {
  10.        (i=h;iの場合
  11. {
  12.          整数j、 temp ;
  13.          温度=b[i];
  14. // ソートを挿入
  15.           (j=ih;j>=0;j=jh)の場合
  16. {
  17. b[j]> temp場合
  18. {
  19. b[j+h]=b[j];
  20. }
  21.             それ以外 
  22. {
  23. 壊す;
  24. }
  25. }
  26. b[j+h] =温度;
  27. }
  28. }
  29. cout<< "ソートは次のようになります:" ;
  30.     ( int i=0;i<10;i++ )の場合
  31. {
  32. カウント< " " ;
  33. }
  34. カウント<
  35. }

パフォーマンス分析:ヒルソートの時間計算量は少々複雑です。特定の「増分」に応じて変化します。ここでは、著者は Yan Weimin の「データ構造」から O(n^3/2) を使用しています。

クイックソート

使用条件:同等のサイズのコレクション。

アルゴリズムのアイデア:ソート パスを通じて、ソートするレコードは 2 つの独立した部分に分割されます。レコードの一方の部分のキーワードがもう一方の部分のキーワードよりも小さい場合、レコードの 2 つの部分を別々にソートして、最終的に順序付けられたシーケンスに到達できます。ここで重要なポイントは、セグメンテーションの「ベンチマーク」を選択することです。この「ベンチマーク」より大きい場合は 1 つの部分に分割し、この「ベンチマーク」より小さい場合は 1 つの部分に分割する必要があります。ここで、著者はデフォルトでこの部分の最初のレコードを「ベンチマーク」として使用します。

例: int b[10]={77,1,65,13,​​81,93,10,5,23,17}

  1. //クイックソート
  2. void クイックソート( int *b, int下限, int上限)
  3. {
  4. //スワップ関数
  5. void Sawp( int *a, int *b);
  6.     古い低= 低値;
  7.     古い高=高;
  8. 低い
  9. {
  10. while(*(b+high)>*(b+low)&&low --;  
  11. Sawp(b+low,b+high);
  12. while(*(b+low)<*(b+high)&&low
  13. Sawp(b+low,b+high);
  14. }
  15. if(古い低
  16. {
  17. クイックソート(b,Old_low,low-1);
  18. }
  19. if(高+1
  20. {
  21. クイックソート(b,high+1,Old_high);
  22. }
  23. }
  24. //スワップ関数
  25. void Sawp( int *a, int *b)
  26. {
  27.     整数 温度;
  28.     温度=*a;
  29. *a=*b;
  30. *b=一時;
  31. }

パフォーマンス分析:時間計算量 O(nlogn)

これまで、一般的な基本的なデータ検索およびソートアルゴリズムを紹介してきましたが、これらは最も基本的なアルゴリズムであり、そこから多くのアルゴリズムを拡張することができます。

オリジナルリンク: http://www.cnblogs.com/couhujia/archive/2011/03/24/1993373.html

【編集者のおすすめ】

  1. データマイニングにおける10の古典的なアルゴリズムの予備的調査
  2. 現在世界で最も重要な古典的アルゴリズムトップ10
  3. 面接中にアルゴリズムの質問を解く際にプログラマーが知っておくべきこと
  4. 初級データベースアルゴリズム [I]

<<:  エントリーレベルのデータベースアルゴリズム [パート 3]

>>:  初級データベースアルゴリズム [I]

ブログ    

推薦する

ロボットは感染症の蔓延を抑制するためにどのように役立つのでしょうか?

COVID-19の時代において、ロボット工学とテクノロジーは協力して伝染性ウイルスの拡散を防いでい...

5G悪報セキュリティ管理プラットフォームにおけるディープラーニングに基づくテキスト感情認識技術の応用

著者: Sun Yue、所属部署: 中国移動 (杭州) 情報技術有限公司 | 中国移動杭州 R&am...

Python で KNN アルゴリズムを使用して欠損データを処理する

欠損データの処理は簡単な作業ではありません。 方法は、単純な平均補完や観察結果の完全な削除から、MI...

...

米国労働統計局は機械学習を使用してデータコーディングを自動化しています

政府機関には常にさまざまな文書が詰まっていますが、その多くは紙の文書であり、電子文書であっても、実際...

素人の私でも、機械学習コミュニティのこれらの問題が分かります

「分野が違えば意味も違う」とよく言われます。機械学習コミュニティは部外者から見るとどのように見えるの...

リアルタイム6自由度オブジェクトトラッキングを実現するDeepACが登場

本記事では、国立国防科技大学の劉宇教授チームと浙江大学-SenseTime合同研究室の周暁偉教授チー...

ガートナーは、人間と機械の境界を曖昧にする5つの新たな技術トレンドを明らかにした。

世界有数の情報技術調査・コンサルティング会社であるガートナーが発表した「2018年新興技術ハイプサイ...

[NCTS サミットレビュー] Li Yuanchun: 自動テストにおける強化学習の応用

2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...

...

モデル圧縮率95%、MIT Han Songらが新しいLite Transformerを提案

Transformer の高性能は非常に高い計算能力に依存しており、モバイル NLP に大きな制限が...

機械故障診断における人工知能の応用方向

機械の故障診断における人工知能の応用方向を次に示します。 [[342398]] 1. 機械故障診断に...

このアルゴリズムに関する優れた本を読めば、AIを本当に理解できる

[[240202]]新しい技術を学ぶとき、多くの人は公式ドキュメントを読み、ビデオチュートリアルやデ...

...