Pythonで検索アルゴリズムを実装する方法を教えます

Pythonで検索アルゴリズムを実装する方法を教えます

[[439902]]

この記事では、次の検索アルゴリズムについて説明します。

線形探索

バイナリ検索

補間検索

それぞれを詳しく見てみましょう。

1. 線形探索

データを見つけるための最も単純な戦略は線形検索です。線形検索では、各要素を走査してターゲットを見つけ、各データ ポイントにアクセスして一致を見つけ、一致が見つかったときに結果を返し、アルゴリズムはループを終了します。一致が見つからない場合、アルゴリズムはデータの最後まで検索を続けます。線形検索の明らかな欠点は、本質的に網羅的な検索であるため、非常に遅いことです。その利点は、他のアルゴリズムのようにデータをソートする必要がないことです。

線形探索のコードを見てみましょう。

  1. 定義LinearSearch(リスト、項目):
  2. インデックス= 0
  3. 見つかった = False  
  4.  
  5. #各データ要素値を一致させる
  6. インデックス<len(list)見つかったのは 間違い
  7. リスト[インデックス] == 項目の場合:
  8. 見つかった = 
  9. それ以外
  10. インデックス=インデックス+ 1
  11. 戻りが見つかりました

ここで、このコードの出力を見てみましょう (図 3-15 を参照)。

  1. リスト = [12, 33, 11, 99, 22, 55, 90]
  2.  
  3. print(LinearSearch(リスト、12))
  4.  
  5. print(LinearSearch(リスト、91))

▲図3-15

データが正常に見つかった場合、LinearSearch 関数を実行すると True が返されることに注意してください。

  • 線形探索のパフォーマンス: 前述のように、線形探索は、最悪の場合の時間複雑度が O(N) で網羅的な探索を実行する単純なアルゴリズムです。

2. 二分探索

バイナリ検索アルゴリズムの前提条件は、データが順序どおりになっていることです。アルゴリズムは、探している値が見つかるまで、現在のリストを繰り返し 2 つに分割し、最小インデックスと最大インデックスを追跡します。

  1. def BinarySearch(リスト、項目):
  2. 最初= 0
  3. 最後= len(リスト)-1
  4. 見つかった = False  
  5.  
  6. 最初<=最後 そして 見つかりません
  7. 中間点 = (最初+最後) // 2
  8. リスト[中間点] == ​​項目の場合:
  9. 見つかった = 
  10. それ以外
  11. 項目 < リスト[中間点]の場合:
  12. 最後= 中間点-1
  13. それ以外
  14. 最初= 中間点+1
  15. 戻りが見つかりました

出力結果を図3-16に示します。

  1. リスト = [12, 33, 11, 99, 22, 55, 90]
  2.  
  3. sorted_list = BubbleSort(リスト)
  4.  
  5. print(BinarySearch(リスト、12))
  6.  
  7. print(BinarySearch(リスト、91))

▲図3-16

BinarySearch 関数を呼び出すと、入力リスト内に値が見つかった場合に True が返されることに注意してください。

  • バイナリ検索のパフォーマンス: バイナリ検索は、各反復でアルゴリズムがデータを 2 つの部分に分割するため、このように呼ばれています。データに N 個の項目がある場合、反復を完了するには最大 O(log N) ステップかかります。つまり、アルゴリズムの実行時間は O(log N) になります。

3. 補間検索

バイナリ検索の基本的なロジックは、データの中央部分に焦点を当てることです。補間は、ターゲット値を使用してソートされた配列内の要素のおおよその位置を推定する、より複雑な検索です。

例を使って理解してみましょう。英語の辞書で river などの単語を検索する場合、辞書の真ん中までめくって検索を開始するのではなく、この情報を使用して補間し、文字 r で始まる単語の検索を開始します。より一般的な補間ファインダーは次のようになります。

  1. def IntPolsearch(リスト,x):
  2. idx0 = 0
  3. idxn = (len(リスト) - 1)
  4. 見つかった = False  
  5. idx0 <= idxnかつx >= list[idx0]かつx <= list[idxn] の場合:
  6.  
  7. # 中間点を見つける
  8. mid = idx0 + int ((( float (idxn - idx0)/( list[idxn] - list[idx0])) * ( x - list[idx0])))
  9.  
  10. #中間点検索値を比較する
  11. リスト[mid] == xの場合:
  12. 見つかった = 
  13. 戻りが見つかりました
  14.  
  15. リスト[mid] < xの場合:
  16. idx0 = 中間 + 1
  17. 戻りが見つかりました

出力結果を図3-17に示します。

  1. リスト = [12, 33, 11, 99, 22, 55, 90]
  2.  
  3. sorted_list = BubbleSort(リスト)
  4.  
  5. print(IntPolsearch(リスト、12))
  6.  
  7. print(IntPolsearch(リスト,91))

▲図3-17

IntPolsearch 関数を使用する前に、まずソート アルゴリズムを使用して配列をソートする必要があることに注意してください。

  • 補間検索のパフォーマンス: データが不均一に分散されている場合、補間検索アルゴリズムのパフォーマンスは低下し、アルゴリズムの最悪の時間計算量は O(N) になります。データがほぼ均等に分散されている場合、最適な時間計算量は O(log(log N)) です。

著者について: Imran Ahmad は、Google 認定インストラクターであり、長年にわたり Google と Learning Tree で Python、機械学習、アルゴリズム、ビッグデータ、ディープラーニングを専門に教えています。彼は博士号取得を目指しながら、クラウド コンピューティング環境でのリソース割り当てを最適化するための線形計画法に基づいた ATSRA という新しいアルゴリズムを提案しました。彼はほぼ 4 年間、カナダ連邦政府の高度分析研究所で注目を集める機械学習プロジェクトに取り組んできました。

この記事は「すべてのプログラマが知っておくべき 40 のアルゴリズム」から抜粋したもので、出版社の許可を得て公開されています。

<<:  銀行業界の「退化」の原因は人工知能なのか?

>>:  完全な自動運転まであとどれくらいでしょうか?答えはセンサー技術の発展にある

ブログ    

推薦する

2019年の機械学習と人工知能産業の発展動向のレビュー

[[257231]]新年を迎えるにあたり、2019 年を形作る業界のトレンドに注目する時期が来ました...

...

AGI は 1 年以内に登場しますが、人類には 5 年しかありませんか?

OpenAIは今年初めにSoraを発表し、世界中に衝撃を与えた。数年前まではまだ、この大柄なモデル...

...

OpenAIは、歪んだ見解なしにAIが話すようにするために、わずか80のテキストを使用している

[[405587]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

...

無人運転車の現状はどうなっているのでしょうか?

私たちはここ数年、自動運転車について話し合い、議論してきました。しかし、道路上では見かけません。これ...

Java 実装と読み取り/書き込みロック アルゴリズムの考え方

問題の背景: 複数のスレッドが共有リソースへの読み取りおよび書き込みアクセスを実行します。書き込みス...

ネットセレブ列車は強制的に停止させられた。ドローンの操縦はどれほど難しいのか?

最近、「重慶の人気列車がドローンに衝突され停止」する動画がインターネット上で広く出回っている。 [[...

...

画像類似性比較 CLIP または DINOv2

人工知能の分野において、コンピューター ビジョンの 2 大巨頭は CLIP と DINOv2 です。...

IoT人工知能の将来動向

AI と IoT の融合は拡大し続けており、刺激的な将来のトレンドと機会への道を切り開いています。 ...

人工知能が銀行業界の変革を加速します!ビッグデータにより各ユーザーの信用格付けが提供されます!

[[221188]]将来、人工知能が 380 万人以上の銀行員の仕事を全て置き換える日が来るのでし...

マルチモーダル世界モデルで未来を予測!カリフォルニア大学バークレー校の新しいAIエージェントは人間の言語を正確に理解し、SOTAを刷新する

現在、強化学習ベースのエージェントは、「青いレンガを拾う」などの指示を簡単に実行できます。しかし、ほ...