Pythonで検索アルゴリズムを実装する方法を教えます

Pythonで検索アルゴリズムを実装する方法を教えます

[[439902]]

この記事では、次の検索アルゴリズムについて説明します。

線形探索

バイナリ検索

補間検索

それぞれを詳しく見てみましょう。

1. 線形探索

データを見つけるための最も単純な戦略は線形検索です。線形検索では、各要素を走査してターゲットを見つけ、各データ ポイントにアクセスして一致を見つけ、一致が見つかったときに結果を返し、アルゴリズムはループを終了します。一致が見つからない場合、アルゴリズムはデータの最後まで検索を続けます。線形検索の明らかな欠点は、本質的に網羅的な検索であるため、非常に遅いことです。その利点は、他のアルゴリズムのようにデータをソートする必要がないことです。

線形探索のコードを見てみましょう。

  1. 定義LinearSearch(リスト、項目):
  2. インデックス= 0
  3. 見つかった = False  
  4.  
  5. #各データ要素値を一致させる
  6. インデックス<len(list)見つかったのは 間違い
  7. リスト[インデックス] == 項目の場合:
  8. 見つかった = 
  9. それ以外
  10. インデックス=インデックス+ 1
  11. 戻りが見つかりました

ここで、このコードの出力を見てみましょう (図 3-15 を参照)。

  1. リスト = [12, 33, 11, 99, 22, 55, 90]
  2.  
  3. print(LinearSearch(リスト、12))
  4.  
  5. print(LinearSearch(リスト、91))

▲図3-15

データが正常に見つかった場合、LinearSearch 関数を実行すると True が返されることに注意してください。

  • 線形探索のパフォーマンス: 前述のように、線形探索は、最悪の場合の時間複雑度が O(N) で網羅的な探索を実行する単純なアルゴリズムです。

2. 二分探索

バイナリ検索アルゴリズムの前提条件は、データが順序どおりになっていることです。アルゴリズムは、探している値が見つかるまで、現在のリストを繰り返し 2 つに分割し、最小インデックスと最大インデックスを追跡します。

  1. def BinarySearch(リスト、項目):
  2. 最初= 0
  3. 最後= len(リスト)-1
  4. 見つかった = False  
  5.  
  6. 最初<=最後 そして 見つかりません
  7. 中間点 = (最初+最後) // 2
  8. リスト[中間点] == ​​項目の場合:
  9. 見つかった = 
  10. それ以外
  11. 項目 < リスト[中間点]の場合:
  12. 最後= 中間点-1
  13. それ以外
  14. 最初= 中間点+1
  15. 戻りが見つかりました

出力結果を図3-16に示します。

  1. リスト = [12, 33, 11, 99, 22, 55, 90]
  2.  
  3. sorted_list = BubbleSort(リスト)
  4.  
  5. print(BinarySearch(リスト、12))
  6.  
  7. print(BinarySearch(リスト、91))

▲図3-16

BinarySearch 関数を呼び出すと、入力リスト内に値が見つかった場合に True が返されることに注意してください。

  • バイナリ検索のパフォーマンス: バイナリ検索は、各反復でアルゴリズムがデータを 2 つの部分に分割するため、このように呼ばれています。データに N 個の項目がある場合、反復を完了するには最大 O(log N) ステップかかります。つまり、アルゴリズムの実行時間は O(log N) になります。

3. 補間検索

バイナリ検索の基本的なロジックは、データの中央部分に焦点を当てることです。補間は、ターゲット値を使用してソートされた配列内の要素のおおよその位置を推定する、より複雑な検索です。

例を使って理解してみましょう。英語の辞書で river などの単語を検索する場合、辞書の真ん中までめくって検索を開始するのではなく、この情報を使用して補間し、文字 r で始まる単語の検索を開始します。より一般的な補間ファインダーは次のようになります。

  1. def IntPolsearch(リスト,x):
  2. idx0 = 0
  3. idxn = (len(リスト) - 1)
  4. 見つかった = False  
  5. idx0 <= idxnかつx >= list[idx0]かつx <= list[idxn] の場合:
  6.  
  7. # 中間点を見つける
  8. mid = idx0 + int ((( float (idxn - idx0)/( list[idxn] - list[idx0])) * ( x - list[idx0])))
  9.  
  10. #中間点検索値を比較する
  11. リスト[mid] == xの場合:
  12. 見つかった = 
  13. 戻りが見つかりました
  14.  
  15. リスト[mid] < xの場合:
  16. idx0 = 中間 + 1
  17. 戻りが見つかりました

出力結果を図3-17に示します。

  1. リスト = [12, 33, 11, 99, 22, 55, 90]
  2.  
  3. sorted_list = BubbleSort(リスト)
  4.  
  5. print(IntPolsearch(リスト、12))
  6.  
  7. print(IntPolsearch(リスト,91))

▲図3-17

IntPolsearch 関数を使用する前に、まずソート アルゴリズムを使用して配列をソートする必要があることに注意してください。

  • 補間検索のパフォーマンス: データが不均一に分散されている場合、補間検索アルゴリズムのパフォーマンスは低下し、アルゴリズムの最悪の時間計算量は O(N) になります。データがほぼ均等に分散されている場合、最適な時間計算量は O(log(log N)) です。

著者について: Imran Ahmad は、Google 認定インストラクターであり、長年にわたり Google と Learning Tree で Python、機械学習、アルゴリズム、ビッグデータ、ディープラーニングを専門に教えています。彼は博士号取得を目指しながら、クラウド コンピューティング環境でのリソース割り当てを最適化するための線形計画法に基づいた ATSRA という新しいアルゴリズムを提案しました。彼はほぼ 4 年間、カナダ連邦政府の高度分析研究所で注目を集める機械学習プロジェクトに取り組んできました。

この記事は「すべてのプログラマが知っておくべき 40 のアルゴリズム」から抜粋したもので、出版社の許可を得て公開されています。

<<:  銀行業界の「退化」の原因は人工知能なのか?

>>:  完全な自動運転まであとどれくらいでしょうか?答えはセンサー技術の発展にある

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

国内トップクラスのAIカンファレンスCPALに採択された論文の成果を公開!合計30件の口頭発表と60件のスポットライト記事

今年5月に発表され、国内の有力者である馬怡氏と沈向陽氏が主導する、まったく新しい初のAI学術会議CP...

ビッグニュース! Googleが突然発表!百度と滴滴出行は混同されている

21 金融ニュースは、日刊金融ニュース (ncjs111)、網易科技、創業報 (ichuangye...

Android マーケットのランキングアルゴリズムとルールの分析

ご存知のとおり、検索エンジンとして始まった Google は、(A×a% + B×b% + C×c%...

...

良いプロンプトを書くときは、これらの 6 つのポイントを覚えておいてください。覚えていますか?

効果的なプロンプトを書くことは、AI とのやり取りを成功させるための鍵となります。優れたプロンプトは...

NeRF を放棄し始めていますか?ガウススプラッティングが自動運転のシナリオで人気があるのはなぜですか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

人工知能による大量失業の懸念は根拠がない

[[256558]] AIが大量失業を引き起こすという懸念は根拠がない世界的な研究機関である羅漢研究...

Python でシンプルなニューラル ネットワークを作成する方法 (コード付き)

[[251984]]ニューラル ネットワークの仕組みを理解する最良の方法は、自分でニューラル ネッ...

COVID-19 最新情報: COVID-19 との戦いに役立つトップ 10 のイノベーション

[[320870]]迅速な感染検査から3Dプリントソリューションまで、世界中のテクノロジー企業が協力...

MDFR: 顔画像復元と顔回転の結合モデルに基づく顔認識法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Android Things と TensorFlow を使用して IoT に機械学習を適用する方法

Android Things を Tensorflow と統合する方法と、機械学習を IoT システ...

私が嫌いな人工知能

以前は、機械学習に少しイライラしていました。一方では、メディアやトレーニング機関が機械学習を汎用人工...

勾配降下法から準ニュートン法まで: ニューラル ネットワークをトレーニングするための 5 つの学習アルゴリズム

ニューラル ネットワークでは、システムの学習プロセスは一般にトレーニング アルゴリズムによって支配さ...