Java ソートアルゴリズムの概要 (VII): クイックソート

Java ソートアルゴリズムの概要 (VII): クイックソート

クイックソートはバブルソートの改良版です。その基本的な考え方は、ソート パスを通じて、ソートするデータが 2 つの独立した部分に分割され、一方の部分のすべてのデータがもう一方の部分のすべてのデータよりも小さくなり、その後、この方法に従って 2 つの部分のデータが別々にすばやくソートされるというものです。ソート プロセス全体を再帰的に実行して、データ全体を順序付けられたシーケンスに変換できます。クイックソートは不安定で、O(log(n)) の追加スペースを必要とし、時間計算量は O(nlog(n)) であり、適応性がありません。

クイックソートには、言及する価値のあるバリエーションがいくつかあります。以下に簡単に紹介します。

ランダム化されたクイックソート:クイックソートの最悪のケースは、各パーティションのピボットの選択に基づきます。基本的なクイックソートでは、最初の要素がピボットとして選択されます。このように、配列がすでに順序付けられている場合、各分割は最悪の結果になります。一般的な最適化方法は、要素をメイン要素としてランダムに選択するランダム化アルゴリズムです。この場合、最悪のケースは依然として O(n^2) ですが、最悪のケースはもはや入力データに依存せず、ランダム関数の評価が不十分なために発生します。実際、クイックソートをランダム化して理論上の最悪のケースを得る確率は 1/(2^n) だけです。したがって、ランダム化クイックソートは、ほとんどの入力データに対して予想される時間計算量 O(nlogn) を達成できます。ある先輩が素晴らしい要約をしてくれました。「ランダムクイックソートは、人の性格のニーズを一生涯満たすことができます。」

ランダム化クイックソートの唯一の欠点は、入力データに同一データが大量に存在すると、ランダム化の効果が直接的に弱まってしまうことです。極端なケース、つまり n 個の同一の数字をソートする場合、ランダムクイックソートの時間計算量は間違いなく O(n^2) に削減されます。解決策は、ピボットを交換せずにそのままの状態でスキャンすることです。

バランス クイックソート: 毎回、中央値をキー データとして表すことができる要素を選択し、通常のクイックソートの原則に従って比較、置換、再帰を実行します。一般的に、このデータを選択する方法は、開始データ、終了データ、中間データを取得し、比較して中央値を選択することです。この3つの値を取る利点は、実際の問題(情報科学のコンテストなど)では、近似連続データや反転データが出現する可能性が高いことです。この場合、真ん中のデータが必然的に中央値になり、実は近似中央値でもあります。中央が大きく両側が小さい(またはその逆)データに遭遇し、取得した値が最大値に近い場合、少なくとも2つの部分を分離できるため、実際の効率は約2倍になり、データを少し乱して縮退構造を破壊することが有益です。

外部クイックソート: 通常のクイックソートとは異なり、キーデータはバッファです。まず、前と次の M/2 要素がバッファに読み込まれ、バッファ内のこれらの要素がソートされます。次に、ソートされた配列の先頭 (または末尾) から次の要素が読み込まれます。この要素がバッファ内の最小の要素よりも小さい場合は、最初の空きスペースに書き込まれます。この要素がバッファ内の最大の要素よりも大きい場合は、最後の空きスペースに書き込まれます。それ以外の場合は、バッファ内の最大または最小の要素が配列に書き込まれ、バッファに配置されます。すでに順序付けされた中間データの再配置を避けるため、最大値はこれらのキー データより低く、最小値はこれらのキー データより高く設定してください。完了後、配列の中央のスペースを空ける必要があり、バッファは配列の中央のスペースに書き込まれます。次に、小さい外側の部分を再帰的にソートし、他の部分を循環的にソートします。

3 方向基数クイックソート (マルチキー クイックソート、マルチキー クイックソートとも呼ばれます) : 基数ソート (一般的な文字列比較ソートは基数ソートであるなど) とクイックソートの特性を組み合わせたもので、文字列ソートに比較的効率的なアルゴリズムです。このアルゴリズムによってソートされる配列の要素には、文字列などのマルチキーという特性があり、各文字はキーとみなすことができます。アルゴリズムは、ソートされた配列内の要素をキー データとしてランダムに選択するたびに、まずこの要素の最初のキー (文字) のみを考慮し、次にキーを比較して、他の要素をキー データより小さい、等しい、大きい 3 つの部分に分割します。次に、このキーの位置に基づいて「より小さい」部分と「より大きい」部分を再帰的にソートし、次のキーに基づいて「等しい」部分をソートします。

コード実装:

  1. 公共 クラスクイックソート{
  2. 公共 静的  void sort(比較可能なデータ[]、 int low、 int high) {
  3. // ピボット要素。通常は最初の要素に基づいて分割されます 
  4. int i = 低い;
  5. 整数j = 高い;
  6. (低<高)の場合{
  7. // 配列の両端から中央まで交互にスキャンします 
  8. 比較可能な pivotKey = data[low];
  9. // ポインタ i、j をスキャンします。i は左から始まり、j は右から始まります 
  10. i < j である間{
  11. i < j && data[j].compareTo(pivotKey) > 0場合
  12. j--;
  13. } // 終了 
  14. もし(i < j){
  15. // ピボット要素より小さい要素を左に移動する 
  16. データ[i] = データ[j];
  17. 私は++;
  18. } // 終了 
  19. i < j && data[i].compareTo(pivotKey) < 0場合
  20. 私は++;
  21. } // 終了 
  22. もし(i < j){
  23. // ピボット要素より大きい要素を右に移動する 
  24. データ[j] = データ[i];
  25. j--;
  26. } // 終了 
  27. } // 終了 
  28. // ピボット要素を正しい位置に移動する 
  29. データ[i] = pivotKey;
  30. // サブリストの前半を再帰的にソートする 
  31. ソート(データ、low、i - 1 );
  32. // サブリストの後半部分を再帰的にソートする 
  33. ソート(データ、i + 1 、高);
  34. } // 終了 
  35. } // ソート終了 
  36. 公共 静的  void main(String[] args) {
  37. // JDK1.5以降では、基本データ型は自動的にボックス化されます 
  38. // intやdoubleなどの基本型のラッパークラスはComparableインターフェースを実装しています 
  39. 比較可能[] c = { 4 9 23 1 45 27 5 2 };
  40. ソート(c, 0 , c.length - 1 );
  41. (比較可能データ: c) {
  42. System.out.println(データ);
  43. }
  44. }
  45. }

クイックソートは現在最も広く使われているソートアルゴリズムです。クイックソートの核心はセグメンテーションアルゴリズムにあり、最も巧妙な部分とも言えます。この記事がお役に立てば幸いです。

【編集者のおすすめ】

  1. 5.11 3行のコードでクイックソート
  2. 12.3.2 タスクスティールに基づくクイックソート
  3. 19.4.2 Parallel_For による並列クイックソート
  4. C# クイックソートの興味深い実装: Haskell から始める

<<:  Java ソートアルゴリズムの概要 (VIII): 基数ソート

>>:  Java ソートアルゴリズムの概要 (VI): ヒープソート

ブログ    

推薦する

AI に携わる人が Python を選ぶ理由は何でしょうか?

AIとビッグデータの時代に、最初の開発言語となるのは誰でしょうか?これは議論の余地のない質問です。...

Javaソートアルゴリズムの概要(I):挿入ソート

挿入ソートの基本的な操作は、ソートされた順序付けられたデータにデータを挿入し、それによって番号が 1...

Google: 2020年5月のコアアルゴリズムアップデート、多数のウェブサイトに影響

Google のアルゴリズムは毎年何百回も更新されます (Google は通常、これらの更新について...

機械学習プロジェクトを構築するための6つのステップをマスターしましょう

上のホワイトボードには、一連の機械学習プロジェクトの立ち上げが示されています。機械学習は幅広い分野を...

ChatGPT が突然大きなバグを発見しました!フル機能のGPT-4は無料で使用でき、ネットユーザーは大喜びしている

11月15日、OpenAIは突然、ChatGPT Plusの新規ユーザー登録を停止すると発表しました...

650億のパラメータ、すべてのパラメータを8つのGPUで微調整可能:Qiu Xipengのチームは大規模モデルの閾値を下げました

大規模モデルに向けて、テクノロジー大手はより大規模なモデルをトレーニングしており、学界はそれらを最適...

開発者の「第2の脳」が登場、GitHub Copilotがアップデートされ、人間の開発参加がさらに減少

Andrej Karpathy 氏が嘆くのは、ソフトウェア開発プロセスにおいてコードを直接記述するこ...

...

エンジニアリングだけではありません!人間の認知バイアスが原因の AI 研究における 12 の盲点

[[255272]]ビッグデータダイジェスト制作編集者: ゴウ・シャオバイ、チャン・チウユエ、アイリ...

...

...

...

2日間で星の数が1,000を突破:OpenAIのWhisperの蒸留後、音声認識が数倍高速化

少し前に、「テイラー・スウィフトが中国語を披露」する動画がさまざまなソーシャルメディアプラットフォー...

AIはスマートシティの人材採用に役割を果たすのでしょうか?

AI ツールとテクノロジーはスマート シティと IoT 主導の業界にとってゲームチェンジャーとなっ...

機械学習が金融業界にもたらす破壊的変化

過去 10 年間で、金融業界ではこれまでにない最先端のテクノロジーが数多く導入されました。この変化は...