再帰アルゴリズムの深い理解、誤解された再帰

再帰アルゴリズムの深い理解、誤解された再帰

[[333118]]

再帰は、プログラミングの本で説明するのが最も難しい部分である魔法のアルゴリズムです。これらの本では通常、階乗の再帰的な実装が示され、動作するが非常に遅く、スタック オーバーフローでクラッシュする可能性があるという警告が表示されます。懐疑的な人もいるが、再帰がアルゴリズムの中で最も強力なアイデアであるという事実には影響しない。

古典的な再帰階乗を見てみましょう。

階乗.c

  1. #include <stdio.h>
  2. int階乗( int n)
  3. {
  4. int前 = 0xdeadbeef;
  5. (n == 0 || n == 1)の場合{
  6. 1 を返します
  7. }
  8. 前 = 階乗(n-1);
  9. n * previousを返します
  10. }
  11. int main( int argc)
  12. {
  13. int答え = 階乗(5);
  14. printf( "%d\n" , 回答);
  15. }
  16.   

関数が自分自身を呼び出すという考え方は、最初は非常に不思議です。全体のプロセスを説明するために、次の図は、factorial(5)が呼び出され、n == 1の場合のスタックの構造を示しています。

factorial を呼び出すたびに、新しいスタック フレームが生成されます。これらのスタック フレームの作成と破棄により、再帰要素は反復部分よりも遅くなります。呼び出しが開始される前と戻る前にこれらのスタック フレームが蓄積されると、スタック領域が使い果たされ、プログラムがクラッシュする可能性があります。

しかし、こうした懸念は一般的に理論的なものである。たとえば、階乗スタック フレームはそれぞれ 16 バイトを占有します (これはスタックの配置やその他の要因によって異なる場合があります)。コンピュータで最新の x86 Linux カーネルを実行している場合、通常はデフォルトで 8 MB のスタック スペースがあるため、階乗 n は最大 512,000 を処理できます。これは非常に大きな数であり、表現するには 8,971,833 ビットを必要とするため、スタック スペースは問題になりません。小さな整数 (64 ビットであっても) は、スタック スペースがなくなる前に何万回もオーバーフローします。

CPU 使用率については後で説明しますが、今はビットやバイトから離れて、一般的な手法としての再帰について見てみましょう。私たちの階乗アルゴリズムは、整数 N、N-1、... 1 をスタックにプッシュし、それらを逆の順序で乗算することになります。プログラムの呼び出しスタックを使用してこれを行うための前提は、ヒープ上にスタックを割り当てて使用できることです。コール スタックには特別なプロパティがありますが、これは自由に使用できる別のデータ構造にすぎません。

コール スタックをデータ構造として見ると、別のことが理解できるようになります。つまり、すべての整数をそれ自体の前に追加し、それらをそれ自体で乗算することは、明らかに賢い考えではありません。 階乗を計算するには、反復プロセスを使用する方が合理的です。

伝統的な面接の質問に、迷路の中にネズミが置かれ、ネズミがチーズを見つけるのを手伝うというものがあります。ネズミは迷路の中で左または右に曲がることができると仮定します。この問題をどのようにモデル化して解決しますか?

人生におけるほとんどの問題と同様に、このげっ歯類の課題をグラフ、具体的にはノードが迷路内の位置を表すバイナリ ツリーに抽象化できます。次に、マウスをできるだけ左に移動し、行き止まりに達したら戻って右に曲がるようにします。次の図はマウスのパスを示しています。

各エッジ(線)は左または右に曲がることができ、マウスで選択できます。どちらかのターンがブロックされている場合、対応するエッジは存在しません。コール スタックを使用する場合でも、他のデータ構造を使用する場合でも、このプロセスは本質的に再帰的です。しかし、コールスタックの使用は非常に簡単です。

迷路.c

  1. #include <stdio.h>
  2. #include "maze.h"  
  3. int探索(maze_t *ノード)
  4. {
  5. int見つかった = 0;
  6. if (ノード == NULL ) {
  7. 0を返します
  8. }
  9. if (node->hasCheese) {
  10. return 1; // チーズが見つかった
  11. }
  12. 見つかった = explore(node-> left ) || explore(node-> right );
  13. 戻り値が見つかりました。
  14. }
  15. int main( int argc)
  16. {
  17. int found = explore(&maze);
  18. }

maze.c:13 でチーズを見つけます。ここにスタックがあります。

ここで再帰を回避することは困難ですが、コール スタックを介して実行する必要があるわけではありません。たとえば、文字列 RRLL を使用してターンを追跡し、その文字列に基づいてマウスの次の動きを決定することができます。または、チーズ探しのステータスを記録するために他の変数を割り当てることもできます。再帰的な手順を実装していますが、独自のデータ構造を展開しています。

コールスタックがぴったり合うため、これはさらに複雑になる可能性があります。各スタック フレームには、現在のノードだけでなく、そのノードでの計算の状態も記録されます (この場合、左側のみを実行したか、右側を既に試したか)。しかし、私たちは溢れることを恐れて、良いものを諦めてしまうことがあります。それはとても愚かなことだと私は思います。

これまで見てきたように、スタックは大きく、スタック領域よりも先に他の制約が満たされることがよくあります。問題の大きさを確認し、安全に処理できるかどうかを確認することもできます。 CPU に対する恐怖は、主に、愚かな因子と、メモリのない信頼性の高い O(2n) 再帰フィボナッチという 2 つの広く見られる病理の例によって植え付けられます。これらは健全なスタック再帰アルゴリズムを表すものではありません。

実際には、スタック操作は高速です。データのオフセットは正確で、スタックはキャッシュ内にあり、コールド スタートは必要なく、ジョブを完了するための専用の命令があります。同時に、独自のヒープ割り当てデータ構造を使用すると、多くのオーバーヘッドが発生します。コールスタックの再帰よりも複雑でパフォーマンスの悪いものを書いている人がいるかもしれません。

最近の CPU は非常に優れており、通常はボトルネックにはなりません。多くの場合、シンプルさはパフォーマンスにつながります。

<<:  洪水期に緊急通信を確保するにはどうすればよいでしょうか?ドローンは誰もが好む新たな力となる

>>:  機械学習の戦略原則: 基本プロセス、アルゴリズムフレームワーク、プロジェクト管理

ブログ    

推薦する

...

普通のプログラマーがAIを活用する方法

[[187452]]現在、人工知能はますます人気が高まっている分野となっています。普通のプログラマー...

アリババが国際AIサミットを主催、医療AIとマルチメディアコンテンツ理解が話題に

10月15日、記者はアリババが主催する2020 ACMマルチメディア(以下、ACM MM 2020)...

...

...

大きなモデルもスライスできます。Microsoft SliceGPTはLLAMA-2の計算効率を大幅に向上させます。

大規模言語モデル (LLM) には通常、数十億のパラメータがあり、数兆のトークンのデータを使用してト...

Didiは最初の試みで惨敗した。自動運転は本当に良い市場なのか?

道路交通は常に人々の関心事であり、テクノロジーの時代において、人々は自動運転に大きな期待を寄せていま...

求職者の履歴書はどうすればAIやロボットによる審査に合格できるのでしょうか?

[[271396]]今日では、求人ウェブサイトに提出された多くの求職者の履歴書は、新しい仕事の面接...

研究により、ディープラーニングAIは乳がんリスクの予測に優れていることが判明

放射線学誌に掲載された新しい研究によると、ディープラーニングと呼ばれる高度な人工知能は、一般的に使用...

Zookeeper の選出アルゴリズムとスプリットブレイン問題の詳細な説明

ZKの紹介ZK = 動物園の飼育係ZK は、マイクロサービス ソリューションにおけるサービス登録と検...

...

マイクロソフトはBing Chatを今後も無料のままにすると約束

近年、OpenAI、Microsoft、Google など多くの企業やスタートアップチームが独自のチ...

建設における人工知能の能力と限界

AI は、建設業界が大規模なインフラ プロジェクトを計画、実行、管理する方法に革命をもたらし、組織が...

...

人工知能がサイバー防御を強化

ビッグデータと高性能コンピューティング リソースにアクセスすることで、企業は新しい人工知能ツールと機...