再帰アルゴリズムの深い理解、誤解された再帰

再帰アルゴリズムの深い理解、誤解された再帰

[[333118]]

再帰は、プログラミングの本で説明するのが最も難しい部分である魔法のアルゴリズムです。これらの本では通常、階乗の再帰的な実装が示され、動作するが非常に遅く、スタック オーバーフローでクラッシュする可能性があるという警告が表示されます。懐疑的な人もいるが、再帰がアルゴリズムの中で最も強力なアイデアであるという事実には影響しない。

古典的な再帰階乗を見てみましょう。

階乗.c

  1. #include <stdio.h>
  2. int階乗( int n)
  3. {
  4. int前 = 0xdeadbeef;
  5. (n == 0 || n == 1)の場合{
  6. 1 を返します
  7. }
  8. 前 = 階乗(n-1);
  9. n * previousを返します
  10. }
  11. int main( int argc)
  12. {
  13. int答え = 階乗(5);
  14. printf( "%d\n" , 回答);
  15. }
  16.   

関数が自分自身を呼び出すという考え方は、最初は非常に不思議です。全体のプロセスを説明するために、次の図は、factorial(5)が呼び出され、n == 1の場合のスタックの構造を示しています。

factorial を呼び出すたびに、新しいスタック フレームが生成されます。これらのスタック フレームの作成と破棄により、再帰要素は反復部分よりも遅くなります。呼び出しが開始される前と戻る前にこれらのスタック フレームが蓄積されると、スタック領域が使い果たされ、プログラムがクラッシュする可能性があります。

しかし、こうした懸念は一般的に理論的なものである。たとえば、階乗スタック フレームはそれぞれ 16 バイトを占有します (これはスタックの配置やその他の要因によって異なる場合があります)。コンピュータで最新の x86 Linux カーネルを実行している場合、通常はデフォルトで 8 MB のスタック スペースがあるため、階乗 n は最大 512,000 を処理できます。これは非常に大きな数であり、表現するには 8,971,833 ビットを必要とするため、スタック スペースは問題になりません。小さな整数 (64 ビットであっても) は、スタック スペースがなくなる前に何万回もオーバーフローします。

CPU 使用率については後で説明しますが、今はビットやバイトから離れて、一般的な手法としての再帰について見てみましょう。私たちの階乗アルゴリズムは、整数 N、N-1、... 1 をスタックにプッシュし、それらを逆の順序で乗算することになります。プログラムの呼び出しスタックを使用してこれを行うための前提は、ヒープ上にスタックを割り当てて使用できることです。コール スタックには特別なプロパティがありますが、これは自由に使用できる別のデータ構造にすぎません。

コール スタックをデータ構造として見ると、別のことが理解できるようになります。つまり、すべての整数をそれ自体の前に追加し、それらをそれ自体で乗算することは、明らかに賢い考えではありません。 階乗を計算するには、反復プロセスを使用する方が合理的です。

伝統的な面接の質問に、迷路の中にネズミが置かれ、ネズミがチーズを見つけるのを手伝うというものがあります。ネズミは迷路の中で左または右に曲がることができると仮定します。この問題をどのようにモデル化して解決しますか?

人生におけるほとんどの問題と同様に、このげっ歯類の課題をグラフ、具体的にはノードが迷路内の位置を表すバイナリ ツリーに抽象化できます。次に、マウスをできるだけ左に移動し、行き止まりに達したら戻って右に曲がるようにします。次の図はマウスのパスを示しています。

各エッジ(線)は左または右に曲がることができ、マウスで選択できます。どちらかのターンがブロックされている場合、対応するエッジは存在しません。コール スタックを使用する場合でも、他のデータ構造を使用する場合でも、このプロセスは本質的に再帰的です。しかし、コールスタックの使用は非常に簡単です。

迷路.c

  1. #include <stdio.h>
  2. #include "maze.h"  
  3. int探索(maze_t *ノード)
  4. {
  5. int見つかった = 0;
  6. if (ノード == NULL ) {
  7. 0を返します
  8. }
  9. if (node->hasCheese) {
  10. return 1; // チーズが見つかった
  11. }
  12. 見つかった = explore(node-> left ) || explore(node-> right );
  13. 戻り値が見つかりました。
  14. }
  15. int main( int argc)
  16. {
  17. int found = explore(&maze);
  18. }

maze.c:13 でチーズを見つけます。ここにスタックがあります。

ここで再帰を回避することは困難ですが、コール スタックを介して実行する必要があるわけではありません。たとえば、文字列 RRLL を使用してターンを追跡し、その文字列に基づいてマウスの次の動きを決定することができます。または、チーズ探しのステータスを記録するために他の変数を割り当てることもできます。再帰的な手順を実装していますが、独自のデータ構造を展開しています。

コールスタックがぴったり合うため、これはさらに複雑になる可能性があります。各スタック フレームには、現在のノードだけでなく、そのノードでの計算の状態も記録されます (この場合、左側のみを実行したか、右側を既に試したか)。しかし、私たちは溢れることを恐れて、良いものを諦めてしまうことがあります。それはとても愚かなことだと私は思います。

これまで見てきたように、スタックは大きく、スタック領域よりも先に他の制約が満たされることがよくあります。問題の大きさを確認し、安全に処理できるかどうかを確認することもできます。 CPU に対する恐怖は、主に、愚かな因子と、メモリのない信頼性の高い O(2n) 再帰フィボナッチという 2 つの広く見られる病理の例によって植え付けられます。これらは健全なスタック再帰アルゴリズムを表すものではありません。

実際には、スタック操作は高速です。データのオフセットは正確で、スタックはキャッシュ内にあり、コールド スタートは必要なく、ジョブを完了するための専用の命令があります。同時に、独自のヒープ割り当てデータ構造を使用すると、多くのオーバーヘッドが発生します。コールスタックの再帰よりも複雑でパフォーマンスの悪いものを書いている人がいるかもしれません。

最近の CPU は非常に優れており、通常はボトルネックにはなりません。多くの場合、シンプルさはパフォーマンスにつながります。

<<:  洪水期に緊急通信を確保するにはどうすればよいでしょうか?ドローンは誰もが好む新たな力となる

>>:  機械学習の戦略原則: 基本プロセス、アルゴリズムフレームワーク、プロジェクト管理

ブログ    
ブログ    

推薦する

...

自動運転のための2Dおよび3D視覚認識アルゴリズムについて話す

環境認識は自動運転における最初のリンクであり、車両と環境を結び付けるものです。自動運転システムの全体...

ディープラーニングモデルのサイズとモデル推論速度に関するいくつかの議論

[[426034]]この記事では、計算量、パラメータ数、メモリアクセス量、メモリ使用量など、ディープ...

スマートロボットについて知っておくべきことすべて

スマートロボットは、タスクをより効率的かつ正確に実行し、生産性を向上させ、人的エラーを削減するように...

杭州市の100以上の交差点で無人信号制御が実現し、杭州シティブレイン1.0が正式にリリースされました

10月11日、アリババは2017年杭州雲奇大会で、人類のテクノロジーの未来を探求する実験室「大墨学院...

...

基本モデル + ロボット: これまでどこまで進んだのでしょうか?

ロボット工学は、特にスマートテクノロジーと組み合わせると、無限の可能性を秘めたテクノロジーです。近年...

OpenAIの創設者は、Nvidiaに対抗するチップを設計・製造するためのグローバルなチップ工場ネットワークを構築したいと考えている

OpenAIの共同創設者サム・アルトマン氏は最近、Nvidiaに対抗するために世界中にAIチップ工場...

...

...

...

中国初のAI採点試験がスタート:全10レベル、北京大学が問題作成、工業情報化部が認定

[[277668]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

人工知能とVRを融合し、多様な体験を実現

人工知能サービス - Microsoft Cognitive Services には当初、視覚、音声...

受注収益が7億人民元を超えるPercentが、なぜこれほど爆発的な成長を遂げることができたのでしょうか?

2009年に設立されたPercentage Pointは、間違いなく中国のビッグデータ産業の発展の...