F#の並列ソートアルゴリズムは実装が簡単

F#の並列ソートアルゴリズムは実装が簡単

F# の並列ソート アルゴリズムで最も一般的な方法の 1 つは、まず処理するデータを複数の部分に分割し、次に異なるスレッド (CPU) で処理することです。すべてのスレッドが処理を完了すると、結果が集められ、独立したスレッドでマージされて最終結果が形成されます。分割する場合、各スレッドが独自の独立したデータのみにアクセスし、グローバル データや他のスレッドのデータ (ここでのデータは読み取り専用ではないデータを指します) にアクセスしないようにします。結果をマージする場合は、効率的なアルゴリズムを使用してマージする必要があります。

ソートアルゴリズムには、マージソートアルゴリズムがあります。まず、多方向マージソートアルゴリズムを記述し、ソートする配列をCPUの数に分割し、各CPUに各部分をソートさせ、すべてのスレッドがソートを完了したら、それらをまとめて独立したスレッドでマージソートを実行します。

もう一度コードを説明します。F# に馴染みのない方もいるかもしれません。

1. マージ アルゴリズムの考え方は、各スコア グループの最小の添字から始めて、複数のソート済み配列を 1 つの大きなソート済み配列にマージすることです。最小のものを大きな配列に入れ、次にこの配列の添字を 1 つ増やしてから再度比較し、最小のものを大きな配列に入れ、すべての小さな配列の添字が末尾を指すまでこれを繰り返します。一時変数 min が使用されるため、 mutable キーワードで変更されます。

2. F# 配列の長さは、Array.length メソッドを使用して取得されます。変数と配列の代入記号は、= ではなく <- です。= は C# の == に相当します。F# には、continue や break などのキーワードはありません。

3. async キーワードは新しい並列プリミティブです。これによって展開されたコードは、f# によってスレッド プール内で自動的に非同期実行されます。結果を返す場合は、let! キーワードと return! キーワードを使用する必要があります。ソートは配列に対してのみ実行され、何も返さないため、ここでは比較的単純です。

4. (fun ab -> a - b) はラムダ式であり、自動的にComparerに変換できます。 、ソートの基準となる

5. Array.map は、配列内の各要素にメソッドを適用することを意味します。この時点では実行されませんが、パイプラインを介して Async.Parallel メソッドに渡されます。Async.Parallel メソッドは、非同期実行配列 Async<'a array> を返し、最後に Async.Run を使用して、Async.Parallel によって返された結果を実際に実行します。

6. |> はパイプラインを意味し、前の関数の結果が次の関数で使用されることを意味します。このように、1 つのステートメントで非常に一貫したロジックを表現できます。

F# 並列ソート アルゴリズムの全体的なコードは次のとおりです。

 1 #ライト
2
3 オープンシステム
4 System.Diagnosticsを開く
5 Microsoft.FSharp.Control.CommonExtensions を開く
6
7 let merge_sort destArray ソース cmp =
8 N = Array.length ソースとする
9 L = Array.length destArray - 1 とします
10 posArr = Array.create N 0 とします
11 i = 0からLまで
12 変更可能な最小値を -1 にする
13 j = 0からN - 1まで
14 posArr.[j] >= Array.length source.[j] の場合 ()
15 その他
16 min = -1 の場合、min <- j
17 その他
18 (cmp source.[j].[posArr.[j]] source.[min].[posArr.[min]]) < 0 の場合、min <- j
19 min = -1 の場合 ()
その他20
21 destArray.[i] <- source.[min].[posArr.[min]]
22 位置[分] <- 位置[分] + 1
23
24 並列ソートをcmp arr =にする
25 プロセッサカウントを Environment.ProcessorCount とします。
26 partArray = Array.create プロセッサカウント [||]
27 可変長のまま = Array.length arr
28 partLen = Array.length arr / プロセッサカウント
29
30 i = 0 からprocessorCount - 1 まで
31 i = プロセッサカウント - 1 の場合
32 temp_arr = Array.create を 0 のままにする
33 Array.Copy(arr, i*partLen, temp_arr, 0, 残り)
34 部分配列.[i] <- temp_arr
35 その他
36 temp_arr = Array.create partLen 0 とする
37 Array.Copy(arr, i*partLen, temp_arr, 0, partLen)
38 残り <- 残り - partLen
39 部分配列.[i] <- temp_arr
40
41 let a_sort_one arr =
42 非同期 {
43 配列.sort cmp arr
44 }
45
46 a_sort_all = とします
47 部分配列
48 |> Array.map (fun f -> a_sort_one f)
49 |> 非同期並列
50 |> 非同期実行
51
52 すべて並べ替え
53 ret = Array.create (Array.length arr) 0 を実行します。
54 merge_sort ret partArray (fun ab -> a - b)
55 ret
56
57 arr = Array.create 1000000 0 とします
58 rnd = new Random() とします
59 i = 0 から Array.length arr - 1 まで
60 arr.[i] <- rnd.Next()
61
62 stop = Stopwatch.StartNew() を実行します。
63 停止、開始
64 sorted_arr = parallel_sort (fun ab -> ab) arr とします
65 停止。停止
66 printfn "並列ソート結果\r\n=%A\r\n所要時間 %d ミリ秒" sorted_arr stop.ElapsedMilliseconds
67
68 stop2 = Stopwatch.StartNew() とします
69 Array.sort (fun ab -> ab) arr
70 停止。停止
71 printfn "シリアルソート結果\r\n=%A\r\n所要時間 %d ミリ秒" arr stop2.ElapsedMilliseconds
72
73 コンソール.ReadKey(true)

私の IBM X200 では、シリアル ソートには約 1200 秒、パラレル ソートには約 900 秒かかります。

F# 並列ソートアルゴリズム関連リンク:

シンプルな F# 式から並行アプリケーションを構築する

マイクロソフト

Visual Studio 2010 に F# が正式に追加される

http://developer..com/art/200812/103775.htm

この記事は、 Prince Frogブログ記事「 Frog の推奨事項: F# が並列ソート アルゴリズムを実装」から引用したものです。

<<:  C# 暗号化アルゴリズムの簡単な紹介

>>:  C# モザイク アルゴリズムの実装

ブログ    
ブログ    
ブログ    

推薦する

...

...

テストフレームワーク - 安全性と自動運転

OWASP (Open Web Application Security Project): OWA...

...

これら5つのコアテクノロジーを理解すれば、人工知能はもうあなたの身近な存在に

人工知能は現在最も注目されている産業であり、将来的にはロボット、スマートセンサー、ウェアラブルデバイ...

ヘルスケアにおける AI と ML の可能性を解き放つ

ヘルスケア分野では、人工知能 (AI) と機械学習 (ML) が患者のケア、診断、治療に大きな進歩を...

ついに誰かが様々なStyleGANの大きな概要を作成した

[[435127]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

Huaweiの推奨システムにおけるマルチタスクとマルチシナリオの応用

1. マルチタスクとマルチシナリオの背景と課題まず、Huaweiのマルチタスクで推奨されるシナリオを...

「回帰分析」は本当に「機械学習」なのでしょうか?

「統計」と「機械学習」の違いは何ですか?これは数え切れないほど議論されてきた質問です。この問題につ...

大規模な伝染病に直面した時、ロボットは何ができるでしょうか?

ウイルスのさらなる拡散を防ぐため、米国で初めて新型肺炎に感染した患者は隔離室に隔離され、治療中はロボ...

機械学習とデータサイエンスは戦略的な洞察を提供する

デジタル時代では、データが新たな通貨になりました。世界中の組織が、その大きな可能性を引き出すために機...

2018年に人工知能がビジネスに及ぼす10のインパクト

[[220065]]人工知能 (AI) と機械学習は多くの企業にとって流行語となっていますが、これら...

中国語と英語で最大のAIモデルの世界記録が樹立され、大規模モデル競争の新たなステージが到来

[[429193]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

機械学習の仕組み - コード例

誰が生き残るかを予測するモデルをトレーニングします。 [注: ここでモデルを自分で構築するには、完全...