F#の並列ソートアルゴリズムは実装が簡単

F# の並列ソートアルゴリズムで最も一般的な方法の 1 つは、まず処理するデータを複数の部分に分割し、次に異なるスレッド (CPU) で処理することです。すべてのスレッドが処理を完了すると、結果が集められ、独立したスレッドでマージされて最終結果が形成されます。分割する場合、各スレッドが独自の独立したデータのみにアクセスし、グローバルデータや他のスレッドのデータ (ここでのデータは読み取り専用ではないデータを指します) にアクセスしないようにします。結果をマージする場合は、効率的なアルゴリズムを使用してマージする必要があります。

ソートアルゴリズムには、マージソートアルゴリズムがあります。まず、多方向マージソートアルゴリズムを記述し、ソートする配列をCPUの数に分割し、各CPUに各部分をソートさせ、すべてのスレッドがソートを完了したら、それらをまとめて独立したスレッドでマージソートを実行します。

もう一度コードを説明します。F# に馴染みのない方もいるかもしれません。

1. マージアルゴリズムの考え方は、各スコアグループの最小の添字から始めて、複数のソート済み配列を 1 つの大きなソート済み配列にマージすることです。最小のものを大きな配列に入れ、次にこの配列の添字を 1 つ増やしてから再度比較し、最小のものを大きな配列に入れ、すべての小さな配列の添字が末尾を指すまでこれを繰り返します。一時変数 min が使用されるため、 mutable キーワードで変更されます。

2. F# 配列の長さは、Array.length メソッドを使用して取得されます。変数と配列の代入記号は、= ではなく <- です。= は C# の == に相当します。F# には、continue や break などのキーワードはありません。

3. async キーワードは新しい並列プリミティブです。これによって展開されたコードは、f# によってスレッドプール内で自動的に非同期実行されます。結果を返す場合は、let! キーワードと return! キーワードを使用する必要があります。ソートは配列に対してのみ実行され、何も返さないため、ここでは比較的単純です。

4. (fun ab -> a - b) はラムダ式であり、自動的にComparerに変換できます。、ソートの基準となる

5. Array.map は、配列内の各要素にメソッドを適用することを意味します。この時点では実行されませんが、パイプラインを介して Async.Parallel メソッドに渡されます。Async.Parallel メソッドは、非同期実行配列 Async<'a array> を返し、最後に Async.Run を使用して、Async.Parallel によって返された結果を実際に実行します。

6. |> はパイプラインを意味し、前の関数の結果が次の関数で使用されることを意味します。このように、1 つのステートメントで非常に一貫したロジックを表現できます。

F# 並列ソートアルゴリズムの全体的なコードは次のとおりです。

 1 #ライト
 2
 3 オープンシステム
 4 System.Diagnosticsを開く
 5 Microsoft.FSharp.Control.CommonExtensions を開く
 6
 7 let merge_sort destArray ソース cmp =
 8 N = Array.length ソースとする
 9 L = Array.length destArray - 1 とします
10 posArr = Array.create N 0 とします
11 i = 0からLまで
12 変更可能な最小値を -1 にする
13 j = 0からN - 1まで
14 posArr.[j] >= Array.length source.[j] の場合 ()
 15 その他
16 min = -1 の場合、min <- j
 17 その他
18 (cmp source.[j].[posArr.[j]] source.[min].[posArr.[min]]) < 0 の場合、min <- j
 19 min = -1 の場合 ()
その他20
 21 destArray.[i] <- source.[min].[posArr.[min]]
 22 位置[分] <- 位置[分] + 1
 23
 24 並列ソートをcmp arr =にする
25 プロセッサカウントを Environment.ProcessorCount とします。
 26 partArray = Array.create プロセッサカウント [||]
 27 可変長のまま = Array.length arr
 28 partLen = Array.length arr / プロセッサカウント
29
 30 i = 0 からprocessorCount - 1 まで
31 i = プロセッサカウント - 1 の場合
32 temp_arr = Array.create を 0 のままにする
33 Array.Copy(arr, i*partLen, temp_arr, 0, 残り)
 34 部分配列.[i] <- temp_arr
 35 その他
36 temp_arr = Array.create partLen 0 とする
37 Array.Copy(arr, i*partLen, temp_arr, 0, partLen)
 38 残り <- 残り - partLen
 39 部分配列.[i] <- temp_arr
 40
 41 let a_sort_one arr =
 42 非同期 {
 43 配列.sort cmp arr
 44 }
 45
 46 a_sort_all = とします
47 部分配列
48 |> Array.map (fun f -> a_sort_one f)
 49 |> 非同期並列
50 |> 非同期実行
51
 52 すべて並べ替え
53 ret = Array.create (Array.length arr) 0 を実行します。
 54 merge_sort ret partArray (fun ab -> a - b)
 55 ret
 56
 57 arr = Array.create 1000000 0 とします
58 rnd = new Random() とします
59 i = 0 から Array.length arr - 1 まで
60 arr.[i] <- rnd.Next()
 61
 62 stop = Stopwatch.StartNew() を実行します。
 63 停止、開始
64 sorted_arr = parallel_sort (fun ab -> ab) arr とします
65 停止。停止
66 printfn "並列ソート結果\r\n=%A\r\n所要時間 %d ミリ秒" sorted_arr stop.ElapsedMilliseconds
 67
 68 stop2 = Stopwatch.StartNew() とします
69 Array.sort (fun ab -> ab) arr
 70 停止。停止
71 printfn "シリアルソート結果\r\n=%A\r\n所要時間 %d ミリ秒" arr stop2.ElapsedMilliseconds
 72
 73 コンソール.ReadKey(true)