パフォーマンス最適化技術: アルゴリズム

パフォーマンス最適化技術: アルゴリズム

アルゴリズムとその実装にはさまざまな種類がありますが、この記事ではシングルコア、シングルスレッドのアルゴリズムではなく、マルチコア、マルチスレッドのアルゴリズムについて説明します。すべてのアルゴリズムの種類について説明するわけではありませんが (これは著者の能力を超えています)、マルチコア ネットワーク デバイスで一般的なアルゴリズムと、可能な最適化アプローチについて説明します。これらのアプローチの一部は検証されていますが、他のアプローチはまだアイデア段階にあり、データによってサポートされていません。

マルチコア アルゴリズムの最適化には、ロックフリーとロックレスの 2 つの目標があります。

ロックフリーは完全にロックフリーな設計であり、次の 2 つの方法で実装できます。

  • CPU ごとのデータは、その名前が示すように、各コアまたはスレッドに独自のプライベート データ構造があります (ここでのプライベートは、スレッド ローカル データとは異なります。ここでのプライベートは論理的にプライベートであるという意味であり、他のスレッドがこのデータにアクセスできないという意味ではありません。一方、スレッド ローカル データはスレッド プライベート データ構造であり、他のスレッドはアクセスできません。もちろん、論理的にプライベートであるか物理的にプライベートであるかに関係なく、共有データをスレッド プライベート データに変換することで、ロックや競合を回避できます)。グローバル変数は共有されますが、ローカル変数はプライベートであるため、より多くのローカル変数を使用することで、ロックフリーの目的も達成できます。
  • CAS は、アトミック操作である比較とスワップに基づいています (スピンロックの実装にも比較とスワップが必要ですが、スピンロックには LOCKED と UNLOCKED の 2 つの状態しかありませんが、CAS 変数には複数の状態があるという違いがあります)。次に、CAS の実装はハードウェアによって保証される必要があります (アトミック操作)。CAS は一度に 32 ビットを操作できますが、一度にメモリ ブロックを比較および変更できる MCAS もあります。 CAS に基づくデータ構造には統一された一貫した実装方法がないため、ロック ベースのアルゴリズムほど単純で直接的ではない場合があります。データ構造ごとに異なる CAS 実装方法があり、読者は自分で検索できます。

ロックレスの目的は、ロックを減らすことではなく、ロックの競合を減らすことです。これはロックの粒度に関係します。ロックの粒度が小さいほど、待機時間は短くなり、同時実行時間は長くなります。

ロックの競合では、ロックを取得した後に異なるスレッドがどのような異なるアクションを実行するかを考慮する必要があります。セッション プールの割り当てと解放を例に挙げます。複数のスレッドが同じセッション プールにアクセスし、セッションを割り当てたり解放したりするとします。セッション プールは tailq であり、割り当てはヘッドで行われ、解放はテールで行われます。

複数のスレッドが同時にセッション プールにアクセスする場合、セッション プールを保護するためにスピンロックが必要です。そうすると、割り当てと解放という 2 つの異なるアクションが互いに競合し、複数のスレッド上の割り当てまたは解放も互いに競合することになります。

ここで、割り当てに 1 つのロックを使用し、解放に 1 つのロックを使用して両端キューを生成することを検討できます。これにより、割り当てと解放の間の競合を減らすことができます。

http://www.parallellabs.com/2010/10/25/practical-concurrent-queue-algorithm/ (この記事を参照)。

2 つのプールを使用して、1 つのプールを割り当て、1 つのプールを解放することも検討できます。割り当てられたプールを使い切った後、2 つのプールのポインタを交換します (このとき、両方のプールが空の場合を検討します。これにより、割り当てと解放の競合が軽減されるだけで、この競合を完全に排除することはできません)。

ロックベースまたは CAS ベース (ロックフリー) のデータ構造のいずれであっても、ステート マシンが必要です。異なる状態で異なる処理を実行し、ロックの粒度を上げます。つまり、状態の数ではなく、状態マシンの数を増やし、状態保護の範囲を縮小します。これは実際に体験してみる必要があります。

元記事: パフォーマンス最適化の方法とテクニック: アルゴリズム

【編集者のおすすめ】

  1. パフォーマンス最適化技術に関する必須知識
  2. パフォーマンスの低下?ファイルサーバー容量ツールが原因を教えてくれ
  3. パフォーマンス最適化手法: コードレベルの最適化

<<:  MySQLインデックスの背後にあるデータ構造とアルゴリズムの原理

>>:  MySQL インデックスのデータ構造とアルゴリズム: インデックスの実装

ブログ    

推薦する

...

ChatGPTを超える最初のオープンソースモデルが登場?ネットユーザーはそれを信じない

大型モデルが人気となり、毎日さまざまな「ビッグ」ニュースを目にするようになりました。写真今日、もう一...

NLPモデル「包括的分析+評価ランキング」、CMUの最新ツールが優れたアイデアを見つけるのに役立ちます

[[396522]] CMU は、復旦大学とオハイオ州立大学の研究者と共同で、モデルの理解度分析と...

...

...

...

新たなAIの冬に対する最後の防衛線

新たなAIの冬が来るのではないかと心配している人は多い。 ML ソリューションは不足していませんが、...

人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?

人工知能の発展は65年の歴史があり、厳しい冬も栄光も経験してきました。シンボリックエキスパートシステ...

...

...

Keras 対 PyTorch: どちらが「ナンバーワン」のディープラーニング フレームワークでしょうか?

「最初のディープラーニングフレームワークをどのように選択するか」は、初心者にとって常に頭痛の種でし...

スマートセンサー: 従業員をオフィスに戻すための鍵となるか?

新型コロナウイルス感染症のパンデミックにより、多くの人々の働き方が変化しました。現在、多くの企業は、...

製造業の変革を促進、産業改革のためのAI主導ソリューション

製造業において、インダストリー 4.0 は単なる流行語ではなく、新たな現実となっています。新型コロナ...