3 つのヒープ内キャッシュ アルゴリズム (ソース コードと設計アイデア付き)

3 つのヒープ内キャッシュ アルゴリズム (ソース コードと設計アイデア付き)

トレードオフを最もよく反映するコンピュータ システムのテクノロジといえば、それはキャッシュです。高速コンポーネントと低速コンポーネント間の速度差を調整するには、中間キャッシュ層を追加することが、この競合を解決する最も効果的なソリューションです。

[[325756]]

その中でも、JVM ヒープ キャッシュはキャッシュ システムの重要な部分であり、最も一般的に使用されるアルゴリズムは FIFO/LRU/LFU です。

  1. FIFO は、先入れ先出しの単純なキューです。
  2. LRU は Least Recently Used の略で、最も長く使用されていないデータが最初に削除されます。それは時間の次元です。
  3. LFU は最も最近使用されていないデータであり、アクセス回数が最も少ないデータが最初に削除されます。それは統計的な次元です。

有効期限もキャッシュの重要な機能だからです。したがって、これら 3 つのキャッシュ アルゴリズムを設計する場合、有効期限を保存するための追加のストレージ スペースが必要になります。

以下では、これら 3 つのキャッシュ アルゴリズムの動作と設計のポイントについて説明しますが、現時点では高同時実行環境は考慮されていません。

先入れ先出し

先入れ先出し。キャッシュ容量がいっぱいの場合、最初にキャッシュに追加されたデータが最初に削除されます。これを実装するには、内部的にキューを使用できます。

操作する

  • Object get(key): 保存されたデータを取得します。データが存在しないか期限が切れている場合は null が返されます。
  • void put(key, value, expireTime): キャッシュに追加します。 このキーがすでに存在するかどうかに関係なく、新しいキーとして扱われます (古いキーは削除されます)。十分なスペースがない場合は、期限切れのキーが削除されます。スペースがない場合は、キャッシュに追加された最も古いキーが削除されます。有効期限が指定されていない場合は、自動的に期限切れになることはありません。
  • 通常の FIFO とは異なり、キーに有効期限を持たせることができるので、この問題を設計する際にはこれに注意する必要があります。 (インタビューのポイントでもある、アルゴリズムよりもデザイン重視)

普通の FIFO は誰でも簡単に書けると思いますが、有効期限を考慮すると、設計時にさらに考慮が必要になります。次の例は、同時実行環境を考慮しない FIFO 設計です。

デザインのアイデア

1) 通常の hashMap を使用してキャッシュ データを保存します。

2) キーの有効期限特性を保存するには、追加のマップが必要です。 この例では、TreeMap を使用し、「残りの生存時間」をキーとして取り、TreeMap のソート特性を活用します。

  1. パブリッククラス FIFOCache {
  2.    
  3. // アクセス時間でソートし、すべてのキーと値を保存します
  4. プライベート最終 Map<String,Value> CACHE = new LinkedHashMap<>();
  5.    
  6. //期限切れデータ、有効期限のあるキーのみ保存 
  7. // 現時点では並行性を考慮していないため、同時に重複するキーはないと考えられます。変更された場合、値はsetによって置き換えられます。  
  8. プライベート最終 TreeMap<Long, String> EXPIRED = new TreeMap<>();
  9.    
  10. プライベート最終int容量;
  11.    
  12. パブリックFIFOCache( int容量) {
  13. this.capacity = 容量;
  14. }
  15.    
  16. パブリックオブジェクト get(文字列キー) {
  17. //
  18. 値 value = CACHE.get( key );
  19. 値 == null場合
  20. 戻る ヌル;
  21. }
  22.    
  23. //有効期限が含まれていない場合
  24. long 期限切れ = value.expired;
  25. long now = System.nanoTime();
  26. //期限切れ
  27. if (期限切れ > 0 && 期限切れ <= 現在) {
  28. CACHE.remove(キー);
  29. EXPIRED.remove(期限切れ);
  30. 戻る ヌル;
  31. }
  32. 戻り値.値;
  33. }
  34.    
  35. public void put(文字列キー、オブジェクト値) {
  36. put(キー,値,-1);
  37. }
  38.    
  39.    
  40. public void put(String key ,Object value, int seconds) {
  41. //容量が足りない場合は期限切れのデータを削除する
  42. (容量< CACHE.size ())の場合{
  43. long now = System.nanoTime();
  44. //期限切れのものがあればすべて削除します
  45. イテレータ<Long> iterator = EXPIRED.keySet().iterator();
  46. (イテレータ.hasNext()) の間 {
  47. 長い_key = iterator.next ();
  48. // 期限が切れていたり、容量がまだオーバーフローしている場合は削除します
  49. if (_key > now) {
  50. 壊す;
  51. }
  52. // 期限切れのキーを一度にすべて削除する 
  53. 文字列 _value = EXPIRED.get(_key);
  54. CACHE.remove(_value);
  55. イテレータを削除します。
  56. }
  57. }
  58.    
  59. //容量がまだ不十分な場合は、最も早くアクセスされたデータを削除します
  60. 容量 < CACHE.size () の場合 {
  61. イテレータ<String> iterator = CACHE.keySet().iterator();
  62. (iterator.hasNext() && 容量 < CACHE.size ()) の場合 {
  63. 文字列 _key = iterator.next ();
  64. 値 _value = CACHE.get(_key);
  65. 長い有効期限 = _value.expired;
  66. 期限切れ > 0 の場合 {
  67. EXPIRED.remove(期限切れ);
  68. }
  69. イテレータを削除します。
  70. }
  71. }
  72.    
  73. //このキーがすでに存在する場合は、古いデータを削除します
  74. 現在の= CACHE.remove(キー);
  75. 現在の有効期限がnull の場合現在の有効期限が 0 より大きい場合
  76. EXPIRED.remove(現在の.expired);
  77. }
  78. //有効期限が指定されている場合
  79. if(秒数 > 0) {
  80. long expireTime = expiredTime(秒);
  81. EXPIRED.put(expireTime,キー);
  82. CACHE.put(キー、新しい値(expireTime、値));
  83. }それ以外{
  84. CACHE.put(キー、新しい値(-1、値));
  85. }
  86.    
  87. }
  88.    
  89. プライベートlong expiredTime( int expired) {
  90. System.nanoTime() + TimeUnit.SECONDS.toNanos(期限切れ)を返します
  91. }
  92.    
  93. パブリックvoid 削除(文字列キー) {
  94. 値 value = CACHE.remove( key );
  95. 値 == null場合
  96. 戻る;
  97. }
  98. long 期限切れ = value.expired;
  99. 期限切れ > 0 の場合 {
  100. EXPIRED.remove(期限切れ);
  101. }
  102. }
  103.    
  104.    
  105. クラス値{
  106. long expired; //有効期限、ナノ秒
  107. オブジェクトの値。
  108. 値(有効期限切れ,オブジェクト値) {
  109. this.expired = 期限切れ;
  110. this.value = 値;
  111. }
  112. }
  113. }

LRU

最も最近使われていないキャッシュは、最も一般的に使用されているキャッシュ アルゴリズムおよび設計スキームの 1 つです。その削除戦略は、「キャッシュ (ページ) がいっぱいになると、最も最近使われていないデータが最初に削除されます」というものです。利点は、設計と使用が簡単で、適用可能なシナリオの範囲が広いことです。アルゴリズムは、leetcode 146 (LRU キャッシュ) を参照できます。

操作する

  • Object get(key): キャッシュからキーに対応するデータを取得します。キーの有効期限が切れている場合は、キーを削除して null を返します。
  • void put(key, value, expired): kv を設定します。容量が不足している場合は、LRU 置換アルゴリズムに従って「最も長い未使用キー」を削除します。 期限切れのキーは LRU に従って最初に削除されることに注意してください。期限切れのキーがない場合は、期限切れでないキーが LRU に従って削除されます。有効期限が設定されていない場合は、自動的に期限切れにならないものとみなされます。
  • ここでの重要な設計は、従来の LRU とは異なる有効期限機能です。

デザインのアイデア

  • LRU の基本的なアルゴリズムを理解する必要があります。キーに対応するアクセス時間は、put または get が実行されるたびに更新される必要があります。キーの最新のアクセス時間を保存し、それを並べ替えることができるデータ構造が必要です。
  • 有効期限機能が含まれているため、有効期限付きのキーを追加のデータ構造に保存する必要があります。
  • 並行操作は現時点では考慮されません。空間の複雑さと時間の複雑さのバランスをとるようにしてください。
  • この質問は、純粋なアルゴリズムの質問というよりも、むしろ設計に関する質問です。

この質問のコードは基本的に FIFO と同じですが、唯一の違いは get() メソッドです。LRU の場合、get メソッドはアクセス時間をリセットする必要があります (つまり、キャッシュ内の順序を調整します)。

  1. パブリックオブジェクト get(文字列キー) {
  2. //
  3. 値 value = CACHE.get( key );
  4. 値 == null場合
  5. 戻る ヌル;
  6. }
  7.    
  8. //有効期限が含まれていない場合
  9. long 期限切れ = value.expired;
  10. long now = System.nanoTime();
  11. //期限切れ
  12. if (期限切れ > 0 && 期限切れ <= 現在) {
  13. CACHE.remove(キー);
  14. EXPIRED.remove(期限切れ);
  15. 戻る ヌル;
  16. }
  17. //FIFOと比較して、順序リセットを増やす
  18. CACHE.remove(キー);
  19. CACHE.put(キー、値);
  20. 戻り値.値;
  21. }

LFU

最も最近使用されていない、キャッシュ容量がいっぱいになった場合は、アクセス回数が最も少ない要素を削除します。アクセス回数が同じ複数の要素がある場合は、アクセスが最も長い要素を削除します。設計要件については、leetcode 460 (LFU キャッシュ) を参照してください。

  1. パブリッククラスLFUCache{
  2.    
  3. //kv を保存するためのメイン コンテナ
  4. プライベート Map<String, Object> keyToValue = new HashMap<>();
  5.    
  6. //各kの訪問回数を記録する
  7. プライベート Map<String, Integer > keyToCount = new HashMap<>();
  8.    
  9. //同じ回数キーリストにアクセスし、アクセス回数でソートし、値は同じアクセス回数のキーリストになります。
  10. プライベート TreeMap< Integer 、LinkedHashSet<String>> countToLRUKeys = new TreeMap<>();
  11.    
  12. プライベートint容量;
  13.    
  14. パブリックLFUCache( int容量) {
  15. this.capacity = 容量;
  16. // 初期化、デフォルトアクセスは1回、主に次の問題を解決するため
  17. }
  18.    
  19. パブリックオブジェクト get(文字列キー) {
  20. if (!keyToValue.containsKey(キー)) {
  21. 戻る ヌル;
  22. }
  23.    
  24. タッチ(キー);
  25. keyToValue.get(キー)を返します
  26. }
  27.    
  28. /**
  29. *キーにアクセスした場合は、そのアクセス回数を調整する必要があります。
  30. * @paramキー 
  31. */
  32. プライベートvoid touch(文字列キー) {
  33. 整数  count = keyToCount.get(キー);
  34. keyToCount.put( key , count + 1); //訪問回数を増やす
  35. //元の訪問回数リストから削除
  36. countToLRUKeys.get(カウント).remove(キー);
  37.    
  38. //キー統計リストへの呼び出しの最小回数が空の場合、統計への呼び出し回数を削除します
  39. countToLRUKeys.get( count ) .size () == 0 の場合
  40. countToLRUKeys.remove(カウント);
  41. }
  42.    
  43. //次に、このキーの統計を管理リストに追加します
  44. LinkedHashSet<String> countKeys = countToLRUKeys.get( count + 1);
  45. countKeys がnull場合
  46. countKeys = 新しい LinkedHashSet<>();
  47. countToLRUKeys.put( count + 1, countKeys);
  48. }
  49. countKeys.add (キー);
  50. }
  51.    
  52. パブリックvoid put(文字列キー、オブジェクト値) {
  53. (容量<= 0)の場合{
  54. 戻る;
  55. }
  56.    
  57. keyToValueにkey( key )が含まれる場合
  58. keyToValue.put(キー, 値 );
  59. タッチ(キー);
  60. 戻る;
  61. }
  62. //容量を超えたら、訪問回数が最も少ない要素を削除します
  63. ( keyToValue.size () >= 容量) の場合 {
  64. Map.Entry< Integer 、LinkedHashSet<String>> entry = countToLRUKeys.firstEntry();
  65. イテレータ<String> it = entry.getValue().iterator();
  66. 文字列evictKey = it.next ();
  67. 削除します。
  68. if (!it.hasNext()) {
  69. countToLRUKeys.remove(エントリのキーを取得します());
  70. }
  71. keyToCount.remove(evictKey);
  72. keyToValue.remove(evictKey);
  73.    
  74. }
  75.    
  76. keyToValue.put(キー, 値 );
  77. keyToCount.put(キー、1);
  78. LinkedHashSet<String> キー = countToLRUKeys.get(1);
  79. キーがnull場合
  80. キー = 新しい LinkedHashSet<>();
  81. countToLRUKeys.put(1,キー);
  82. }
  83. keys.add (キー);
  84. }
  85. }

終わり この記事では、キャッシュ構築への道筋を大まかに把握するために、3 つの基本的なキャッシュ アルゴリズムを比較します。

よりユーザーフレンドリーなキャッシュについては、Guava の実装を参照してください。これら 3 つのコード テンプレートがお役に立てば幸いです。

著者について: Sister Taste (xjjdog)、プログラマーが寄り道をすることを許可しない公開アカウント。インフラストラクチャと Linux に重点を置きます。 10 年間のアーキテクチャと 1 日あたり数千億のトラフィックを基に、私たちはお客様とともに高並行性の世界を探求し、新たな体験をお届けします。

<<:  AIがクラウドコンピューティングを再定義し、ビジネス効率を向上させる方法

>>:  クラゲのように見える7cmのガジェットは、実際にはチーターに似た最速のソフトロボットです

ブログ    
ブログ    

推薦する

...

機械学習の発展の歴史と啓蒙

[[188091]]近年、人工知能の目覚ましい発展、特にAlphaGoと韓国のチェスプレイヤー、イ・...

人工知能がコロナウイルスを終わらせる

人工知能と新型コロナウイルスには共通点がないように思えますが、本質的には同じものです。 [[4391...

TensorFlow 2 入門ガイド。初心者必見です!

Tensorflow とは何ですか? TensorFlow は Google が立ち上げたディープ...

...

...

...

SKU多次元属性状態判定アルゴリズム

問題の説明この問題は、製品属性を選択するシナリオから発生します。たとえば、服や靴を購入するときは、通...

...

...

...

...