fix readme

Dominic789654 · Dominic789654 · commit ad1989d78a3d · 2025-03-05T23:29:54.000+08:00
Signed-off-by: Dominic789654 &lt;xliu29@gmu.edu&gt;
diff --git a/README.md b/README.md
@@ -77,7 +77,7 @@ Finally we provide wrapper presses that can be combined with other presses:
 - `PerLayerCompressionPress` ([source](kvpress/presses/per_layer_compression_press.py)): compress each layer with a different compression ratio (experimental)
 - `ComposedPress` ([source](kvpress/presses/composed_press.py)): compose multiple presses together by chaining their forward hooks
 - `KeyRerotationPress` ([source](kvpress/presses/key_rerotation_press.py)): rerotate pruned keys to have continuous RoPE embeddings
-- `ChunkKVPress` ([source](kvpress/presses/chunkkv_press.py), [paper](https://arxiv.org/abs/2502.00299)): implements the ChunkKV compression method that selects whole chunks based on their importance scores. This approach differs from ChunkPress by maintaining chunk-level granularity during selection, which helps preserve local attention patterns. The method is particularly effective for long sequences where maintaining contextual coherence is important.
+- `ChunkKVPress` ([source](kvpress/presses/chunkkv_press.py), [paper](https://arxiv.org/abs/2502.00299)): compresses by selecting important chunks, preserving semantic coherence
 - `ChunkPress` ([source](kvpress/presses/chunk_press.py), [paper](https://direct.mit.edu/tacl/article/doi/10.1162/tacl_a_00716/125280)): compress the KV cache on each sequence chunk separately. This can yield to more uniform compression across long sequences
 - `CriticalKVPress` and `CriticalAdaKVPress` ([source](kvpress/presses/criticalkv_press.py), [paper](https://arxiv.org/abs/2502.03805)): refine the scores using the L1 norm of Wo @ values, coupled with a two-stage selection.
 
diff --git a/kvpress/presses/chunk_press.py b/kvpress/presses/chunk_press.py
@@ -50,7 +50,6 @@ def compress(
         assert attentions is None, "ChunkPress does not support attentions."
 
         kv_len = keys.shape[2]
-
         indices = []
         for i in range(0, kv_len, self.chunk_length):
             chunk_scores = self.press.score(