Spaces:

fnlp
/

MOSS-TTSD

Running on Zero

yhzx233 commited on Jul 4

Commit

8a472c5

1 Parent(s): 7ddb63f

feat: use static kv cache

Files changed (1) hide show

generation_utils.py CHANGED Viewed

@@ -375,6 +375,7 @@ def process_batch(batch_items, tokenizer, model, spt, device, system_prompt, sta
         outputs = model.generate(
             input_ids=input_ids,
             attention_mask=attention_mask,
         )
         print(f"Original outputs shape: {outputs.shape}")
         print(f"Start value: {start}")

         outputs = model.generate(
             input_ids=input_ids,
             attention_mask=attention_mask,
+            cache_implementation="static",
         )
         print(f"Original outputs shape: {outputs.shape}")
         print(f"Start value: {start}")