Spaces:

srinivasbilla
/

vc_chat

Sleeping

srinivasbilla commited on Feb 4

Commit

957474e

verified ·

1 Parent(s): a3ded10

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,18 +12,18 @@ from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, WhisperTokeni
 from kokoro import KPipeline
 import soundfile as sf
 import subprocess
-# subprocess.run(
-#     "pip install flash-attn --no-build-isolation",
-#     env={"FLASH_ATTENTION_SKIP_CUDA_BUILD": "TRUE"},
-#     shell=True,
-# )
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16
-MODEL_NAME = "openai/whisper-tiny"
 model = AutoModelForSpeechSeq2Seq.from_pretrained(
-    MODEL_NAME, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True
 )
 model.to(device)

 from kokoro import KPipeline
 import soundfile as sf
 import subprocess
+subprocess.run(
+    "pip install flash-attn --no-build-isolation",
+    env={"FLASH_ATTENTION_SKIP_CUDA_BUILD": "TRUE"},
+    shell=True,
+)
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16
+MODEL_NAME = "openai/whisper-large-v3-turbo"
 model = AutoModelForSpeechSeq2Seq.from_pretrained(
+    MODEL_NAME, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True, attn_implementation="flash_attention_2"
 )
 model.to(device)