Spaces:

Yazael
/

ASMRSpace

Paused

Yazael commited on Jan 20

Commit

5d0da6c

verified ·

1 Parent(s): 17e964b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -61,14 +61,16 @@ def transcribe_common(audio: str, model: str) -> str:
         audio.export("temp.wav", format="wav")
         y, sr = librosa.load("temp.wav", mono=True, sr=16000)
         Path("temp.wav").unlink()
-    # Get duration of audio
-   # duration = librosa.get_duration(y=y, sr=sr)
-   # logger.info(f"Duration: {duration:.2f}s")
-   # if duration > 15:
-   #     logger.error(f"Audio too long, limit is 15 seconds, got {duration:.2f}s")
-   #     return f"Audio too long, limit is 15 seconds, got {duration:.2f}s"
     start_time = time.time()
-    result = pipe_dict[model](y, generate_kwargs=generate_kwargs)["text"]
     end_time = time.time()
     logger.success(f"Finished in {end_time - start_time:.2f}s\n{result}")
     return result

         audio.export("temp.wav", format="wav")
         y, sr = librosa.load("temp.wav", mono=True, sr=16000)
         Path("temp.wav").unlink()
+    # Calculate duration and decide parameters
+    duration = librosa.get_duration(y=y, sr=sr)
+    logger.info(f"Duration: {duration:.2f}s")
+    kwargs = generate_kwargs.copy()
+    if duration > 30:  # Activar `return_timestamps` para audios largos
+        kwargs["return_timestamps"] = True
     start_time = time.time()
+    result = pipe_dict[model](y, generate_kwargs=kwargs)["text"]
     end_time = time.time()
     logger.success(f"Finished in {end_time - start_time:.2f}s\n{result}")
     return result