Spaces:

MeBai
/

openai-whisper-large-v3-turbo-dev

Sleeping

MeBai commited on Oct 21, 2024

Commit

a151b3f

verified ·

1 Parent(s): 4c1eb71

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -48,10 +48,18 @@ def transcribe(audio_path):
     #------
-    audio_input = processor(audio_path, return_tensors="pt", sampling_rate=16000).input_values
     with torch.no_grad():
-        predicted_ids = model.generate(audio_input)
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)[0]
     return transcription

     #------
+    audio_cnt, sr = librosa.load(audio_path, sr=16000)
+    # 将音频数据传递给 processor
+    input_values = processor(audio, sampling_rate=16000, return_tensors="pt").input_values
+    # 模型推理
     with torch.no_grad():
+        predicted_ids = model.generate(input_values)
+    # 解码得到转录结果
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)[0]
     return transcription