Spaces:

MarcoM003
/

Proyecto1-ASR_Traduccion

Sleeping

MarcoM003 commited on Nov 19, 2024

Commit

02f3c95

verified ·

1 Parent(s): b6076a3

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -69,6 +69,14 @@ El texto transcrito es procesado por el tokenizador de MBart, para luego convert
 | generated_tokens = translation_model.generate(   **model_inputs, forced_bos_token_id=tokenizer.lang_code_to_id[target_language]) |
 |:--------------------------------------------------------------------------------------------------------------------------------:|
 ### Sinergia para estos dos modelos:
     Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en inglés,
     y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente

 | generated_tokens = translation_model.generate(   **model_inputs, forced_bos_token_id=tokenizer.lang_code_to_id[target_language]) |
 |:--------------------------------------------------------------------------------------------------------------------------------:|
+Los tokens generados se convierten de nuevo a texto en el idioma deseado.
+| translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0] |
+|:---------------------------------------------------------------------------------------:|
 ### Sinergia para estos dos modelos:
     Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en inglés,
     y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente