Update README.md
Browse files
README.md
CHANGED
@@ -69,6 +69,14 @@ El texto transcrito es procesado por el tokenizador de MBart, para luego convert
|
|
69 |
| generated_tokens = translation_model.generate( **model_inputs, forced_bos_token_id=tokenizer.lang_code_to_id[target_language]) |
|
70 |
|:--------------------------------------------------------------------------------------------------------------------------------:|
|
71 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
72 |
### Sinergia para estos dos modelos:
|
73 |
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en inglés,
|
74 |
y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
|
|
|
69 |
| generated_tokens = translation_model.generate( **model_inputs, forced_bos_token_id=tokenizer.lang_code_to_id[target_language]) |
|
70 |
|:--------------------------------------------------------------------------------------------------------------------------------:|
|
71 |
|
72 |
+
|
73 |
+
Los tokens generados se convierten de nuevo a texto en el idioma deseado.
|
74 |
+
|
75 |
+
| translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0] |
|
76 |
+
|:---------------------------------------------------------------------------------------:|
|
77 |
+
|
78 |
+
|
79 |
+
|
80 |
### Sinergia para estos dos modelos:
|
81 |
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en inglés,
|
82 |
y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
|