MarcoM003 commited on
Commit
02f3c95
·
verified ·
1 Parent(s): b6076a3

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +8 -0
README.md CHANGED
@@ -69,6 +69,14 @@ El texto transcrito es procesado por el tokenizador de MBart, para luego convert
69
  | generated_tokens = translation_model.generate( **model_inputs, forced_bos_token_id=tokenizer.lang_code_to_id[target_language]) |
70
  |:--------------------------------------------------------------------------------------------------------------------------------:|
71
 
 
 
 
 
 
 
 
 
72
  ### Sinergia para estos dos modelos:
73
  Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en inglés,
74
  y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
 
69
  | generated_tokens = translation_model.generate( **model_inputs, forced_bos_token_id=tokenizer.lang_code_to_id[target_language]) |
70
  |:--------------------------------------------------------------------------------------------------------------------------------:|
71
 
72
+
73
+ Los tokens generados se convierten de nuevo a texto en el idioma deseado.
74
+
75
+ | translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0] |
76
+ |:---------------------------------------------------------------------------------------:|
77
+
78
+
79
+
80
  ### Sinergia para estos dos modelos:
81
  Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en inglés,
82
  y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente