MarcoM003 commited on
Commit
9601b76
verified
1 Parent(s): 57e4a00

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +8 -10
README.md CHANGED
@@ -15,13 +15,13 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
15
  ---
16
  # Problema, soluci贸n, input y output:
17
 
18
- - Problema principal:
19
  La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
20
 
21
- - Soluci贸n:
22
  Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
23
 
24
- - Especificaciones:
25
  Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
26
  Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
27
  Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
@@ -30,9 +30,9 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
30
 
31
  ## Modelos utilizados.
32
  ### Whisper:
33
- Descripci贸n: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
34
 
35
- Clasificacion:
36
  Tipo de tarea -> ASR
37
 
38
  Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas
@@ -41,11 +41,9 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
41
 
42
 
43
  ### MBart:
44
- Descripci贸n: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
45
-
46
- Clasificaci贸n:
47
-
48
 
 
49
  Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto
50
 
51
 
@@ -59,7 +57,7 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
59
  ### Sinergia para estos dos modelos:
60
  Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
61
 
62
- - Posibles limitaciones generales:
63
  1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n
64
 
65
 
 
15
  ---
16
  # Problema, soluci贸n, input y output:
17
 
18
+ - *Problema principal*:
19
  La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
20
 
21
+ - *Soluci贸n*:
22
  Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
23
 
24
+ - *Especificaciones*:
25
  Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
26
  Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
27
  Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
 
30
 
31
  ## Modelos utilizados.
32
  ### Whisper:
33
+ *Descripci贸n*: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
34
 
35
+ *Clasificacion*:
36
  Tipo de tarea -> ASR
37
 
38
  Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas
 
41
 
42
 
43
  ### MBart:
44
+ *Descripci贸n*: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
 
 
 
45
 
46
+ *Clasificaci贸n*:
47
  Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto
48
 
49
 
 
57
  ### Sinergia para estos dos modelos:
58
  Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
59
 
60
+ - *Posibles limitaciones generales*:
61
  1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n
62
 
63