Update README.md
Browse files
README.md
CHANGED
@@ -15,13 +15,13 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
|
|
15 |
---
|
16 |
# Problema, soluci贸n, input y output:
|
17 |
|
18 |
-
- Problema principal
|
19 |
La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
|
20 |
|
21 |
-
- Soluci贸n
|
22 |
Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
|
23 |
|
24 |
-
- Especificaciones
|
25 |
Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
|
26 |
Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
|
27 |
Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
|
@@ -30,9 +30,9 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
|
|
30 |
|
31 |
## Modelos utilizados.
|
32 |
### Whisper:
|
33 |
-
Descripci贸n
|
34 |
|
35 |
-
Clasificacion
|
36 |
Tipo de tarea -> ASR
|
37 |
|
38 |
Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas
|
@@ -41,11 +41,9 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
|
|
41 |
|
42 |
|
43 |
### MBart:
|
44 |
-
Descripci贸n
|
45 |
-
|
46 |
-
Clasificaci贸n:
|
47 |
-
|
48 |
|
|
|
49 |
Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto
|
50 |
|
51 |
|
@@ -59,7 +57,7 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
|
|
59 |
### Sinergia para estos dos modelos:
|
60 |
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
|
61 |
|
62 |
-
- Posibles limitaciones generales
|
63 |
1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n
|
64 |
|
65 |
|
|
|
15 |
---
|
16 |
# Problema, soluci贸n, input y output:
|
17 |
|
18 |
+
- *Problema principal*:
|
19 |
La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
|
20 |
|
21 |
+
- *Soluci贸n*:
|
22 |
Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
|
23 |
|
24 |
+
- *Especificaciones*:
|
25 |
Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
|
26 |
Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
|
27 |
Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
|
|
|
30 |
|
31 |
## Modelos utilizados.
|
32 |
### Whisper:
|
33 |
+
*Descripci贸n*: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
|
34 |
|
35 |
+
*Clasificacion*:
|
36 |
Tipo de tarea -> ASR
|
37 |
|
38 |
Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas
|
|
|
41 |
|
42 |
|
43 |
### MBart:
|
44 |
+
*Descripci贸n*: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
|
|
|
|
|
|
|
45 |
|
46 |
+
*Clasificaci贸n*:
|
47 |
Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto
|
48 |
|
49 |
|
|
|
57 |
### Sinergia para estos dos modelos:
|
58 |
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
|
59 |
|
60 |
+
- *Posibles limitaciones generales*:
|
61 |
1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n
|
62 |
|
63 |
|