Update Descripcion.txt
Browse files- Descripcion.txt +39 -25
Descripcion.txt
CHANGED
@@ -1,39 +1,53 @@
|
|
1 |
-
Problema, soluci贸n, input y output
|
2 |
-
|
3 |
-
- Problema principal
|
|
|
4 |
La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
|
5 |
|
6 |
-
- Soluci贸n
|
|
|
7 |
Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
|
8 |
|
9 |
-
- Especificaciones
|
|
|
10 |
Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
|
11 |
Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
|
12 |
Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
|
13 |
|
14 |
-
Descripci贸n de los modelos, clasificaci贸n y limitaciones
|
15 |
-
|
16 |
-
Modelos utilizados
|
17 |
-
|
18 |
-
|
19 |
|
20 |
-
|
21 |
-
|
22 |
-
|
23 |
-
|
|
|
|
|
|
|
|
|
24 |
|
25 |
-
|
26 |
-
|
27 |
|
28 |
-
|
29 |
-
|
30 |
-
|
31 |
-
|
|
|
32 |
|
33 |
-
-
|
34 |
-
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente.
|
35 |
|
36 |
-
|
37 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
38 |
2.Los recursos necesarios aumentan significativamente cuando ambos modelos se usan en tiempo real
|
39 |
-
|
|
|
|
1 |
+
# Problema, soluci贸n, input y output
|
2 |
+
|
3 |
+
- *Problema principal*:
|
4 |
+
|
5 |
La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
|
6 |
|
7 |
+
- *Soluci贸n*:
|
8 |
+
|
9 |
Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
|
10 |
|
11 |
+
- *Especificaciones*:
|
12 |
+
|
13 |
Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
|
14 |
Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
|
15 |
Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
|
16 |
|
17 |
+
# Descripci贸n de los modelos, clasificaci贸n y limitaciones
|
18 |
+
|
19 |
+
## Modelos utilizados
|
20 |
+
### Whisper:
|
21 |
+
**Descripci贸n**: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
|
22 |
|
23 |
+
**Clasificaci贸n**:
|
24 |
+
|
25 |
+
- Tipo de tarea -> ASR
|
26 |
+
|
27 |
+
- Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas
|
28 |
+
|
29 |
+
- Dominio de uso -> Procesamiento de Lenguaje Natural y Reconocimiento de Voz
|
30 |
+
|
31 |
|
32 |
+
### MBart:
|
33 |
+
**Descripci贸n**: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
|
34 |
|
35 |
+
**Clasificaci贸n**:
|
36 |
+
|
37 |
+
- Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto
|
38 |
+
|
39 |
+
- Modelo preentrenado -> preentrenado en tareas de m煤ltiples idiomas y ajustable para traducci贸n espec铆fica
|
40 |
|
41 |
+
- Dominio de uso -> Procesamiento de lenguaje natural y traducci贸n
|
|
|
42 |
|
43 |
+
### Sinergia para estos dos modelos:
|
44 |
+
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s,
|
45 |
+
y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
|
46 |
+
|
47 |
+
**Posibles limitaciones generales**
|
48 |
+
|
49 |
+
1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n
|
50 |
+
|
51 |
2.Los recursos necesarios aumentan significativamente cuando ambos modelos se usan en tiempo real
|
52 |
+
|
53 |
+
3.Existe la posibilidad de incompatibilidades ling眉isticas o culturales cuando se precise de traducir frases, dichos o expresiones que no tienen un significado directo en otro idioma
|