MarcoM003 commited on
Commit
6a14578
verified
1 Parent(s): 9dd91b9

Update Descripcion.txt

Browse files
Files changed (1) hide show
  1. Descripcion.txt +39 -25
Descripcion.txt CHANGED
@@ -1,39 +1,53 @@
1
- Problema, soluci贸n, input y output:
2
- ===================================
3
- - Problema principal:
 
4
  La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
5
 
6
- - Soluci贸n:
 
7
  Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
8
 
9
- - Especificaciones:
 
10
  Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
11
  Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
12
  Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
13
 
14
- Descripci贸n de los modelos, clasificaci贸n y limitaciones:
15
- =========================================================
16
- Modelos utilizados.
17
- - Whisper:
18
- *Descripci贸n: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
19
 
20
- *Clasificacion:
21
- Tipo de tarea -> ASR.
22
- Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas.
23
- Dominio de uso -> Procesamiento de Lenguaje Natural y Reconocimiento de Voz
 
 
 
 
24
 
25
- - MBart:
26
- *Descripci贸n: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
27
 
28
- *Clasificaci贸n:
29
- Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto.
30
- Modelo preentrenado -> preentrenado en tareas de m煤ltiples idiomas y ajustable para traducci贸n espec铆fica.
31
- Dominio de uso -> Procesamiento de lenguaje natural y traducci贸n.
 
32
 
33
- - Sinergia para estos dos modelos:
34
- Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente.
35
 
36
- - Posibles limitaciones generales:
37
- 1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n.
 
 
 
 
 
 
38
  2.Los recursos necesarios aumentan significativamente cuando ambos modelos se usan en tiempo real
39
- 3.Existe la posibilidad de incompatibilidades ling眉isticas o culturales cuando se precise de traducir frases, dichos o expresiones que no tienen un significado directo en otro idioma.
 
 
1
+ # Problema, soluci贸n, input y output
2
+
3
+ - *Problema principal*:
4
+
5
  La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
6
 
7
+ - *Soluci贸n*:
8
+
9
  Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
10
 
11
+ - *Especificaciones*:
12
+
13
  Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
14
  Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
15
  Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
16
 
17
+ # Descripci贸n de los modelos, clasificaci贸n y limitaciones
18
+
19
+ ## Modelos utilizados
20
+ ### Whisper:
21
+ **Descripci贸n**: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
22
 
23
+ **Clasificaci贸n**:
24
+
25
+ - Tipo de tarea -> ASR
26
+
27
+ - Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas
28
+
29
+ - Dominio de uso -> Procesamiento de Lenguaje Natural y Reconocimiento de Voz
30
+
31
 
32
+ ### MBart:
33
+ **Descripci贸n**: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
34
 
35
+ **Clasificaci贸n**:
36
+
37
+ - Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto
38
+
39
+ - Modelo preentrenado -> preentrenado en tareas de m煤ltiples idiomas y ajustable para traducci贸n espec铆fica
40
 
41
+ - Dominio de uso -> Procesamiento de lenguaje natural y traducci贸n
 
42
 
43
+ ### Sinergia para estos dos modelos:
44
+ Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s,
45
+ y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
46
+
47
+ **Posibles limitaciones generales**
48
+
49
+ 1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n
50
+
51
  2.Los recursos necesarios aumentan significativamente cuando ambos modelos se usan en tiempo real
52
+
53
+ 3.Existe la posibilidad de incompatibilidades ling眉isticas o culturales cuando se precise de traducir frases, dichos o expresiones que no tienen un significado directo en otro idioma