sarpba commited on
Commit
b1bd3a1
·
verified ·
1 Parent(s): b419333

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +16 -0
README.md CHANGED
@@ -10,7 +10,23 @@ model-index:
10
  - name: whisper-base-hu-V2
11
  results: []
12
  ---
 
13
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
14
  <!-- This model card has been generated automatically according to the information the Trainer had access to. You
15
  should probably proofread and complete it, then remove this comment. -->
16
 
 
10
  - name: whisper-base-hu-V2
11
  results: []
12
  ---
13
+ # képzési információ
14
 
15
+ A modell, egy újragondolt adatbázissal került kiképzésre.
16
+
17
+ Az adatbázisból ki lettek véve:
18
+
19
+ - a numerikus számok, ezért a modell az elhangzott számokat szövegesen fogja leírni
20
+ - speciális karakterek, ezért ezeket is fonetikusan fogja leírni
21
+ - mozaikszavak
22
+
23
+ Ezek miatt a változtatások miatt a WER elszállt kicsit, viszont a normalizált WER, tovább javult. A hipernormalizált WER vélhetően mégjobb lenne (ahhol a tesztataok is át lennének javítva a fentiek szerint).
24
+
25
+ A képzés ezesetben a transformer könyvtár mintascriptjével történt: https://github.com/huggingface/transformers/tree/main/examples/pytorch/speech-recognition#whisper-model egyedi 2000 órás adatkészleten, ami most a CV17 train+validate spliteket is tartalmazta.
26
+
27
+
28
+ <!-- This model card has been generated automatically according to the information the Trainer had access to. You
29
+ should probably proofread and complete it, then remove this comment. -->
30
  <!-- This model card has been generated automatically according to the information the Trainer had access to. You
31
  should probably proofread and complete it, then remove this comment. -->
32