Spaces:

Didier
/

Text_translation

Sleeping

Didier commited on Sep 24, 2024

Commit

fc9e3cb

1 Parent(s): ea7bc2f

Switching text chunking and using 7b instead of 3b

Files changed (2) hide show

app.py CHANGED Viewed

@@ -169,6 +169,7 @@ def translate_text(
     tgt_lang = 'en' # Default "easy" language
     chunks = build_text_chunks(text, src_lang, sents_per_chunk)
     #translated_text_Helsinki = translate_with_Helsinki(
     #    chunks, src_lang, tgt_lang, input_max_length, output_max_length)

     tgt_lang = 'en' # Default "easy" language
     chunks = build_text_chunks(text, src_lang, sents_per_chunk)
+    chunks = [text, ]
     #translated_text_Helsinki = translate_with_Helsinki(
     #    chunks, src_lang, tgt_lang, input_max_length, output_max_length)

model_translation.py CHANGED Viewed

@@ -55,7 +55,7 @@ class ModelMADLAD(metaclass=Singleton):
     """Loads an instance of the Google MADLAD model (3B).
     """
     def __init__(self):
-        self._model_name = "google/madlad400-3b-mt"
         self._tokenizer = AutoTokenizer.from_pretrained(
             self.model_name, use_fast=True
         )

     """Loads an instance of the Google MADLAD model (3B).
     """
     def __init__(self):
+        self._model_name = "google/madlad400-7b-mt"
         self._tokenizer = AutoTokenizer.from_pretrained(
             self.model_name, use_fast=True
         )