R-PRM-Demo

Sleeping

kevinpro commited on Jul 18

Commit

e1185eb

verified ·

1 Parent(s): d26407b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,7 +15,6 @@ import nltk
 from functools import lru_cache
-print(os.getenv('key'))
 code_mapping = dict(sorted(code_mapping.items(), key=lambda item: item[0]))
 flores_codes = list(code_mapping.keys())
 target_languages = flores_codes  # 简化列表
@@ -64,14 +63,10 @@ def _translate(text: str, src_lang: str, tgt_lang: str):
             .numpy()
             .tolist()
         )
-        translated_chunk = model.generate(
             input_ids=torch.tensor([input_tokens]).to(device),
-            forced_bos_token_id=tokenizer.convert_tokens_to_ids(tgt_code),
-            max_length=len(input_tokens) + 50,
             num_return_sequences=1,
-            num_beams=5,
-            no_repeat_ngram_size=4,  # repetition blocking works better if this number is below num_beams
-            renormalize_logits=True,  # recompute token probabilities after banning the repetitions
         )
         translated_chunk = tokenizer.decode(
             translated_chunk[0], skip_special_tokens=True

 from functools import lru_cache
 code_mapping = dict(sorted(code_mapping.items(), key=lambda item: item[0]))
 flores_codes = list(code_mapping.keys())
 target_languages = flores_codes  # 简化列表
             .numpy()
             .tolist()
         )
+        translated_chunk = model(
             input_ids=torch.tensor([input_tokens]).to(device),
+            max_length=len(input_tokens) + 10000,
             num_return_sequences=1,
         )
         translated_chunk = tokenizer.decode(
             translated_chunk[0], skip_special_tokens=True