Spaces:

Didier
/

Text_translation

Running

Didier commited on Sep 16, 2024

Commit

9f5045e

1 Parent(s): 1ce396b

Choosing the 10b model loaded in 8 bits

Files changed (2) hide show

app.py CHANGED Viewed

@@ -12,12 +12,15 @@ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 import gradio as gr
 #
-# Load the "small" MADLAD400 model (3 billion parameters)
 #
-model_name = "google/madlad400-3b-mt"
 tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True)
 model = AutoModelForSeq2SeqLM.from_pretrained(
-    model_name, device_map="auto", torch_dtype=torch.float16)
 model = torch.compile(model)
 #

 import gradio as gr
 #
+# Load the "small" MADLAD400 model
 #
+model_name = "google/madlad400-10b-mt"
 tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True)
 model = AutoModelForSeq2SeqLM.from_pretrained(
+    model_name,
+    device_map="auto",
+    torch_dtype=torch.float16,
+    load_in_8bit=True)
 model = torch.compile(model)
 #

requirements.txt CHANGED Viewed

@@ -2,6 +2,7 @@
 torch
 transformers
 accelerate
 sentencepiece
 tokenizers
 optimum

 torch
 transformers
 accelerate
+bitsandbytes
 sentencepiece
 tokenizers
 optimum