Spaces:

Daemontatox
/

Mawared-Support-Assistant

Running

Daemontatox commited on Jan 13

Commit

75f78f2

verified ·

1 Parent(s): a76f205

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -181,7 +181,7 @@ quantization_config = BitsAndBytesConfig(
-model_id = "Daemontatox/MawaredT3"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
@@ -189,7 +189,7 @@ model = AutoModelForCausalLM.from_pretrained(
          torch_dtype=torch.float16,
          device_map="cuda",
          attn_implementation="flash_attention_2",
-         quantization_config=quantization_config
 )
 pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=8192 )

+model_id = "Daemontatox/Mawared_GS"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
          torch_dtype=torch.float16,
          device_map="cuda",
          attn_implementation="flash_attention_2",
+         #quantization_config=quantization_config
 )
 pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=8192 )