Spaces:

somosnlp-hackathon-2023
/

PodcastNER-GPTJ

Running

DavidFM43 commited on Jul 6, 2023

Commit

d28eaca

1 Parent(s): cb440a4

change model to sharded version

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,13 +6,11 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 peft_model_id = "hackathon-somos-nlp-2023/bertin-gpt-j-6b-ner-es"
 config = PeftConfig.from_pretrained(peft_model_id)
 model = AutoModelForCausalLM.from_pretrained(
-    config.base_model_name_or_path,
     return_dict=True,
     load_in_8bit=True,
     device_map="auto",
-    revision="half",
 )
-model.tie_weights()
 tokenizer = AutoTokenizer.from_pretrained(peft_model_id)
 # load the Lora model
 model = PeftModel.from_pretrained(model, peft_model_id)
@@ -28,9 +26,7 @@ def gen_entities(text):
     with torch.cuda.amp.autocast():
         output_tokens = model.generate(**batch, max_new_tokens=256, eos_token_id=50258)
-    response = tokenizer.batch_decode(
-        output_tokens.detach().cpu().numpy(), skip_special_tokens=False
-    )[0]
     return response[response.find("entities") : response.find("<EP>")]

 peft_model_id = "hackathon-somos-nlp-2023/bertin-gpt-j-6b-ner-es"
 config = PeftConfig.from_pretrained(peft_model_id)
 model = AutoModelForCausalLM.from_pretrained(
+    "DavidFM43/bertin-gpt-j-6b-half-sharded",
     return_dict=True,
     load_in_8bit=True,
     device_map="auto",
 )
 tokenizer = AutoTokenizer.from_pretrained(peft_model_id)
 # load the Lora model
 model = PeftModel.from_pretrained(model, peft_model_id)
     with torch.cuda.amp.autocast():
         output_tokens = model.generate(**batch, max_new_tokens=256, eos_token_id=50258)
+    response = tokenizer.batch_decode(output_tokens.detach().cpu().numpy(), skip_special_tokens=False)[0]
     return response[response.find("entities") : response.find("<EP>")]