gradjitta
/

Poro-34B-AWQ

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions Community

gradjitta commited on Nov 15, 2023

Commit

d74711b

·

1 Parent(s): 8de5edd

Update README.md

Files changed (1) hide show

README.md +40 -0

README.md CHANGED Viewed

@@ -33,6 +33,46 @@ model.save_quantized(quant_path)
 tokenizer.save_pretrained(quant_path)
 ```
 #### Work supported by https://datacrunch.io/

 tokenizer.save_pretrained(quant_path)
 ```
+#### generate
+```
+from awq import AutoAWQForCausalLM
+from transformers import AutoTokenizer
+from transformers import GenerationConfig
+model_path = "gradjitta/Poro-34B-AWQ"
+model = AutoAWQForCausalLM.from_quantized(model_path, fuse_layers=True, trust_remote_code=False, safetensors=True)
+tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=False)
+def generate(instruction):
+    prompt = instruction
+    inputs = tokenizer(prompt, return_tensors="pt")
+    input_ids = inputs["input_ids"].cuda()
+    generation_output = model.generate(
+            input_ids=input_ids,
+            generation_config=GenerationConfig(pad_token_id=tokenizer.pad_token_id, temperature=1.0, top_p=0.99, top_k=50, num_beams=1, do_sample=True),
+            return_dict_in_generate=True,
+            output_scores=True,
+            max_new_tokens=256
+    )
+    for seq in generation_output.sequences:
+        output = tokenizer.decode(seq)
+        print(output)
+generate("Suomalainen runo elämästä:")
+```
+##### output
+```
+Suomalainen runo elämästä:
+- se alkaa
+- sitten ei enää mikään riitä
+- se päättyy ja se alkaa</s>
+```
 #### Work supported by https://datacrunch.io/