Spaces:

pyresearch
/

Microsoftphi2

Sleeping

pyresearch commited on Feb 2, 2024

Commit

9d27c6c

verified ·

1 Parent(s): 4a40fb3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,32 +2,29 @@ import streamlit as st
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
-# Load model and tokenizer
-tokenizer = AutoTokenizer.from_pretrained("microsoft/phi-2", trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained("microsoft/phi-2", trust_remote_code=True)
-# Move model to CPU
-model.to("cpu")
-# Streamlit app
-st.title("Text Generation with Transformers")
-# Input prompt
-prompt = st.text_input("Enter your prompt:")
-# Generate button
 if st.button("Generate"):
     with torch.no_grad():
-        # Tokenize and generate output
-        token_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt")
         output_ids = model.generate(
-            token_ids.to(model.device),
             max_new_tokens=512,
             do_sample=True,
             temperature=0.1
         )
-    # Decode and display the generated text
     generated_text = tokenizer.decode(output_ids[0][token_ids.size(1):])
     st.text("Generated Text:")
-    st.text(generated_text)

 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
+# Use GPU if available
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+st.title("Text Generation with Hugging Face Transformers")
+# Input prompt from user
+prompt = st.text_area("Enter a prompt:", "this news is real pyresearch given right computer vision videos?")
+# Load model and tokenizer
+tokenizer = AutoTokenizer.from_pretrained("microsoft/phi-2", trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained("microsoft/phi-2", torch_dtype="auto", device=device, trust_remote_code=True)
+# Generate text on button click
 if st.button("Generate"):
     with torch.no_grad():
+        token_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt").to(device)
         output_ids = model.generate(
+            token_ids,
             max_new_tokens=512,
             do_sample=True,
             temperature=0.1
         )
     generated_text = tokenizer.decode(output_ids[0][token_ids.size(1):])
     st.text("Generated Text:")
+    st.write(generated_text)