Spaces:

richardskimco
/

google-gemma

Sleeping

richardkimsm89 commited on Dec 18, 2024

Commit

5f71f8b

verified ·

1 Parent(s): 4505847

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -46,42 +46,39 @@ import gradio as gr
 from huggingface_hub import InferenceClient
 import os
-# Initialize Hugging Face Inference Client
 hf_token = os.getenv("HF_TOKEN")
 client = InferenceClient(api_key=hf_token)
-# Function to handle user inputs and fetch model responses
-def chatbot(input_text, history=[]):
-    #messages = [{"role": "user", "content": input_text}]
     messages = []
-    for user_input, bot_response in history:
-        messages.append({"role": "user", "content": user_input})
-        messages.append({"role": "assistant", "content": bot_response})
-    messages.append({"role": "user", "content": input_text})
     stream = client.chat.completions.create(
-        model="google/gemma-2-2b-it",
-        messages=messages,
-        #temperature=0.5,
-        #max_tokens=2048,
-        #top_p=0.7,
-        stream=True
     )
-    # Concatenate streamed response
     bot_response = "".join(chunk.choices[0].delta.content for chunk in stream)
-    # Update conversation history
-    history.append((input_text, bot_response))
     return bot_response, history
-# Gradio Interface
-demo = gr.Interface(
-    fn=chatbot,
-    inputs=["text", "state"],
-    outputs=["text", "state"],
-    title="Gemma Chatbot"
-)
-# Launch Gradio App
-demo.launch()

 from huggingface_hub import InferenceClient
 import os
 hf_token = os.getenv("HF_TOKEN")
 client = InferenceClient(api_key=hf_token)
+def fn(prompt, history=[]):
     messages = []
+    for user_prompt, bot_response in history:
+        messages.append({"role": "user", "content": user_prompt})
+        messages.append({"role": "bot", "content": bot_response})
+    messages.append({"role": "user", "content": prompt})
     stream = client.chat.completions.create(
+        model = "google/gemma-2-2b-it",
+        messages = messages,
+        #temperature = 0.5,
+        #max_tokens = 2048,
+        #top_p = 0.7,
+        stream = True
     )
     bot_response = "".join(chunk.choices[0].delta.content for chunk in stream)
+    history.append((prompt, bot_response))
     return bot_response, history
+app = gr.Interface(
+    fn = fn,
+    inputs = [gr.Textbox(label = "Input")],
+    outputs = [gr.Textbox(label = "Output")],
+    title = "Google Gemma",
+    description = "Chatbot",
+    examples = [
+        ["Hello, World."]
+    ]
+).launch()