Spaces:

xyizko
/

HF_Model_Test

Sleeping

File size: 2,837 Bytes

2ac4330
 
 
6a1d4c8
 
 
 
5bacd80
 
 
 
 
6a1d4c8
593e98b
 
5bacd80
 
 
 
 
 
593e98b
 
 
 
5bacd80
 
 
 
 
6a1d4c8
5bacd80
2ac4330
5bacd80
 
 
 
 
2ac4330
 
5bacd80
2ac4330
6a1d4c8
5bacd80
6a1d4c8
 
 
 
 
 
5bacd80
 
6a1d4c8
 
5bacd80
6a1d4c8
5bacd80
 
 
593e98b
5bacd80
 
593e98b
 
 
 
5bacd80
87569bb
5bacd80
2ac4330
5bacd80
593e98b
 
2ac4330
87569bb
 
593e98b
5bacd80
 
 
2ac4330
 
 
 
6a1d4c8

import gradio as gr
from huggingface_hub import InferenceClient

def respond(message, history, token, model, system_message, max_tokens, temperature, top_p):
    """
    Handle chat responses using the Hugging Face Inference API.
    """
    # Handle token and model defaults
    token = token.strip()
    model = model.strip()
    
    # Default model selection logic
    if not token:
        # Use default public model when no token is provided
        model = "HuggingFaceH4/zephyr-7b-beta"
        try:
            client = InferenceClient(model=model)
        except Exception as e:
            yield f"Error initializing client: {str(e)}"
            return
    else:
        # Require model name when token is provided
        if not model:
            yield "Please provide a model name when using an HF token."
            return
        try:
            client = InferenceClient(model=model, token=token)
        except Exception as e:
            yield f"Error initializing client: {str(e)}"
            return

    # Build message history
    messages = [{"role": "system", "content": system_message}]
    for user_msg, assistant_msg in history:
        if user_msg:
            messages.append({"role": "user", "content": user_msg})
        if assistant_msg:
            messages.append({"role": "assistant", "content": assistant_msg})
    messages.append({"role": "user", "content": message})

    # Generate response
    response = ""
    try:
        for chunk in client.chat_completion(
            messages,
            max_tokens=max_tokens,
            stream=True,
            temperature=temperature,
            top_p=top_p,
        ):
            if chunk.choices and chunk.choices[0].delta.content:
                response += chunk.choices[0].delta.content
                yield response
    except Exception as e:
        yield f"API Error: {str(e)}"

# Input components
token_input = gr.Textbox(
    type="password", 
    label="HF API Token (leave empty for public model)",
    placeholder="hf_XXXXXXXXXXXX"
)
model_input = gr.Textbox(
    label="Model Name (required if using token)",
    placeholder="Enter model name when using token",
    visible=True
)

# Chat interface
demo = gr.ChatInterface(
    fn=respond,
    title="XYIZKO HF Text Generation Model Tester",
    description="Uses Zephyr-7b-beta by default. Add token + model name for private models",
    additional_inputs=[
        token_input,
        model_input,
        gr.Textbox(value="You are helpful AI chatbot who reponds like a mideval knight who is extremely polite and noble.", label="System Message"),
        gr.Slider(1, 2048, value=512, label="Max Tokens"),
        gr.Slider(0.1, 4.0, value=0.7, label="Temperature"),
        gr.Slider(0.1, 1.0, value=0.95, label="Top-p"),
    ],
)

if __name__ == "__main__":
    demo.launch()