Spaces:

hanzla
/

Falcon3MambaReasoner

Running on Zero

App Files Files Community

mjavaid commited on Mar 13

Commit

b867d63

1 Parent(s): 73453c2

add

Browse files

Files changed (2) hide show

app.py +63 -0
requirements.txt +6 -0

app.py ADDED Viewed

	@@ -0,0 +1,63 @@

+import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
+import spaces
+# Define model repository
+repo_name = "hanzla/Falcon3-Mamba-R1-v0"
+# Load tokenizer and model
+tokenizer = AutoTokenizer.from_pretrained(repo_name)
+model = AutoModelForCausalLM.from_pretrained(
+    repo_name,
+    device_map="auto",  # Auto place layers across available GPUs
+    torch_dtype=torch.float16,
+)
+@spaces.GPU
+def generate_response(message, history):
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant. You think before answering"},
+    ]
+    # Add chat history to messages
+    for h in history:
+        messages.append({"role": "user", "content": h[0]})
+        messages.append({"role": "assistant", "content": h[1]})
+    # Add current message
+    messages.append({"role": "user", "content": message})
+    # Generate input text using chat template
+    input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+    # Tokenize input
+    input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to(model.device)
+    # Generate response
+    outputs = model.generate(
+        input_ids,
+        max_new_tokens=1024,
+        temperature=0.7,
+        do_sample=True,
+    )
+    # Decode the generated tokens
+    generated_tokens = outputs[0][len(input_ids[0]):]
+    response = tokenizer.decode(generated_tokens, skip_special_tokens=True)
+    return response
+# Create Gradio interface
+demo = gr.ChatInterface(
+    generate_response,
+    title="Falcon3-Mamba-R1-v0 Chat",
+    description="Chat with the Falcon3-Mamba-R1-v0 model..",
+    examples=["Tell me about yourself",
+              "Explain quantum computing like I'm 10",
+              "Write a short poem about AI"],
+    theme="soft"
+)
+# Launch the interface
+demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+gradio>=4.0.0
+transformers>=4.34.0
+torch>=2.0.0
+accelerate
+causal-conv1d>=1.4.0
+mamba-ssm