Gertrudev3.00-ACC

Sleeping

TejAndrewsACC commited on Dec 13, 2024

Commit

cfbc2ff

verified ·

1 Parent(s): e95a4d9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,8 +6,8 @@ from llama_cpp import Llama
 client = InferenceClient()
 llm = Llama.from_pretrained(
-    repo_id=TejAndrewsACC/Gertrudev3ACC,
-    filename="GertrudeMain.gguf",
 )
 # Fixed system message
@@ -48,17 +48,18 @@ def respond(
 demo = gr.ChatInterface(
     respond,
     additional_inputs=[
-        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
-        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
             minimum=0.1,
             maximum=1.0,
             value=0.95,
             step=0.05,
-            label="Top-p (nucleus sampling)",
         ),
     ],
 )
 if __name__ == "__main__":
     demo.launch()

 client = InferenceClient()
 llm = Llama.from_pretrained(
+    repo_id="bartowski/Reasoning-Llama-1b-v0.1-GGUF",
+    filename="Reasoning-Llama-1b-v0.1-f16.gguf",
 )
 # Fixed system message
 demo = gr.ChatInterface(
     respond,
     additional_inputs=[
+        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Maximum Response Length"),
+        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Creativity"),
         gr.Slider(
             minimum=0.1,
             maximum=1.0,
             value=0.95,
             step=0.05,
+            label="Neuron Firing Rate",
         ),
     ],
 )
 if __name__ == "__main__":
     demo.launch()