Spaces:

jikoni
/

llamaSMS

Sleeping

Tri4 commited on Aug 11, 2024

Commit

bb15562

verified ·

1 Parent(s): 93340df

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -6,10 +6,6 @@ app = Flask(__name__)
 print("\nHello welcome to Sema AI\n", flush=True)  # Flush to ensure immediate output
-@app.route("/")
-def hello():
-    return "hello 🤗, Welcome to Sema AI Chat Service."
 # Initialize InferenceClient
 client = InferenceClient("mistralai/Mistral-7B-Instruct-v0.1")
@@ -22,8 +18,9 @@ def format_prompt(message, history):
     return prompt
 def generate(prompt, history, temperature=0.9, max_new_tokens=256, top_p=0.95, repetition_penalty=1.0):
-    print(f"User: {prompt}: \n")
     temperature = float(temperature)
     if temperature < 1e-2:
         temperature = 1e-2
@@ -53,7 +50,8 @@ def generate(prompt, history, temperature=0.9, max_new_tokens=256, top_p=0.95, r
     for token in response:
         output += token.token.text
-    print(f"Sema ai: {Output}: \n")
     return output
 @app.route("/generate", methods=["POST"])
@@ -65,7 +63,6 @@ def generate_text():
     max_new_tokens = data.get("max_new_tokens", 256)
     top_p = data.get("top_p", 0.95)
     repetition_penalty = data.get("repetition_penalty", 1.0)
     try:
         response_text = generate(
@@ -78,6 +75,8 @@ def generate_text():
         )
         return jsonify({"response": response_text})
     except Exception as e:
         return jsonify({"error": str(e)}), 500
 if __name__ == "__main__":

 print("\nHello welcome to Sema AI\n", flush=True)  # Flush to ensure immediate output
 # Initialize InferenceClient
 client = InferenceClient("mistralai/Mistral-7B-Instruct-v0.1")
     return prompt
 def generate(prompt, history, temperature=0.9, max_new_tokens=256, top_p=0.95, repetition_penalty=1.0):
+    # Print user prompt
+    print(f"\nUser: {prompt}\n")
     temperature = float(temperature)
     if temperature < 1e-2:
         temperature = 1e-2
     for token in response:
         output += token.token.text
+    # Print AI response
+    print(f"\nSema AI: {output}\n")
     return output
 @app.route("/generate", methods=["POST"])
     max_new_tokens = data.get("max_new_tokens", 256)
     top_p = data.get("top_p", 0.95)
     repetition_penalty = data.get("repetition_penalty", 1.0)
     try:
         response_text = generate(
         )
         return jsonify({"response": response_text})
     except Exception as e:
+        # Print error
+        print(f"Error: {str(e)}")
         return jsonify({"error": str(e)}), 500
 if __name__ == "__main__":