Lee-Sevixdd-roberta-base-finetuned-ner

Sleeping

App Files Files Community

lobrien001 commited on May 22, 2024

Commit

f54f343

verified ·

1 Parent(s): b36ae86

Update app.py

Browse files

Files changed (1) hide show

app.py +161 -161

app.py CHANGED Viewed

@@ -9,6 +9,7 @@ import random
 from transformers import pipeline
 from sklearn.metrics import precision_score, recall_score, f1_score
 import json
 # Load the model
 ner_pipeline = pipeline("ner", model="Sevixdd/roberta-base-finetuned-ner")
@@ -26,177 +27,176 @@ QUEUE_LENGTH = Gauge('chat_queue_length', 'Length of the chat queue')
 logging.basicConfig(filename="chat_log.txt", level=logging.DEBUG, format='%(asctime)s - %(levelname)s - %(message)s')
 # --- Queue and Metrics ---
-chat_queue = Queue() # Define chat_queue globally
 # --- Chat Function with Monitoring ---
 def chat_function(message, ground_truth):
-  logging.debug("Starting chat_function")
-  with REQUEST_LATENCY.time():
-    REQUEST_COUNT.inc()
-    try:
-      start_time = time.time()
-      chat_queue.put(message)
-      logging.info(f"Received message from user: {message}")
-      ner_results = ner_pipeline(message)
-      logging.debug(f"NER results: {ner_results}")
-      detailed_response = []
-      predicted_labels = []
-      for result in ner_results:
-        token = result['word']
-        score = result['score']
-        entity = result['entity']
-        start = result['start']
-        end = result['end']
-        label_id = int(entity.split('_')[-1]) # Extract numeric label from entity
-        predicted_labels.append(label_id)
-        detailed_response.append(f"Token: {token}, Entity: {entity}, Score: {score:.4f}, Start: {start}, End: {end}")
-      response = "\n".join(detailed_response)
-      logging.info(f"Generated response: {response}")
-      response_size = len(response.encode('utf-8'))
-      RESPONSE_SIZE.observe(response_size)
-      time.sleep(random.uniform(0.5, 2.5)) # Simulate processing time
-      # Compute metrics
-      try:
-        ground_truth_labels = json.loads(ground_truth) # Assuming ground_truth is input as a JSON string
-      except json.JSONDecodeError:
-        return "Invalid JSON format for ground truth labels. Please provide a valid JSON array."
-      precision = precision_score(ground_truth_labels, predicted_labels, average='weighted')
-      recall = recall_score(ground_truth_labels, predicted_labels, average='weighted')
-      f1 = f1_score(ground_truth_labels, predicted_labels, average='weighted')
-      metrics_response = (f"Precision: {precision:.4f}\n"
-                f"Recall: {recall:.4f}\n"
-                f"F1 Score: {f1:.4f}")
-      full_response = f"{response}\n\nMetrics:\n{metrics_response}"
-      chat_queue.get()
-      logging.debug("Finished processing message")
-      return full_response
-    except Exception as e:
-      ERROR_COUNT.inc()
-      logging.error(f"Error in chat processing: {e}")
-      return f"An error occurred. Please try again. Error: {e}"
 # Function to simulate stress test
 def stress_test(num_requests, message, delay):
-  def send_chat_message():
-    response = requests.post("http://127.0.0.1:7860/api/predict/", json={
-      "data": [message],
-      "fn_index": 0 # This might need to be updated based on your Gradio app's function index
-    })
-    logging.debug(response.json())
-  threads = []
-  for _ in range(num_requests):
-    t = threading.Thread(target=send_chat_message)
-    t.start()
-    threads.append(t)
-    time.sleep(delay) # Delay between requests
-  for t in threads:
-    t.join()
 # --- Gradio Interface with Background Image and Three Windows ---
 with gr.Blocks(css="""
 body {
-  background-image: url("stag.jpeg");
-  background-size: cover;
-  background-repeat: no-repeat;
 }
-""", title="PLOD Filtered with Monitoring") as demo: # Load CSS for background image
-  with gr.Tab("Chat"):
-    gr.Markdown("## Chat with the Bot")
-    message_input = gr.Textbox(label="Enter your sentence:", lines=2)
-    ground_truth_input = gr.Textbox(label="Enter ground truth labels (JSON format):", lines=2)
-    output = gr.Textbox(label="Response", lines=10)
-    chat_interface = gr.Interface(fn=chat_function, inputs=[message_input, ground_truth_input], outputs=output)
-    chat_interface.render()
-  with gr.Tab("Model Parameters"):
-    model_params_display = gr.Textbox(label="Model Parameters", lines=20, interactive=False) # Display model parameters
-  with gr.Tab("Performance Metrics"):
-    request_count_display = gr.Number(label="Request Count", value=0)
-    avg_latency_display = gr.Number(label="Avg. Response Time (s)", value=0)
-  with gr.Tab("Infrastructure"):
-    cpu_usage_display = gr.Number(label="CPU Usage (%)", value=0)
-    mem_usage_display = gr.Number(label="Memory Usage (%)", value=0)
-  with gr.Tab("Logs"):
-    logs_display = gr.Textbox(label="Logs", lines=10) # Increased lines for better visibility
-  with gr.Tab("Stress Testing"):
-    num_requests_input = gr.Number(label="Number of Requests", value=10)
-    message_input_stress = gr.Textbox(label="Message", value="Hello bot!")
-    delay_input = gr.Number(label="Delay Between Requests (seconds)", value=0.1)
-    stress_test_button = gr.Button("Start Stress Test")
-    stress_test_status = gr.Textbox(label="Stress Test Status", lines=5, interactive=False)
-    def run_stress_test(num_requests, message, delay):
-      stress_test_status.value = "Stress test started..."
-      try:
-        stress_test(num_requests, message, delay)
-        stress_test_status.value = "Stress test completed."
-      except Exception as e:
-        stress_test_status.value = f"Stress test failed: {e}"
-    stress_test_button.click(run_stress_test, [num_requests_input, message_input_stress, delay_input], stress_test_status)
-  # --- Update Functions ---
-  def update_metrics(request_count_display, avg_latency_display):
-    while True:
-      request_count = REQUEST_COUNT._value.get()
-      latency_samples = REQUEST_LATENCY.collect()[0].samples
-      avg_latency = sum(s.value for s in latency_samples) / len(latency_samples if latency_samples else [1]) # Avoid division by zero
-      request_count_display.value = request_count
-      avg_latency_display.value = round(avg_latency, 2)
-      time.sleep(5) # Update every 5 seconds
-  def update_usage(cpu_usage_display, mem_usage_display):
-    while True:
-      cpu_usage_display.value = psutil.cpu_percent()
-      mem_usage_display.value = psutil.virtual_memory().percent
-      CPU_USAGE.set(psutil.cpu_percent())
-      MEM_USAGE.set(psutil.virtual_memory().percent)
-      time.sleep(5)
-  def update_logs(logs_display):
-    while True:
-   ��  with open("chat_log.txt", "r") as log_file:
-        logs = log_file.readlines()
-        logs_display.value = "".join(logs[-10:]) # Display last 10 lines
-      time.sleep(1) # Update every 1 second
-  def display_model_params(model_params_display):
-    while True:
-      model_params = ner_pipeline.model.config.to_dict()
-      model_params_str = "\n".join(f"{key}: {value}" for key, value in model_params.items())
-      model_params_display.value = model_params_str
-      time.sleep(10) # Update every 10 seconds
-  def update_queue_length():
-    while True:
-      QUEUE_LENGTH.set(chat_queue.qsize())
-      time.sleep(1) # Update every second
-  # --- Start Threads ---
-  threading.Thread(target=start_http_server, args=(8000,), daemon=True).start()
-  threading.Thread(target=update_metrics, args=(request_count_display, avg_latency_display), daemon=True).start()
-  threading.Thread(target=update_usage, args=(cpu_usage_display, mem_usage_display), daemon=True).start()
-  threading.Thread(target=update_logs, args=(logs_display,), daemon=True).start()
-  threading.Thread(target=display_model_params, args=(model_params_display,), daemon=True).start()
-  threading.Thread(target=update_queue_length, daemon=True).start()
 # Launch the app
-demo.launch(share=True).

 from transformers import pipeline
 from sklearn.metrics import precision_score, recall_score, f1_score
 import json
+import requests
 # Load the model
 ner_pipeline = pipeline("ner", model="Sevixdd/roberta-base-finetuned-ner")
 logging.basicConfig(filename="chat_log.txt", level=logging.DEBUG, format='%(asctime)s - %(levelname)s - %(message)s')
 # --- Queue and Metrics ---
+chat_queue = Queue()  # Define chat_queue globally
 # --- Chat Function with Monitoring ---
 def chat_function(message, ground_truth):
+    logging.debug("Starting chat_function")
+    with REQUEST_LATENCY.time():
+        REQUEST_COUNT.inc()
+        try:
+            chat_queue.put(message)
+            logging.info(f"Received message from user: {message}")
+            ner_results = ner_pipeline(message)
+            logging.debug(f"NER results: {ner_results}")
+            detailed_response = []
+            predicted_labels = []
+            for result in ner_results:
+                token = result['word']
+                score = result['score']
+                entity = result['entity']
+                start = result['start']
+                end = result['end']
+                label_id = int(entity.split('_')[-1])  # Extract numeric label from entity
+                predicted_labels.append(label_id)
+                detailed_response.append(f"Token: {token}, Entity: {entity}, Score: {score:.4f}, Start: {start}, End: {end}")
+            response = "\n".join(detailed_response)
+            logging.info(f"Generated response: {response}")
+            response_size = len(response.encode('utf-8'))
+            RESPONSE_SIZE.observe(response_size)
+            time.sleep(random.uniform(0.5, 2.5))  # Simulate processing time
+            # Compute metrics
+            try:
+                ground_truth_labels = json.loads(ground_truth)  # Assuming ground_truth is input as a JSON string
+            except json.JSONDecodeError:
+                return "Invalid JSON format for ground truth labels. Please provide a valid JSON array."
+            precision = precision_score(ground_truth_labels, predicted_labels, average='weighted', zero_division=0)
+            recall = recall_score(ground_truth_labels, predicted_labels, average='weighted', zero_division=0)
+            f1 = f1_score(ground_truth_labels, predicted_labels, average='weighted', zero_division=0)
+            metrics_response = (f"Precision: {precision:.4f}\n"
+                                f"Recall: {recall:.4f}\n"
+                                f"F1 Score: {f1:.4f}")
+            full_response = f"{response}\n\nMetrics:\n{metrics_response}"
+            chat_queue.get()
+            logging.debug("Finished processing message")
+            return full_response
+        except Exception as e:
+            ERROR_COUNT.inc()
+            logging.error(f"Error in chat processing: {e}")
+            return f"An error occurred. Please try again. Error: {e}"
 # Function to simulate stress test
 def stress_test(num_requests, message, delay):
+    def send_chat_message():
+        response = requests.post("http://127.0.0.1:7860/api/predict/", json={
+            "data": [message],
+            "fn_index": 0  # This might need to be updated based on your Gradio app's function index
+        })
+        logging.debug(response.json())
+    threads = []
+    for _ in range(num_requests):
+        t = threading.Thread(target=send_chat_message)
+        t.start()
+        threads.append(t)
+        time.sleep(delay)  # Delay between requests
+    for t in threads:
+        t.join()
 # --- Gradio Interface with Background Image and Three Windows ---
 with gr.Blocks(css="""
 body {
+    background-image: url("stag.jpeg");
+    background-size: cover;
+    background-repeat: no-repeat;
 }
+""", title="PLOD Filtered with Monitoring") as demo:  # Load CSS for background image
+    with gr.Tab("Chat"):
+        gr.Markdown("## Chat with the Bot")
+        message_input = gr.Textbox(label="Enter your sentence:", lines=2)
+        ground_truth_input = gr.Textbox(label="Enter ground truth labels (JSON format):", lines=2)
+        output = gr.Textbox(label="Response", lines=10)
+        chat_interface = gr.Interface(fn=chat_function, inputs=[message_input, ground_truth_input], outputs=output)
+        chat_interface.render()
+    with gr.Tab("Model Parameters"):
+        model_params_display = gr.Textbox(label="Model Parameters", lines=20, interactive=False)  # Display model parameters
+    with gr.Tab("Performance Metrics"):
+        request_count_display = gr.Number(label="Request Count", value=0)
+        avg_latency_display = gr.Number(label="Avg. Response Time (s)", value=0)
+    with gr.Tab("Infrastructure"):
+        cpu_usage_display = gr.Number(label="CPU Usage (%)", value=0)
+        mem_usage_display = gr.Number(label="Memory Usage (%)", value=0)
+    with gr.Tab("Logs"):
+        logs_display = gr.Textbox(label="Logs", lines=10)  # Increased lines for better visibility
+    with gr.Tab("Stress Testing"):
+        num_requests_input = gr.Number(label="Number of Requests", value=10)
+        message_input_stress = gr.Textbox(label="Message", value="Hello bot!")
+        delay_input = gr.Number(label="Delay Between Requests (seconds)", value=0.1)
+        stress_test_button = gr.Button("Start Stress Test")
+        stress_test_status = gr.Textbox(label="Stress Test Status", lines=5, interactive=False)
+        def run_stress_test(num_requests, message, delay):
+            stress_test_status.value = "Stress test started..."
+            try:
+                stress_test(num_requests, message, delay)
+                stress_test_status.value = "Stress test completed."
+            except Exception as e:
+                stress_test_status.value = f"Stress test failed: {e}"
+        stress_test_button.click(run_stress_test, [num_requests_input, message_input_stress, delay_input], stress_test_status)
+    # --- Update Functions ---
+    def update_metrics(request_count_display, avg_latency_display):
+        while True:
+            request_count = REQUEST_COUNT._value.get()
+            latency_samples = REQUEST_LATENCY.collect()[0].samples
+            avg_latency = sum(s.value for s in latency_samples) / len(latency_samples if latency_samples else [1])  # Avoid division by zero
+            request_count_display.value = request_count
+            avg_latency_display.value = round(avg_latency, 2)
+            time.sleep(5)  # Update every 5 seconds
+    def update_usage(cpu_usage_display, mem_usage_display):
+        while True:
+            cpu_usage_display.value = psutil.cpu_percent()
+            mem_usage_display.value = psutil.virtual_memory().percent
+            CPU_USAGE.set(psutil.cpu_percent())
+            MEM_USAGE.set(psutil.virtual_memory().percent)
+            time.sleep(5)
+    def update_logs(logs_display):
+        while True:
+            with open("chat_log.txt", "r") as log_file:
+                logs = log_file.readlines()
+                logs_display.value = "".join(logs[-10:])  # Display last 10 lines
+            time.sleep(1)  # Update every 1 second
+    def display_model_params(model_params_display):
+        while True:
+            model_params = ner_pipeline.model.config.to_dict()
+            model_params_str = "\n".join(f"{key}: {value}" for key, value in model_params.items())
+            model_params_display.value = model_params_str
+            time.sleep(10)  # Update every 10 seconds
+    def update_queue_length():
+        while True:
+            QUEUE_LENGTH.set(chat_queue.qsize())
+            time.sleep(1)  # Update every second
+    # --- Start Threads ---
+    threading.Thread(target=start_http_server, args=(8000,), daemon=True).start()
+    threading.Thread(target=update_metrics, args=(request_count_display, avg_latency_display), daemon=True).start()
+    threading.Thread(target=update_usage, args=(cpu_usage_display, mem_usage_display), daemon=True).start()
+    threading.Thread(target=update_logs, args=(logs_display,), daemon=True).start()
+    threading.Thread(target=display_model_params, args=(model_params_display,), daemon=True).start()
+    threading.Thread(target=update_queue_length, daemon=True).start()
 # Launch the app
+demo.launch(share=True)