Spaces:

IliaLarchenko
/

interviewer

Sleeping

IliaLarchenko commited on May 14, 2024

Commit

feab4b2

1 Parent(s): bb0f942

gpt-4o as default

Files changed (3) hide show

tests/analysis.py CHANGED Viewed

@@ -119,7 +119,7 @@ def run_evaluation(
     if interview_types is None:
         interview_types = ["ml_design", "math", "ml_theory", "system_design", "sql", "coding"]
     if grader_models is None:
-        grader_models = ["gpt-4-turbo"]
     if llm_configs is None:
         llm_configs = [None]
@@ -281,7 +281,7 @@ def filter_df(df, prefixes=["problem", "interviewer", "feedback"]):
     return valid_df
-def generate_analysis_report(df, folder, focus=None, model="gpt-4-turbo"):
     client = OpenAI(base_url="https://api.openai.com/v1")
@@ -341,7 +341,7 @@ def analyze_and_improve_segment(df, segment_to_improve=None):
     filtered_df = filtered_df[filtered_df[prefix_columns].mean(axis=1) < th_score]
     # Generating an analysis report
-    comments_analysis = generate_analysis_report(filtered_df, None, focus=segment_to_improve, model="gpt-4-turbo")
     # Constructing improvement prompt
     improvement_prompt = """You want to improve the prompts for LLM interviewer.
@@ -364,7 +364,7 @@ You can add 1-3 lines to each of prompts if needed, but you can't change or remo
     # Making API call to OpenAI
     client = OpenAI(base_url="https://api.openai.com/v1")
-    model = "gpt-4-turbo"
     messages = [
         {"role": "system", "content": improvement_prompt},
         {"role": "user", "content": current_prompts},

     if interview_types is None:
         interview_types = ["ml_design", "math", "ml_theory", "system_design", "sql", "coding"]
     if grader_models is None:
+        grader_models = ["gpt-4o"]
     if llm_configs is None:
         llm_configs = [None]
     return valid_df
+def generate_analysis_report(df, folder, focus=None, model="gpt-4o"):
     client = OpenAI(base_url="https://api.openai.com/v1")
     filtered_df = filtered_df[filtered_df[prefix_columns].mean(axis=1) < th_score]
     # Generating an analysis report
+    comments_analysis = generate_analysis_report(filtered_df, None, focus=segment_to_improve, model="gpt-4o")
     # Constructing improvement prompt
     improvement_prompt = """You want to improve the prompts for LLM interviewer.
     # Making API call to OpenAI
     client = OpenAI(base_url="https://api.openai.com/v1")
+    model = "gpt-4o"
     messages = [
         {"role": "system", "content": improvement_prompt},
         {"role": "user", "content": current_prompts},

tests/grader.py CHANGED Viewed

@@ -5,7 +5,7 @@ from openai import OpenAI
 from tests.testing_prompts import grader_prompt
-def grade(json_file_path, model="gpt-4-turbo", suffix=""):
     client = OpenAI(base_url="https://api.openai.com/v1")
     with open(json_file_path) as file:

 from tests.testing_prompts import grader_prompt
+def grade(json_file_path, model="gpt-4o", suffix=""):
     client = OpenAI(base_url="https://api.openai.com/v1")
     with open(json_file_path) as file:

tests/test_e2e.py CHANGED Viewed

@@ -5,7 +5,7 @@ from concurrent.futures import ThreadPoolExecutor
 def complete_and_grade_interview(interview_type):
     file_path, _ = complete_interview(interview_type, "test", model="gpt-3.5-turbo")
-    feedback = grade(file_path, model="gpt-4-turbo")
     assert feedback["overall_score"] > 0.4
     return feedback["overall_score"]

 def complete_and_grade_interview(interview_type):
     file_path, _ = complete_interview(interview_type, "test", model="gpt-3.5-turbo")
+    feedback = grade(file_path, model="gpt-4o")
     assert feedback["overall_score"] > 0.4
     return feedback["overall_score"]