Spaces:

Younes13
/

student-agent

Runtime error

App Files Files Community

Younes13 commited on Jun 9

Commit

d173465

verified ·

1 Parent(s): a3030ce

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -29

app.py CHANGED Viewed

@@ -2,6 +2,12 @@ import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
 faq_dict = {
     "زمان انتخاب واحد": "معمولاً پایان شهریور و بهمن است.",
     "زمان حذف و اضافه": "حدود یک هفته پس از شروع ترم تحصیلی است.",
@@ -10,6 +16,9 @@ faq_dict = {
     "شرایط مهمان شدن": "با موافقت دانشگاه مبدا و مقصد انجام می‌شود.",
 }
 # بارگذاری پرسش و پاسخ‌های FAQ
@@ -31,35 +40,18 @@ chat_history = []
 # تابع پاسخ‌دهی
 def student_bot(question):
-    # بررسی وجود پاسخ در دیکشنری FAQ
-    for key in faq_dict:
-        if key in question:
-            return faq_dict[key]
-    # اگر یافت نشد، مدل زبانی فعال شود
-    prompt = f"""پرسش: زمان انتخاب واحد چه زمانی است؟
-پاسخ: معمولاً پایان شهریور و بهمن است.
-پرسش: زمان حذف و اضافه کی هست؟
-پاسخ: حدود یک هفته پس از شروع ترم تحصیلی است.
-پرسش: {question}
-پاسخ:"""
-    inputs = tokenizer(prompt, return_tensors="pt")
-    outputs = model.generate(
-        **inputs,
-        max_new_tokens=60,
-        pad_token_id=tokenizer.eos_token_id,
-        repetition_penalty=1.8,
-        no_repeat_ngram_size=3,
-        temperature=0.7,
-        top_p=0.9,
-        top_k=50,
-        do_sample=True
-    )
-    answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return answer.split("پاسخ:")[-1].strip()

 from transformers import AutoTokenizer, AutoModelForCausalLM
+from sentence_transformers import SentenceTransformer, util
+# بارگذاری مدل SBERT فارسی
+embedder = SentenceTransformer("HooshvareLab/sbert-fa-zwnj-base")
+# سوالات پر تکرار (FAQ)
 faq_dict = {
     "زمان انتخاب واحد": "معمولاً پایان شهریور و بهمن است.",
     "زمان حذف و اضافه": "حدود یک هفته پس از شروع ترم تحصیلی است.",
     "شرایط مهمان شدن": "با موافقت دانشگاه مبدا و مقصد انجام می‌شود.",
 }
+# پیش‌پردازش FAQ برای تبدیل به embedding
+faq_questions = list(faq_dict.keys())
+faq_embeddings = embedder.encode(faq_questions, convert_to_tensor=True)
 # بارگذاری پرسش و پاسخ‌های FAQ
 # تابع پاسخ‌دهی
 def student_bot(question):
+    question_embedding = embedder.encode(question, convert_to_tensor=True)
+    # محاسبه شباهت با سوالات ثبت شده
+    cos_scores = util.pytorch_cos_sim(question_embedding, faq_embeddings)[0]
+    best_score = cos_scores.max().item()
+    best_idx = cos_scores.argmax().item()
+    if best_score >= 0.7:  # آستانه شباهت
+        best_question = faq_questions[best_idx]
+        return faq_dict[best_question]
+    else:
+        return "❗️متاسفم، پاسخ این سؤال فعلاً در سیستم ثبت نشده است."