Spaces:

Younes13
/

student-agent

Runtime error

App Files Files Community

Younes13 commited on Jul 12

Commit

7ac6d00

verified ·

1 Parent(s): cddf140

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -12

app.py CHANGED Viewed

@@ -1,17 +1,22 @@
 import torch
 import gradio as gr
-from transformers import AutoTokenizer, AutoModel
 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
 import json
 import os
-# بارگذاری مدل
-model_name = "HooshvareLab/PersianMind"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModel.from_pretrained(model_name)
-# مسیر فایل ذخیره‌سازی دائمی
 DATA_FILE = "faq_data.json"
 ADMIN_PASSWORD = "admin123"  # رمز عبور ادمین
@@ -37,19 +42,33 @@ def save_faq_data():
 # پایگاه دانش و embedding‌ها
 faq_dict = load_faq_data()
 faq_questions = list(faq_dict.keys())
-faq_embeddings = []
-# تولید embedding
 def get_embedding(text):
-    inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
     with torch.no_grad():
-        outputs = model(**inputs)
     return outputs.last_hidden_state.mean(dim=1).squeeze().cpu().numpy()
 # ساخت embedding اولیه
 faq_embeddings = [get_embedding(q) for q in faq_questions]
-# پاسخ‌دهی
 def student_bot(user_question):
     try:
         user_emb = get_embedding(user_question)
@@ -60,7 +79,7 @@ def student_bot(user_question):
         if best_score > 0.6:
             return faq_dict[faq_questions[best_idx]]
         else:
-            return "متأسفم، پاسخ این سؤال در حال حاضر موجود نیست."
     except Exception as e:
         return f"❗️خطا: {str(e)}"
@@ -100,3 +119,4 @@ with gr.Blocks() as demo:
         add_btn.click(fn=add_faq, inputs=[new_q, new_a, password], outputs=result)
 demo.launch()

 import torch
 import gradio as gr
+from transformers import AutoTokenizer, AutoModel, AutoModelForCausalLM
 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
 import json
 import os
+# 🔹 مدل embedding (برای تشخیص شباهت)
+embedding_model_name = "HooshvareLab/bert-fa-base-uncased"
+embedding_tokenizer = AutoTokenizer.from_pretrained(embedding_model_name)
+embedding_model = AutoModel.from_pretrained(embedding_model_name)
+# 🔹 مدل تولید (برای پاسخ جدید)
+gen_model_name = "HooshvareLab/PersianMind"
+gen_tokenizer = AutoTokenizer.from_pretrained(gen_model_name)
+gen_model = AutoModelForCausalLM.from_pretrained(gen_model_name)
+# 🔹 مسیر فایل دیتابیس
 DATA_FILE = "faq_data.json"
 ADMIN_PASSWORD = "admin123"  # رمز عبور ادمین
 # پایگاه دانش و embedding‌ها
 faq_dict = load_faq_data()
 faq_questions = list(faq_dict.keys())
+# تابع تولید embedding
 def get_embedding(text):
+    inputs = embedding_tokenizer(text, return_tensors="pt", truncation=True, padding=True)
     with torch.no_grad():
+        outputs = embedding_model(**inputs)
     return outputs.last_hidden_state.mean(dim=1).squeeze().cpu().numpy()
 # ساخت embedding اولیه
 faq_embeddings = [get_embedding(q) for q in faq_questions]
+# تابع تولید پاسخ با PersianMind
+def generate_with_persianmind(prompt):
+    inputs = gen_tokenizer(prompt, return_tensors="pt", truncation=True, padding=True, max_length=512)
+    with torch.no_grad():
+        output_ids = gen_model.generate(
+            inputs.input_ids,
+            max_length=200,
+            do_sample=True,
+            top_p=0.9,
+            temperature=0.8,
+            pad_token_id=gen_tokenizer.eos_token_id
+        )
+    answer = gen_tokenizer.decode(output_ids[0], skip_special_tokens=True)
+    return answer
+# پاسخ‌دهی اصلی
 def student_bot(user_question):
     try:
         user_emb = get_embedding(user_question)
         if best_score > 0.6:
             return faq_dict[faq_questions[best_idx]]
         else:
+            return generate_with_persianmind(user_question)
     except Exception as e:
         return f"❗️خطا: {str(e)}"
         add_btn.click(fn=add_faq, inputs=[new_q, new_a, password], outputs=result)
 demo.launch()