Spaces:

OmidSakaki
/

DocQA_Agent

Sleeping

App Files Files Community

OmidSakaki commited on Jul 2

Commit

8f46e75

verified ·

1 Parent(s): 3c028c0

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -17

app.py CHANGED Viewed

@@ -1,19 +1,18 @@
 import gradio as gr
 import easyocr
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 from PIL import Image
 import numpy as np
 # Initialize EasyOCR for Persian
 reader = easyocr.Reader(['fa'])
-# Load NLP model - استفاده از مدل مناسب برای تصحیح متن
-model_name = "persiannlp/mt5-small-parsinlu-opus-translation"  # مدل مناسب برای پردازش متن
 try:
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
-    model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 except Exception as e:
-    raise gr.Error(f"خطا در بارگذاری مدل زبانی: {str(e)}\n\nلطفاً از مدل دیگری استفاده کنید یا با توسعه دهنده تماس بگیرید.")
 def run_ocr(image):
     """استخراج متن از تصویر با EasyOCR"""
@@ -26,19 +25,20 @@ def run_ocr(image):
         return f"خطا در OCR: {str(e)}"
 def process_text(text):
-    """پردازش متن با مدل Seq2Seq"""
     if text == "متنی یافت نشد!":
         return text
-    try:
-        inputs = tokenizer(text, return_tensors="pt", max_length=512, truncation=True)
-        outputs = model.generate(**inputs)
-        return tokenizer.decode(outputs[0], skip_special_tokens=True)
-    except Exception as e:
-        return f"خطا در پردازش متن: {str(e)}"
-with gr.Blocks(title="OCR فارسی با پردازش متن") as app:
-    gr.Markdown("## سیستم استخراج و پردازش متن فارسی")
     with gr.Row():
         with gr.Column():
@@ -47,7 +47,7 @@ with gr.Blocks(title="OCR فارسی با پردازش متن") as app:
         with gr.Column():
             ocr_output = gr.Textbox(label="متن استخراج شده")
-            processed_output = gr.Textbox(label="متن پردازش شده")
     btn.click(
         fn=lambda x: (run_ocr(x), process_text(run_ocr(x))),

 import gradio as gr
 import easyocr
+from transformers import pipeline
 from PIL import Image
 import numpy as np
 # Initialize EasyOCR for Persian
 reader = easyocr.Reader(['fa'])
+# Initialize text processing pipeline
 try:
+    # استفاده از مدل محلی یا مدل‌های عمومی
+    text_processor = pipeline("text-generation", model="gpt2")  # مدل جایگزین
 except Exception as e:
+    text_processor = None
 def run_ocr(image):
     """استخراج متن از تصویر با EasyOCR"""
         return f"خطا در OCR: {str(e)}"
 def process_text(text):
+    """پردازش ساده متن"""
     if text == "متنی یافت نشد!":
         return text
+    # اگر پردازشگر متن وجود داشت از آن استفاده کن
+    if text_processor:
+        try:
+            return text_processor(text, max_length=50)[0]['generated_text']
+        except:
+            return text  # اگر خطا رخ داد متن اصلی را برگردان
+    return text  # اگر پردازشگر متن وجود نداشت
+with gr.Blocks(title="سیستم OCR فارسی") as app:
+    gr.Markdown("## استخراج متن فارسی از تصاویر")
     with gr.Row():
         with gr.Column():
         with gr.Column():
             ocr_output = gr.Textbox(label="متن استخراج شده")
+            processed_output = gr.Textbox(label="متن پردازش شده", visible=False)  # غیرفعال شده
     btn.click(
         fn=lambda x: (run_ocr(x), process_text(run_ocr(x))),