Something

Running

Pclanglais commited on Jul 8, 2024

Commit

101146a

verified ·

1 Parent(s): 31b9958

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,6 +4,8 @@ from transformers import AutoTokenizer, pipeline
 import torch
 import html
 import gradio as gr
 import pandas as pd
 # Define the device
@@ -105,7 +107,7 @@ def create_bibtex_entry(data):
 class CombinedProcessor:
     def process(self, user_message):
         editorial_text = re.sub("\n", " ¶ ", user_message)
-        editorial_text = re.sub(r'\s*([;:])\s*', r' \1 ', editorial_text)
         num_tokens = len(tokenizer.tokenize(editorial_text))
         batch_prompts = split_text(editorial_text, max_tokens=500) if num_tokens > 500 else [editorial_text]

 import torch
 import html
 import gradio as gr
+import tempfile
+import os
 import pandas as pd
 # Define the device
 class CombinedProcessor:
     def process(self, user_message):
         editorial_text = re.sub("\n", " ¶ ", user_message)
+        editorial_text = re.sub(r'\s*([;:,])\s*', r' \1 ', editorial_text)
         num_tokens = len(tokenizer.tokenize(editorial_text))
         batch_prompts = split_text(editorial_text, max_tokens=500) if num_tokens > 500 else [editorial_text]