Spaces:

Mauro24
/

sentence-transformer-demo

Sleeping

Mauro24 commited on Dec 7, 2024

Commit

f77c0a8

verified ·

1 Parent(s): 3ebe6ef

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,22 +1,21 @@
 import gradio as gr
 from sentence_transformers import SentenceTransformer
-from scipy.spatial.distance import cosine
 from sklearn.metrics.pairwise import cosine_similarity
-import nltk
-nltk.download('punkt', download_dir='./nltk_data')
-nltk.data.path.append('./nltk_data')
-# Carica il modello
 model = SentenceTransformer('sentence-transformers/all-mpnet-base-v2', device='cpu')
-nltk.download('punkt')
-# Preprocessamento manuale (potresti caricare il manuale da un file o base di dati)
 with open('testo.txt', 'r', encoding='utf-8') as file:
     text = file.read()
-# Tokenizza il testo
-sentences = nltk.sent_tokenize(text)
 # Crea gli embedding per il manuale
 embeddings = model.encode(sentences, batch_size=8, show_progress_bar=True)
@@ -49,4 +48,4 @@ iface = gr.Interface(
 )
 # Avvia l'app Gradio
-iface.launch()

 import gradio as gr
 from sentence_transformers import SentenceTransformer
 from sklearn.metrics.pairwise import cosine_similarity
+import spacy
+# Carica SpaCy
+nlp = spacy.load("en_core_web_sm")  # Assicurati di avere installato il modello SpaCy `en_core_web_sm`
+# Carica il modello SentenceTransformer
 model = SentenceTransformer('sentence-transformers/all-mpnet-base-v2', device='cpu')
+# Preprocessamento manuale (carica il manuale da un file o base di dati)
 with open('testo.txt', 'r', encoding='utf-8') as file:
     text = file.read()
+# Tokenizza il testo in frasi usando SpaCy
+doc = nlp(text)
+sentences = [sent.text for sent in doc.sents]  # Estrarre frasi dal testo
 # Crea gli embedding per il manuale
 embeddings = model.encode(sentences, batch_size=8, show_progress_bar=True)
 )
 # Avvia l'app Gradio
+iface.launch()