Spaces:

studio-ousia
/

luxe-demo

Running

singletongue commited on Feb 14

Commit

888df00

verified ·

1 Parent(s): 6234321

Set HF token when initializing BM25 retriever and tokenizer

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import re
 import unicodedata
 from pathlib import Path
@@ -83,8 +84,14 @@ def normalize_text(text: str) -> str:
 bm25_tokenizer = TokenizerHF(lower=True, splitter=tokenizer.tokenize, stopwords=None, stemmer=None)
-bm25_tokenizer.load_vocab_from_hub("studio-ousia/luxe-nayose-bm25")
-bm25_retriever = BM25HF.load_from_hub("studio-ousia/luxe-nayose-bm25")
 def get_texts_from_file(file_path):

+import os
 import re
 import unicodedata
 from pathlib import Path
 bm25_tokenizer = TokenizerHF(lower=True, splitter=tokenizer.tokenize, stopwords=None, stemmer=None)
+bm25_tokenizer.load_vocab_from_hub(
+    "studio-ousia/luxe-nayose-bm25",
+    token=os.getenv("HF_TOKEN"),  # needed for demo at HF Spaces
+)
+bm25_retriever = BM25HF.load_from_hub(
+    "studio-ousia/luxe-nayose-bm25",
+    token=os.getenv("HF_TOKEN"),  # needed for demo at HF Spaces
+)
 def get_texts_from_file(file_path):