Spaces:

KetanJogadankar
/

DataAnnotator_LLM_RAG

Sleeping

KetanJogadankar commited on Mar 26

Commit

73db2e1

verified ·

1 Parent(s): 6a79575

updated

Files changed (1) hide show

app.py CHANGED Viewed

@@ -18,8 +18,10 @@ from langchain_core.outputs import Generation
 from typing import Any, List, Optional, Type, TypeVar, Union
 ## Defining few variables
-MODEL_PATH = "TheBloke/Mistral-7B-Claude-Chat-GGUF"
-MODEL_FILE = "mistral-7b-claude-chat.Q4_K_M.gguf"
 MODEL_TYPE = "mistral"
 MAX_NEW_TOKENS = 100
 temperature = 1
@@ -107,7 +109,7 @@ data = data_loader.load()
 data = [doc.page_content for doc in data]
 splitter = CharacterTextSplitter(chunk_size=2, chunk_overlap=1)
-documents = splitter.create_documents(texts=data)
 docs_str = [doc.page_content for doc in documents]
 sentence_emb = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")

 from typing import Any, List, Optional, Type, TypeVar, Union
 ## Defining few variables
+# MODEL_PATH = "TheBloke/Mistral-7B-Claude-Chat-GGUF"
+# MODEL_FILE = "mistral-7b-claude-chat.Q4_K_M.gguf"
+MODEL_PATH = "TheBloke/zephyr-7B-beta-GGUF"
+MODEL_FILE = "zephyr-7b-beta.Q4_K_M.gguf"
 MODEL_TYPE = "mistral"
 MAX_NEW_TOKENS = 100
 temperature = 1
 data = [doc.page_content for doc in data]
 splitter = CharacterTextSplitter(chunk_size=2, chunk_overlap=1)
+documents = splitter.split_documents(data)
 docs_str = [doc.page_content for doc in documents]
 sentence_emb = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")