Spaces:

ajalisatgi
/

Gradio

Sleeping

App Files Files Community

ajalisatgi commited on Feb 17

Commit

4d2d551

verified ·

1 Parent(s): a2b4b17

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -98

app.py CHANGED Viewed

@@ -1,53 +1,26 @@
-# Debugging Step: Check if langchain_community is installed properly
-try:
-    from langchain_community.embeddings import HuggingFaceEmbeddings
-    print("✅ LangChain Community Module is Installed Correctly!")
-except ModuleNotFoundError as e:
-    print(f"❌ Import Failed: {str(e)}")
-    print("🔹 Try running: pip install --upgrade langchain-community")
-    exit(1)  # Stop execution if the import fails
 import gradio as gr
 import openai
 import os
-import nltk
-import shutil
-import numpy as np
-import torch
-from datasets import load_dataset
-from langchain_community.embeddings import HuggingFaceEmbeddings  # ✅ Correct
-from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.vectorstores import Chroma
 from langchain.schema import Document
 from sentence_transformers import SentenceTransformer
-from sklearn.metrics import mean_squared_error, roc_auc_score
-from sklearn.feature_extraction.text import TfidfVectorizer
-from sklearn.metrics.pairwise import cosine_similarity
-# ✅ Load Pretrained Model
-model_name = "bert-base-uncased"
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-#embedding_model = HuggingFaceEmbeddings(model_name=model_name)
-embedding_model = HuggingFaceEmbeddings(model_name="models/bert-base-uncased")
-embedding_model.client.to(device)
-# ✅ Set OpenAI API Key (Replace with your own)
-openai.api_key = os.getenv("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")
-# ✅ Download NLTK Dependencies
 nltk.download('punkt')
-# ✅ Load RunGalileo Datasets
-ragbench = {}
-for dataset in ['covidqa', 'cuad', 'delucionqa', 'emanual', 'expertqa', 'finqa', 'hagrid', 'hotpotqa', 'msmarco', 'pubmedqa', 'tatqa', 'techqa']:
-    ragbench[dataset] = load_dataset("rungalileo/ragbench", dataset)
-print("Datasets Loaded ✅")
-# ✅ Function to Chunk Documents
-def chunk_documents_semantic(documents, max_chunk_size=500):
     chunks = []
     for doc in documents:
         sentences = nltk.sent_tokenize(doc)
@@ -62,21 +35,15 @@ def chunk_documents_semantic(documents, max_chunk_size=500):
             chunks.append(current_chunk.strip())
     return chunks
-# ✅ Chunk the Entire Dataset
-chunked_ragbench = {}
-for dataset_name in ragbench.keys():
-    for split in ragbench[dataset_name].keys():
-        original_documents_full = ragbench[dataset_name][split]['documents']
-        chunked_documents_full = chunk_documents_semantic(original_documents_full)
-        chunked_ragbench[split] = chunked_documents_full
-print("Chunking Completed ✅")
-# ✅ Setup ChromaDB
 persist_directory = "chroma_db_directory"
-if os.path.exists(persist_directory):
-    shutil.rmtree(persist_directory)
-documents = [Document(page_content=chunk) for chunk in chunked_documents_full]
 vectordb = Chroma.from_documents(
     documents=documents,
     embedding=embedding_model,
@@ -84,14 +51,14 @@ vectordb = Chroma.from_documents(
 )
 vectordb.persist()
-# ✅ Retrieve Documents
 def retrieve_documents(question, k=5):
     docs = vectordb.similarity_search(question, k=k)
     if not docs:
         return ["⚠️ No relevant documents found. Try a different query."]
     return [doc.page_content for doc in docs]
-# ✅ Generate AI Response
 def generate_response(question, context):
     if not context or "No relevant documents found." in context:
         return "No relevant context available. Try a different query."
@@ -99,8 +66,7 @@ def generate_response(question, context):
     full_prompt = f"Context: {context}\n\nQuestion: {question}"
     try:
-        client = openai.OpenAI()
-        response = client.chat.completions.create(
             model="gpt-4",
             messages=[
                 {"role": "system", "content": "You are an AI assistant that answers user queries based on the given context."},
@@ -109,53 +75,16 @@ def generate_response(question, context):
             max_tokens=300,
             temperature=0.7
         )
-        return response.choices[0].message.content.strip()
     except Exception as e:
         return f"Error generating response: {str(e)}"
-# ✅ Compute Context Relevance, Utilization, Completeness, Adherence
-def compute_cosine_similarity(text1, text2):
-    vectorizer = TfidfVectorizer()
-    vectors = vectorizer.fit_transform([text1, text2])
-    return cosine_similarity(vectors[0], vectors[1])[0][0]
-def context_relevance(question, relevant_documents):
-    combined_docs = " ".join(relevant_documents)
-    return compute_cosine_similarity(question, combined_docs)
-def context_utilization(response, relevant_documents):
-    combined_docs = " ".join(relevant_documents)
-    return compute_cosine_similarity(response, combined_docs)
-def completeness(response, ground_truth_answer):
-    return compute_cosine_similarity(response, ground_truth_answer)
-def adherence(response, relevant_documents):
-    combined_docs = " ".join(relevant_documents)
-    response_tokens = set(response.split())
-    relevant_tokens = set(combined_docs.split())
-    supported_tokens = response_tokens.intersection(relevant_tokens)
-    return len(supported_tokens) / len(response_tokens)
-def compute_rmse(predicted_values, ground_truth_values):
-    return np.sqrt(mean_squared_error(ground_truth_values, predicted_values))
 # ✅ Full RAG Pipeline
 def rag_pipeline(question):
     retrieved_docs = retrieve_documents(question, k=5)
     context = " ".join(retrieved_docs)
     response = generate_response(question, context)
-    # Compute Evaluation Metrics
-    ground_truth_answer = "Sample ground truth answer from dataset"
-    predicted_metrics = {
-        "context_relevance": context_relevance(question, retrieved_docs),
-        "context_utilization": context_utilization(response, retrieved_docs),
-        "completeness": completeness(response, ground_truth_answer),
-        "adherence": adherence(response, retrieved_docs)
-    }
-    return response, "\n\n".join(retrieved_docs), predicted_metrics
 # ✅ Gradio UI Interface
 iface = gr.Interface(
@@ -163,11 +92,10 @@ iface = gr.Interface(
     inputs=gr.Textbox(label="Enter your question"),
     outputs=[
         gr.Textbox(label="Generated Response"),
-        gr.Textbox(label="Retrieved Documents"),
-        gr.JSON(label="Evaluation Metrics")
     ],
-    title="RAG-Based QA System for RunGalileo",
-    description="Enter a question and retrieve relevant documents with AI-generated response & evaluation metrics."
 )
 # ✅ Launch the Gradio App

 import gradio as gr
 import openai
 import os
+from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain_community.vectorstores import Chroma
 from langchain.schema import Document
 from sentence_transformers import SentenceTransformer
+from datasets import load_dataset
+import nltk
+# ✅ Load the Sentence Transformer Embedding Model
+model_name = "sentence-transformers/all-MiniLM-L6-v2"
+embedding_model = HuggingFaceEmbeddings(model_name=model_name)
+# ✅ Set OpenAI API Key
+openai.api_key = os.getenv("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
+")
+# ✅ Download NLTK Tokenizer
 nltk.download('punkt')
+# ✅ Load and Chunk Dataset
+def chunk_documents(documents, max_chunk_size=500):
     chunks = []
     for doc in documents:
         sentences = nltk.sent_tokenize(doc)
             chunks.append(current_chunk.strip())
     return chunks
+# ✅ Load Dataset and Prepare ChromaDB
+dataset = load_dataset("rungalileo/ragbench", "techqa")  # Example dataset
+original_documents = dataset['train']['documents']
+chunked_documents = chunk_documents(original_documents)
 persist_directory = "chroma_db_directory"
+documents = [Document(page_content=chunk) for chunk in chunked_documents]
+# ✅ Initialize ChromaDB
 vectordb = Chroma.from_documents(
     documents=documents,
     embedding=embedding_model,
 )
 vectordb.persist()
+# ✅ Function to Retrieve Relevant Documents
 def retrieve_documents(question, k=5):
     docs = vectordb.similarity_search(question, k=k)
     if not docs:
         return ["⚠️ No relevant documents found. Try a different query."]
     return [doc.page_content for doc in docs]
+# ✅ Function to Generate AI Response
 def generate_response(question, context):
     if not context or "No relevant documents found." in context:
         return "No relevant context available. Try a different query."
     full_prompt = f"Context: {context}\n\nQuestion: {question}"
     try:
+        response = openai.ChatCompletion.create(
             model="gpt-4",
             messages=[
                 {"role": "system", "content": "You are an AI assistant that answers user queries based on the given context."},
             max_tokens=300,
             temperature=0.7
         )
+        return response['choices'][0]['message']['content'].strip()
     except Exception as e:
         return f"Error generating response: {str(e)}"
 # ✅ Full RAG Pipeline
 def rag_pipeline(question):
     retrieved_docs = retrieve_documents(question, k=5)
     context = " ".join(retrieved_docs)
     response = generate_response(question, context)
+    return response, "\n\n".join(retrieved_docs)
 # ✅ Gradio UI Interface
 iface = gr.Interface(
     inputs=gr.Textbox(label="Enter your question"),
     outputs=[
         gr.Textbox(label="Generated Response"),
+        gr.Textbox(label="Retrieved Documents")
     ],
+    title="RAG-Based Question Answering System",
+    description="Enter a question and retrieve relevant documents with AI-generated response."
 )
 # ✅ Launch the Gradio App