Spaces:

hewoo
/

hehetest

Sleeping

App Files Files Community

hewoo commited on Nov 8, 2024

Commit

6ab87db

verified ·

1 Parent(s): b9a5673

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -22

app.py CHANGED Viewed

@@ -2,23 +2,19 @@ import streamlit as st
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from sentence_transformers import SentenceTransformer
 from langchain.vectorstores import Chroma
-import gc
 import psutil
-# 모델 ID (공개된 모델이어야 함)
 model_id = "hewoo/hehehehe"
-# 메모리 모니터링 함수
-def monitor_memory():
-    memory_info = psutil.virtual_memory()
-    st.write(f"현재 메모리 사용량: {memory_info.percent}%")
-# 캐시를 사용하여 모델 및 파이프라인 로드
 @st.cache_resource
 def load_model():
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     model = AutoModelForCausalLM.from_pretrained(model_id)
-    return pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=150, temperature=0.5, top_p=0.85, top_k=40, repetition_penalty=1.2)
 # 사용자 정의 임베딩 클래스
 class CustomEmbedding:
@@ -31,13 +27,13 @@ class CustomEmbedding:
     def embed_documents(self, texts):
         return [self.model.encode(text, convert_to_tensor=True).tolist() for text in texts]
-# 임베딩 모델 및 벡터 스토어 설정
 @st.cache_resource
 def load_embedding_model():
-    return SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
 @st.cache_resource
-def load_vectorstore(_embedding_model):  # _embedding_model로 이름 변경
     embedding_function = CustomEmbedding(_embedding_model)
     return Chroma(persist_directory="./chroma_batch_vectors", embedding_function=embedding_function)
@@ -46,9 +42,22 @@ def generate_response(user_input):
     retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
     search_results = retriever.get_relevant_documents(user_input)
     context = "\n".join([result.page_content for result in search_results])
-    input_text = f"맥락: {context}\n질문: {user_input}"
-    response = pipe(input_text)[0]["generated_text"]
-    return response
 # 모델 및 임베딩 모델 로드
 pipe = load_model()
@@ -56,20 +65,21 @@ embedding_model = load_embedding_model()
 vectorstore = load_vectorstore(embedding_model)
 # Streamlit 앱 UI
-st.title("챗봇 tessst")
-st.write("Llama 3.2-3B 모델을 사용한 챗봇입니다. 질문을 입력해 주세요.")
-monitor_memory()  # 메모리 사용량 확인
 # 사용자 입력 받기
 user_input = st.text_input("질문")
 if user_input:
-    response = generate_response(user_input)
     st.write("챗봇 응답:", response)
-    monitor_memory()  # 메모리 상태 업데이트
     # 메모리 해제
     del response
     gc.collect()

 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from sentence_transformers import SentenceTransformer
 from langchain.vectorstores import Chroma
+import os
 import psutil
+import gc
+# Hugging Face 모델 ID
 model_id = "hewoo/hehehehe"
+# 캐시를 사용하여 모델과 파이프라인 로드
 @st.cache_resource
 def load_model():
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     model = AutoModelForCausalLM.from_pretrained(model_id)
+    return pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=150)
 # 사용자 정의 임베딩 클래스
 class CustomEmbedding:
     def embed_documents(self, texts):
         return [self.model.encode(text, convert_to_tensor=True).tolist() for text in texts]
+# 임베딩 모델 및 벡터 스토어 설정 (캐시 적용)
 @st.cache_resource
 def load_embedding_model():
+    return SentenceTransformer("jhgan/ko-sroberta-multitask")
 @st.cache_resource
+def load_vectorstore(_embedding_model):
     embedding_function = CustomEmbedding(_embedding_model)
     return Chroma(persist_directory="./chroma_batch_vectors", embedding_function=embedding_function)
     retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
     search_results = retriever.get_relevant_documents(user_input)
     context = "\n".join([result.page_content for result in search_results])
+    prompt = f"""다음은 사용자의 질문에 대한 답변을 생성하는 한국어 어시스턴트입니다.
+사용자의 질문에 대해 주어진 맥락을 기반으로 정확하고 자세한 답변을 한국어로 작성하세요.
+만약 맥락에 관련 정보가 없으면, "죄송하지만 해당 질문에 대한 답변을 찾을 수 없습니다."라고 답변하세요.
+맥락:
+{context}
+질문:
+{user_input}
+답변:"""
+    response = pipe(prompt)[0]["generated_text"]
+    response = response.split("답변:")[-1].strip()
+    return response, context
 # 모델 및 임베딩 모델 로드
 pipe = load_model()
 vectorstore = load_vectorstore(embedding_model)
 # Streamlit 앱 UI
+st.title("챗봇 데모")
+st.write("한국어 모델을 사용한 챗봇입니다. 질문을 입력해 주세요.")
 # 사용자 입력 받기
 user_input = st.text_input("질문")
 if user_input:
+    response, context = generate_response(user_input)
     st.write("챗봇 응답:", response)
+    st.write("사용된 맥락:", context)
+    # 메모리 상태 모니터링
+    memory_usage = psutil.virtual_memory().used / (1024 ** 3)
+    st.write(f"현재 메모리 사용량: {memory_usage:.2f} GB")
     # 메모리 해제
     del response
     gc.collect()