Spaces:

hewoo
/

hehetest

Sleeping

App Files Files Community

hewoo commited on Nov 8, 2024

Commit

cc0604c

verified ·

1 Parent(s): 02e4739

Create app.py

Browse files

Files changed (1) hide show

app.py +50 -0

app.py ADDED Viewed

	@@ -0,0 +1,50 @@

+import streamlit as st
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+from sentence_transformers import SentenceTransformer
+from langchain.vectorstores import Chroma
+import os
+# Hugging Face 모델 ID
+model_id = "hewoo/meta-llama-3.2-3b-chatbot"  # 업로드한 모델의 repo_id
+token = os.getenv("HF_API_TOKEN")  # Hugging Face API 토큰 (필요 시 설정)
+# 모델과 토크나이저 로드
+tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=token)
+model = AutoModelForCausalLM.from_pretrained(model_id, use_auth_token=token)
+# 텍스트 생성 파이프라인 설정
+pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=150, temperature=0.5, top_p=0.85, top_k=40, repetition_penalty=1.2)
+# 임베딩 모델 및 검색 기능 설정
+embedding_model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
+persist_directory = "./chroma_batch_vectors"
+vectorstore = Chroma(persist_directory=persist_directory, embedding_function=embedding_model.encode)
+retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
+# 검색 결과 요약 함수
+def summarize_results(search_results):
+    combined_text = "\n".join([result.page_content for result in search_results])
+    summary = summarizer(combined_text, max_length=100, min_length=30, do_sample=False)[0]["summary_text"]
+    return summary
+# 검색 및 응답 생성 함수
+def generate_response(user_input):
+    # 검색 및 맥락 생성
+    search_results = retriever.get_relevant_documents(user_input)
+    context = "\n".join([result.page_content for result in search_results])
+    # 모델에 맥락과 질문 전달
+    input_text = f"맥락: {context}\n질문: {user_input}"
+    response = pipe(input_text)[0]["generated_text"]
+    return response
+# Streamlit 앱 UI
+st.title("챗봇테스트")
+st.write("Llama 3.2-3B 모델을 사용한 챗봇입니다. 질문을 입력해 주세요.")
+# 사용자 입력 받기
+user_input = st.text_input("질문")
+if user_input:
+    response = generate_response(user_input)
+    st.write("챗봇 응답:", response)