Spaces:

KvrParaskevi
/

Hotel-Booking-Assistant-Chat-Simple

Paused

KvrParaskevi commited on May 18, 2024

Commit

212f7f3

verified ·

1 Parent(s): c56c51d

Add Inference Client

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,15 +7,16 @@ from langchain_community.llms.huggingface_pipeline import HuggingFacePipeline
 from langchain_community.llms import HuggingFaceEndpoint
 from langchain.prompts import PromptTemplate, ChatPromptTemplate
 from langchain_core.prompts.chat import SystemMessagePromptTemplate, HumanMessagePromptTemplate
 import os
 import gradio as gr
 import spaces
-your_endpoint_url = "https://kp4xdy196cw81uf3.us-east-1.aws.endpoints.huggingface.cloud"
 token = os.environ["API_TOKEN"]
 llm = HuggingFaceEndpoint(
-    endpoint_url=f"{your_endpoint_url}",
     huggingfacehub_api_token = f"{token}",
     task = "text-generation",
     max_new_tokens=128,
@@ -27,6 +28,8 @@ llm = HuggingFaceEndpoint(
 )
 #print(llm)
 def chat_template_prompt():
     template = """
     Do not repeat questions and do not generate answer for user/human.Do not repeat yourself and do not create/generate dialogues.

 from langchain_community.llms import HuggingFaceEndpoint
 from langchain.prompts import PromptTemplate, ChatPromptTemplate
 from langchain_core.prompts.chat import SystemMessagePromptTemplate, HumanMessagePromptTemplate
+from huggingface_hub import InferenceClient
 import os
 import gradio as gr
 import spaces
+endpoint_url = "https://kp4xdy196cw81uf3.us-east-1.aws.endpoints.huggingface.cloud"
 token = os.environ["API_TOKEN"]
 llm = HuggingFaceEndpoint(
+    endpoint_url=f"{endpoint_url}",
     huggingfacehub_api_token = f"{token}",
     task = "text-generation",
     max_new_tokens=128,
 )
 #print(llm)
+client = InferenceClient(endpoint_url, token=token)
 def chat_template_prompt():
     template = """
     Do not repeat questions and do not generate answer for user/human.Do not repeat yourself and do not create/generate dialogues.