Spaces:

muryshev
/

nn-search-transmap

Sleeping

App Files Files Community

muryshev commited on Jan 13

Commit

13e17af

1 Parent(s): a5ee5e1

update

Browse files

Files changed (3) hide show

llm/common.py +3 -0
llm/deepinfra_api.py +9 -10
llm/vllm_api.py +16 -16

llm/common.py CHANGED Viewed

@@ -54,6 +54,9 @@ class LlmApi:
     params: LlmParams = None
     def create_headers(self) -> dict[str, str]:
         headers = {"Content-Type": "application/json"}

     params: LlmParams = None
+    def set_params(self, params: LlmParams):
+        self.params = params
     def create_headers(self) -> dict[str, str]:
         headers = {"Content-Type": "application/json"}

llm/deepinfra_api.py CHANGED Viewed

@@ -9,8 +9,7 @@ class DeepInfraApi(LlmApi):
     """
     def __init__(self, params: LlmParams):
-        super.params = params
     async def get_models(self) -> List[str]:
         """
@@ -25,7 +24,7 @@ class DeepInfraApi(LlmApi):
         """
         try:
             async with httpx.AsyncClient() as client:
-                response = await client.get(f"{super.params.url}/v1/openai/models", super.create_headers())
                 if response.status_code == 200:
                     json_data = response.json()
                     return [item['id'] for item in json_data.get('data', [])]
@@ -45,8 +44,8 @@ class DeepInfraApi(LlmApi):
         """
         actual_prompt = self.apply_llm_template_to_prompt(prompt)
         messages = []
-        if super.params.predict_params and super.params.predict_params.system_prompt:
-            messages.append({"role": "system", "content": super.params.predict_params.system_prompt})
         messages.append({"role": "user", "content": actual_prompt})
         return messages
@@ -61,8 +60,8 @@ class DeepInfraApi(LlmApi):
             str: Промпт с примененным шаблоном (или оригинальный, если шаблон отсутствует).
         """
         actual_prompt = prompt
-        if super.params.template is not None:
-            actual_prompt = super.params.template.replace("{{PROMPT}}", actual_prompt)
         return actual_prompt
     async def tokenize(self, prompt: str) -> Optional[dict]:
@@ -84,10 +83,10 @@ class DeepInfraApi(LlmApi):
         request = {
             "stream": False,
-            "model": super.params.model,
         }
-        predict_params = super.params.predict_params
         if predict_params:
             if predict_params.stop:
                 non_empty_stop = list(filter(lambda o: o != "", predict_params.stop))
@@ -148,6 +147,6 @@ class DeepInfraApi(LlmApi):
             request = await self.create_request(prompt)
             async with httpx.AsyncClient() as client:
-                response = client.post(f"{super.params.url}/v1/openai/chat/completions", super.create_headers(), json=request)
                 if response.status_code == 200:
                     return response.json()["choices"][0]["message"]["content"]

     """
     def __init__(self, params: LlmParams):
+        super().set_params(params)
     async def get_models(self) -> List[str]:
         """
         """
         try:
             async with httpx.AsyncClient() as client:
+                response = await client.get(f"{super().params.url}/v1/openai/models", super().create_headers())
                 if response.status_code == 200:
                     json_data = response.json()
                     return [item['id'] for item in json_data.get('data', [])]
         """
         actual_prompt = self.apply_llm_template_to_prompt(prompt)
         messages = []
+        if super().params.predict_params and super().params.predict_params.system_prompt:
+            messages.append({"role": "system", "content": super().params.predict_params.system_prompt})
         messages.append({"role": "user", "content": actual_prompt})
         return messages
             str: Промпт с примененным шаблоном (или оригинальный, если шаблон отсутствует).
         """
         actual_prompt = prompt
+        if super().params.template is not None:
+            actual_prompt = super().params.template.replace("{{PROMPT}}", actual_prompt)
         return actual_prompt
     async def tokenize(self, prompt: str) -> Optional[dict]:
         request = {
             "stream": False,
+            "model": super().params.model,
         }
+        predict_params = super().params.predict_params
         if predict_params:
             if predict_params.stop:
                 non_empty_stop = list(filter(lambda o: o != "", predict_params.stop))
             request = await self.create_request(prompt)
             async with httpx.AsyncClient() as client:
+                response = client.post(f"{super().params.url}/v1/openai/chat/completions", super().create_headers(), json=request)
                 if response.status_code == 200:
                     return response.json()["choices"][0]["message"]["content"]

llm/vllm_api.py CHANGED Viewed

@@ -11,8 +11,8 @@ class LlmApi(LlmApi):
     """
     def __init__(self, params: LlmParams):
-        super.params = params
     async def get_models(self) -> List[str]:
         """
         Выполняет GET-запрос к API для получения списка доступных моделей.
@@ -26,7 +26,7 @@ class LlmApi(LlmApi):
         """
         try:
             async with httpx.AsyncClient() as client:
-                response = await client.get(f"{super.params.url}/v1/models", super.create_headers())
                 if response.status_code == 200:
                     json_data = response.json()
                     return [item['id'] for item in json_data.get('data', [])]
@@ -36,8 +36,8 @@ class LlmApi(LlmApi):
     async def get_model(self) -> str:
         model = None
-        if super.params.model is not None:
-            model = super.params.model
         else:
             models = await self.get_models()
             model = models[0] if models else None
@@ -59,8 +59,8 @@ class LlmApi(LlmApi):
         """
         actual_prompt = self.apply_llm_template_to_prompt(prompt)
         messages = []
-        if super.params.predict_params and super.params.predict_params.system_prompt:
-            messages.append({"role": "system", "content": super.params.predict_params.system_prompt})
         messages.append({"role": "user", "content": actual_prompt})
         return messages
@@ -75,8 +75,8 @@ class LlmApi(LlmApi):
             str: Промпт с примененным шаблоном (или оригинальный, если шаблон отсутствует).
         """
         actual_prompt = prompt
-        if super.params.template is not None:
-            actual_prompt = super.params.template.replace("{{PROMPT}}", actual_prompt)
         return actual_prompt
     async def tokenize(self, prompt: str) -> Optional[dict]:
@@ -101,9 +101,9 @@ class LlmApi(LlmApi):
         try:
             async with httpx.AsyncClient() as client:
                 response = await client.post(
-                    f"{super.params.url}/tokenize",
                     json=request_data,
-                    headers=super.create_headers(),
                 )
                 if response.status_code == 200:
                     data = response.json()
@@ -135,9 +135,9 @@ class LlmApi(LlmApi):
         try:
             async with httpx.AsyncClient() as client:
                 response = await client.post(
-                    f"{super.params.url}/detokenize",
                     json=request_data,
-                    headers=super.create_headers(),
                 )
                 if response.status_code == 200:
                     data = response.json()
@@ -169,7 +169,7 @@ class LlmApi(LlmApi):
             "model": model,
         }
-        predict_params = super.params.predict_params
         if predict_params:
             if predict_params.stop:
                 non_empty_stop = list(filter(lambda o: o != "", predict_params.stop))
@@ -250,7 +250,7 @@ class LlmApi(LlmApi):
         # Максимально допустимое количество токенов для источников
         max_length = (
             max_token_count
-            - (super.params.predict_params.n_predict or 0)
             - aux_token_count
             - system_prompt_token_count
         )
@@ -289,7 +289,7 @@ class LlmApi(LlmApi):
             request = await self.create_request(prompt)
             # Начинаем потоковый запрос
-            async with client.stream("POST", f"{super.params.url}/v1/chat/completions", json=request) as response:
                 if response.status_code != 200:
                     # Если ошибка, читаем ответ для получения подробностей
                     error_content = await response.aread()

     """
     def __init__(self, params: LlmParams):
+        super().set_params(params)
     async def get_models(self) -> List[str]:
         """
         Выполняет GET-запрос к API для получения списка доступных моделей.
         """
         try:
             async with httpx.AsyncClient() as client:
+                response = await client.get(f"{super().params.url}/v1/models", super().create_headers())
                 if response.status_code == 200:
                     json_data = response.json()
                     return [item['id'] for item in json_data.get('data', [])]
     async def get_model(self) -> str:
         model = None
+        if super().params.model is not None:
+            model = super().params.model
         else:
             models = await self.get_models()
             model = models[0] if models else None
         """
         actual_prompt = self.apply_llm_template_to_prompt(prompt)
         messages = []
+        if super().params.predict_params and super().params.predict_params.system_prompt:
+            messages.append({"role": "system", "content": super().params.predict_params.system_prompt})
         messages.append({"role": "user", "content": actual_prompt})
         return messages
             str: Промпт с примененным шаблоном (или оригинальный, если шаблон отсутствует).
         """
         actual_prompt = prompt
+        if super().params.template is not None:
+            actual_prompt = super().params.template.replace("{{PROMPT}}", actual_prompt)
         return actual_prompt
     async def tokenize(self, prompt: str) -> Optional[dict]:
         try:
             async with httpx.AsyncClient() as client:
                 response = await client.post(
+                    f"{super().params.url}/tokenize",
                     json=request_data,
+                    headers=super().create_headers(),
                 )
                 if response.status_code == 200:
                     data = response.json()
         try:
             async with httpx.AsyncClient() as client:
                 response = await client.post(
+                    f"{super().params.url}/detokenize",
                     json=request_data,
+                    headers=super().create_headers(),
                 )
                 if response.status_code == 200:
                     data = response.json()
             "model": model,
         }
+        predict_params = super().params.predict_params
         if predict_params:
             if predict_params.stop:
                 non_empty_stop = list(filter(lambda o: o != "", predict_params.stop))
         # Максимально допустимое количество токенов для источников
         max_length = (
             max_token_count
+            - (super().params.predict_params.n_predict or 0)
             - aux_token_count
             - system_prompt_token_count
         )
             request = await self.create_request(prompt)
             # Начинаем потоковый запрос
+            async with client.stream("POST", f"{super().params.url}/v1/chat/completions", json=request) as response:
                 if response.status_code != 200:
                     # Если ошибка, читаем ответ для получения подробностей
                     error_content = await response.aread()