Spaces:

dwani
/

dwani-server

Running on CPU Upgrade

App Files Files Community

sachin commited on 12 days ago

Commit

9394c20

1 Parent(s): 99bc65d

update-call

Browse files

Files changed (2) hide show

Dockerfile +1 -1
src/server/main.py +28 -19

Dockerfile CHANGED Viewed

@@ -9,7 +9,7 @@ COPY . .
 # Expose port from settings
 EXPOSE 7860
 # Healthcheck
 HEALTHCHECK --interval=30s --timeout=3s \
   CMD curl -f http://localhost:7860/v1/health || exit 1

 # Expose port from settings
 EXPOSE 7860
+RUN pip install dwani
 # Healthcheck
 HEALTHCHECK --interval=30s --timeout=3s \
   CMD curl -f http://localhost:7860/v1/health || exit 1

src/server/main.py CHANGED Viewed

@@ -3,7 +3,8 @@ import io
 from time import time
 from typing import List, Optional
 from abc import ABC, abstractmethod
 import uvicorn
 from fastapi import Depends, FastAPI, File, HTTPException, Query, Request, UploadFile, Header, Form
 from fastapi.middleware.cors import CORSMiddleware
@@ -29,6 +30,10 @@ from config.logging_config import logger
 settings = Settings()
 # FastAPI app setup with enhanced docs
 app = FastAPI(
     title="Dhwani API",
@@ -278,7 +283,7 @@ async def app_register_user(
     register_request: RegisterRequest,
     x_session_key: str = Header(..., alias="X-Session-Key")
 ):
-    logger.info(f"App registration attempt")
     return await app_register(register_request, x_session_key)
 @app.post("/v1/audio/speech",
@@ -318,7 +323,7 @@ async def generate_audio(
     if len(decrypted_input) > 1000:
         raise HTTPException(status_code=400, detail="Decrypted input cannot exceed 1000 characters")
-    logger.info("Processing speech request", extra={
         "endpoint": "/v1/audio/speech",
         "input_length": len(decrypted_input),
         "client_ip": get_remote_address(request),
@@ -399,9 +404,13 @@ async def chat(
     if len(decrypted_prompt) > 1000:
         raise HTTPException(status_code=400, detail="Decrypted prompt cannot exceed 1000 characters")
-    logger.info(f"Received prompt: {decrypted_prompt}, src_lang: {decrypted_src_lang}, user_id: {user_id}")
     try:
         external_url = f"{settings.external_api_base_url}/v1/chat"
         payload = {
             "prompt": decrypted_prompt,
@@ -419,10 +428,10 @@ async def chat(
             timeout=60
         )
         response.raise_for_status()
         response_data = response.json()
         response_text = response_data.get("response", "")
-        logger.info(f"Generated Chat response from external API: {response_text}")
         return ChatResponse(response=response_text)
     except requests.Timeout:
@@ -470,7 +479,7 @@ async def process_audio(
     if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
-    logger.info("Processing audio processing request", extra={
         "endpoint": "/v1/process_audio",
         "filename": file.filename,
         "language": decrypted_language,
@@ -493,7 +502,7 @@ async def process_audio(
         response.raise_for_status()
         processed_result = response.json().get("result", "")
-        logger.info(f"Audio processing completed in {time() - start_time:.2f} seconds")
         return AudioProcessingResponse(result=processed_result)
     except requests.Timeout:
@@ -551,7 +560,7 @@ async def transcribe_audio(
         response.raise_for_status()
         transcription = response.json().get("text", "")
-        logger.info(f"Transcription completed in {time() - start_time:.2f} seconds")
         return TranscriptionResponse(text=transcription)
     except HTTPException:
@@ -585,7 +594,7 @@ async def chat_v2(
     if not prompt:
         raise HTTPException(status_code=400, detail="Prompt cannot be empty")
-    logger.info("Processing chat_v2 request", extra={
         "endpoint": "/v1/chat_v2",
         "prompt_length": len(prompt),
         "has_image": bool(image),
@@ -668,7 +677,7 @@ async def translate(
         logger.error(f"Unsupported language codes: src={decrypted_src_lang}, tgt={decrypted_tgt_lang}")
         raise HTTPException(status_code=400, detail=f"Unsupported language codes: src={decrypted_src_lang}, tgt={decrypted_tgt_lang}")
-    logger.info(f"Received translation request: {len(decrypted_sentences)} sentences, src_lang: {decrypted_src_lang}, tgt_lang: {decrypted_tgt_lang}, user_id: {user_id}")
     external_url = f"{settings.external_api_base_url}/v1/translate"
@@ -697,7 +706,7 @@ async def translate(
             logger.warning(f"Unexpected response format: {response_data}")
             raise HTTPException(status_code=500, detail="Invalid response from translation service")
-        logger.info(f"Translation successful: {translations}")
         return TranslationResponse(translations=translations)
     except requests.Timeout:
@@ -756,7 +765,7 @@ async def extract_text(
         logger.error(f"PDF decryption failed: {str(e)}")
         raise HTTPException(status_code=400, detail="Invalid encrypted PDF")
-    logger.info("Processing PDF text extraction request", extra={
         "endpoint": "/v1/extract-text",
         "file_name": file.filename,
         "page_number": page_number,
@@ -784,7 +793,7 @@ async def extract_text(
             logger.warning("No page_content found in external API response")
             extracted_text = ""
-        logger.info(f"PDF text extraction completed in {time() - start_time:.2f} seconds")
         return PDFTextExtractionResponse(page_content=extracted_text.strip())
     except requests.Timeout:
@@ -825,7 +834,7 @@ async def visual_query(
     try:
         import json
         visual_query_request = VisualQueryRequest.parse_raw(data)
-        logger.info(f"Received visual query JSON: {data}")
     except Exception as e:
         logger.error(f"Failed to parse JSON data: {str(e)}")
         raise HTTPException(status_code=422, detail=f"Invalid JSON data: {str(e)}")
@@ -867,7 +876,7 @@ async def visual_query(
         logger.error(f"Image decryption failed: {str(e)}")
         raise HTTPException(status_code=400, detail="Invalid encrypted image")
-    logger.info("Processing visual query request", extra={
         "endpoint": "/v1/visual_query",
         "query_length": len(decrypted_query),
         "file_name": file.filename,
@@ -899,7 +908,7 @@ async def visual_query(
             logger.warning(f"Empty answer received from external API: {response_data}")
             raise HTTPException(status_code=500, detail="No answer provided by visual query service")
-        logger.info(f"Visual query successful: {answer}")
         return VisualQueryResponse(answer=answer)
     except requests.Timeout:
@@ -955,7 +964,7 @@ async def speech_to_speech(
     if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
-    logger.info("Processing speech-to-speech request", extra={
         "endpoint": "/v1/speech_to_speech",
         "audio_filename": file.filename,
         "language": decrypted_language,
@@ -1029,7 +1038,7 @@ async def speech_to_speech_v2(
     if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
-    logger.info("Processing speech-to-speech request", extra={
         "endpoint": "/v1/speech_to_speech",
         "audio_filename": file.filename,
         "language": decrypted_language,

 from time import time
 from typing import List, Optional
 from abc import ABC, abstractmethod
+import dwani
+import os
 import uvicorn
 from fastapi import Depends, FastAPI, File, HTTPException, Query, Request, UploadFile, Header, Form
 from fastapi.middleware.cors import CORSMiddleware
 settings = Settings()
+dwani.api_key = os.getenv("DWANI_API_KEY")
+dwani.api_base = os.getenv("DWANI_API_BASE_URL")
 # FastAPI app setup with enhanced docs
 app = FastAPI(
     title="Dhwani API",
     register_request: RegisterRequest,
     x_session_key: str = Header(..., alias="X-Session-Key")
 ):
+    logger.debug(f"App registration attempt")
     return await app_register(register_request, x_session_key)
 @app.post("/v1/audio/speech",
     if len(decrypted_input) > 1000:
         raise HTTPException(status_code=400, detail="Decrypted input cannot exceed 1000 characters")
+    logger.debug("Processing speech request", extra={
         "endpoint": "/v1/audio/speech",
         "input_length": len(decrypted_input),
         "client_ip": get_remote_address(request),
     if len(decrypted_prompt) > 1000:
         raise HTTPException(status_code=400, detail="Decrypted prompt cannot exceed 1000 characters")
+    logger.debug(f"Received prompt: {decrypted_prompt}, src_lang: {decrypted_src_lang}, user_id: {user_id}")
     try:
+        response = dwani.Chat.create(prompt=decrypted_prompt, src_lang=decrypted_src_lang, tgt_lang=decrypted_tgt_lang)
+        '''
         external_url = f"{settings.external_api_base_url}/v1/chat"
         payload = {
             "prompt": decrypted_prompt,
             timeout=60
         )
         response.raise_for_status()
+        '''
         response_data = response.json()
         response_text = response_data.get("response", "")
+        logger.debug(f"Generated Chat response from external API: {response_text}")
         return ChatResponse(response=response_text)
     except requests.Timeout:
     if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
+    logger.debug("Processing audio processing request", extra={
         "endpoint": "/v1/process_audio",
         "filename": file.filename,
         "language": decrypted_language,
         response.raise_for_status()
         processed_result = response.json().get("result", "")
+        logger.debug(f"Audio processing completed in {time() - start_time:.2f} seconds")
         return AudioProcessingResponse(result=processed_result)
     except requests.Timeout:
         response.raise_for_status()
         transcription = response.json().get("text", "")
+        logger.debug(f"Transcription completed in {time() - start_time:.2f} seconds")
         return TranscriptionResponse(text=transcription)
     except HTTPException:
     if not prompt:
         raise HTTPException(status_code=400, detail="Prompt cannot be empty")
+    logger.debug("Processing chat_v2 request", extra={
         "endpoint": "/v1/chat_v2",
         "prompt_length": len(prompt),
         "has_image": bool(image),
         logger.error(f"Unsupported language codes: src={decrypted_src_lang}, tgt={decrypted_tgt_lang}")
         raise HTTPException(status_code=400, detail=f"Unsupported language codes: src={decrypted_src_lang}, tgt={decrypted_tgt_lang}")
+    logger.debug(f"Received translation request: {len(decrypted_sentences)} sentences, src_lang: {decrypted_src_lang}, tgt_lang: {decrypted_tgt_lang}, user_id: {user_id}")
     external_url = f"{settings.external_api_base_url}/v1/translate"
             logger.warning(f"Unexpected response format: {response_data}")
             raise HTTPException(status_code=500, detail="Invalid response from translation service")
+        logger.debug(f"Translation successful: {translations}")
         return TranslationResponse(translations=translations)
     except requests.Timeout:
         logger.error(f"PDF decryption failed: {str(e)}")
         raise HTTPException(status_code=400, detail="Invalid encrypted PDF")
+    logger.debug("Processing PDF text extraction request", extra={
         "endpoint": "/v1/extract-text",
         "file_name": file.filename,
         "page_number": page_number,
             logger.warning("No page_content found in external API response")
             extracted_text = ""
+        logger.debug(f"PDF text extraction completed in {time() - start_time:.2f} seconds")
         return PDFTextExtractionResponse(page_content=extracted_text.strip())
     except requests.Timeout:
     try:
         import json
         visual_query_request = VisualQueryRequest.parse_raw(data)
+        logger.debug(f"Received visual query JSON: {data}")
     except Exception as e:
         logger.error(f"Failed to parse JSON data: {str(e)}")
         raise HTTPException(status_code=422, detail=f"Invalid JSON data: {str(e)}")
         logger.error(f"Image decryption failed: {str(e)}")
         raise HTTPException(status_code=400, detail="Invalid encrypted image")
+    logger.debug("Processing visual query request", extra={
         "endpoint": "/v1/visual_query",
         "query_length": len(decrypted_query),
         "file_name": file.filename,
             logger.warning(f"Empty answer received from external API: {response_data}")
             raise HTTPException(status_code=500, detail="No answer provided by visual query service")
+        logger.debug(f"Visual query successful: {answer}")
         return VisualQueryResponse(answer=answer)
     except requests.Timeout:
     if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
+    logger.debug("Processing speech-to-speech request", extra={
         "endpoint": "/v1/speech_to_speech",
         "audio_filename": file.filename,
         "language": decrypted_language,
     if decrypted_language not in allowed_languages:
         raise HTTPException(status_code=400, detail=f"Language must be one of {allowed_languages}")
+    logger.debug("Processing speech-to-speech request", extra={
         "endpoint": "/v1/speech_to_speech",
         "audio_filename": file.filename,
         "language": decrypted_language,