Spaces:

pythonitalia
/

realtime-transcription

Build error

File size: 1,058 Bytes

62b3774
71f6464
db56cf5
71f6464
 
 
db56cf5
 
 
 
 
62b3774
 
db56cf5
 
 
 
 
 
71f6464
 
 
46d52cc
03ccab8
 
71f6464
 
 
1ba4a0c
71f6464
 
 
87d097e
71f6464
 
 
 
 
 
 
03ccab8
71f6464

import os
import pickle
from typing import Union
from fastapi import Request
import torch
from transformers import pipeline

from fastapi import FastAPI

app = FastAPI()

DEVICE = os.getenv('DEVICE', 'mps')
ATTN_IMPLEMENTATION = os.getenv('ATTN_IMPLEMENTATION', "sdpa")

@app.get("/")
def read_root():
    return {"status": "ok"}


TRANSCRIBE_PIPELINE = pipeline(
    "automatic-speech-recognition",
    model="openai/whisper-large-v3",
    torch_dtype=torch.float16 if ATTN_IMPLEMENTATION == "sdpa" else torch.bfloat16,
    device=DEVICE,
    model_kwargs={"attn_implementation": ATTN_IMPLEMENTATION},
)


@app.post("/transcribe")
async def transcribe(request: Request):
    body = await request.body()
    audio_chunk = pickle.loads(body)
    outputs = TRANSCRIBE_PIPELINE(
        audio_chunk,
        chunk_length_s=30,
        batch_size=24,
        generate_kwargs={
            'task': 'transcribe',
            'language': 'english'
        },
        return_timestamps='word'
    )
    text = outputs["text"].strip()
    return {"transcribe": text}