Spaces:

spark-ds549
/

Chinese-Label-Transcription

Sleeping

File size: 2,199 Bytes

import gradio as gr
import os
import pandas as pd
from google.cloud import documentai_v1 as documentai
from google.cloud.documentai_v1.types import RawDocument
from google.cloud import translate_v2 as translate
from google.api_core.client_options import ClientOptions
import zipfile
import io

import os
# Upload credential json file from default compute service account
os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "herbaria-ai-3c860bcb0f44.json"

# Set your Google Cloud Document AI processor details here
project_id = "herbaria-ai"
location = "us"
processor_id = "4307b078717a399a"

def translate_text(text, target_language="en"):
    translate_client = translate.Client()
    result = translate_client.translate(text, target_language=target_language)
    return result["translatedText"]

def process_image(file):
    try:
        # Process the document directly from the file-like object
        extracted_text, translated_text = batch_process_documents(file, "image/jpeg")
        return extracted_text, translated_text
    except Exception as e:
        return f"An error occurred: {str(e)}", ""

def batch_process_documents(file, file_mime_type: str) -> tuple:
    opts = documentai.ClientOptions(api_endpoint=f"{location}-documentai.googleapis.com")
    client = documentai.DocumentProcessorServiceClient(client_options=opts)
    
    # Read the file content directly from the file-like object
    raw_document = RawDocument(content=file.read(), mime_type=file_mime_type)
    name = client.processor_path(project_id, location, processor_id)
    request = documentai.ProcessRequest(name=name, raw_document=raw_document)
    result = client.process_document(request=request)
    extracted_text = result.document.text
    translated_text = translate_text(extracted_text)
    return extracted_text, translated_text

iface = gr.Interface(
    fn=process_image,
    inputs=gr.inputs.File(label="Upload Image File"),
    outputs=[
        gr.outputs.Textbox(label="Extracted Text"),
        gr.outputs.Textbox(label="Translated Text")
    ]
)

iface.launch()


# def greet(name):
   # return "Hello " + name + "!!"

#iface = gr.Interface(fn=greet, inputs="text", outputs="text")
#iface.launch()