Spaces:

DSatishchandra
/

agent_management_app

Sleeping

agent_management_app / modules /kyc_processor.py

Update modules/kyc_processor.py

a0b47f9 verified about 2 months ago

612 Bytes

	from PIL import Image
	from transformers import TrOCRProcessor, VisionEncoderDecoderModel
	import torch

	# Load once at startup
	processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-stage1")
	model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-stage1")

	def extract_text_from_id(image_path):
	image = Image.open(image_path).convert("RGB")

	pixel_values = processor(images=image, return_tensors="pt").pixel_values
	generated_ids = model.generate(pixel_values)

	generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
	return generated_text