Spaces:

cesar
/

DemoProfeIA

Sleeping

App Files Files Community

DemoProfeIA / app.py

cesar

Update app.py

85b6c95 verified 9 months ago

raw

history blame

5.49 kB

	import gradio as gr
	import PyPDF2
	import os
	import json
	import vertexai
	from vertexai.generative_models import GenerativeModel, Part, SafetySetting

	# Configuración global
	generation_config = {
	"max_output_tokens": 4096,
	"temperature": 0,
	"top_p": 0.8,
	}
	safety_settings = [
	SafetySetting(
	category=SafetySetting.HarmCategory.HARM_CATEGORY_HATE_SPEECH,
	threshold=SafetySetting.HarmBlockThreshold.OFF
	),
	SafetySetting(
	category=SafetySetting.HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT,
	threshold=SafetySetting.HarmBlockThreshold.OFF
	),
	SafetySetting(
	category=SafetySetting.HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT,
	threshold=SafetySetting.HarmBlockThreshold.OFF
	),
	SafetySetting(
	category=SafetySetting.HarmCategory.HARM_CATEGORY_HARASSMENT,
	threshold=SafetySetting.HarmBlockThreshold.OFF
	),
	]

	def configurar_credenciales(json_path: str):
	os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = json_path

	def extraer_texto(pdf_path: str) -> str:
	texto_total = ""
	with open(pdf_path, "rb") as f:
	lector = PyPDF2.PdfReader(f)
	for page in lector.pages:
	texto_total += page.extract_text() or ""
	return texto_total

	def parsear_con_llm(texto_pdf: str, model: GenerativeModel) -> dict:
	"""
	Usa el LLM para extraer preguntas y respuestas:
	- Considera que 'Explicá' o 'Explica' o 'Explique' es una pregunta,
	aunque no diga 'Pregunta:'.
	- Reconoce 'RESPUESTA', 'RESPUESTAS', con o sin dos puntos,
	como inicio de la respuesta.
	"""
	prompt = f"""
	Eres un parser de texto.
	Te entrego el contenido de un PDF con una pregunta o varias,
	y su(s) respuesta(s). Usa estas reglas para interpretarlo:
	1. Si ves 'Explicá', 'Explica', 'Explique', 'Teniendo en cuenta que...'
	o algo similar, asúmelo como una pregunta.
	Si no hay 'Pregunta:' literal, aun así consideralo pregunta.
	2. Las respuestas podrían estar marcadas como 'RESPUESTAS', 'RESPUESTA', 'RESPUESTAS:', etc.
	3. Devuelve un JSON con la estructura:
	{{
	"Pregunta 1": "Texto de la respuesta"
	}}
	Si hay más de una pregunta, enumerarlas como 'Pregunta 2', etc.
	4. Si no hay nada reconocible, devuelve {{}}.

	Texto PDF:
	{texto_pdf}

	Devuelve solo el JSON, sin explicaciones ni texto extra.
	"""
	part_text = Part.from_text(prompt)

	response = model.generate_content(
	[part_text],
	generation_config=generation_config,
	safety_settings=safety_settings,
	stream=False
	)
	try:
	data = json.loads(response.text.strip())
	if isinstance(data, dict):
	return data
	else:
	return {}
	except:
	return {}

	def comparar_preguntas_respuestas(dict_docente: dict, dict_alumno: dict) -> str:
	retroalimentacion = []
	for pregunta, resp_correcta in dict_docente.items():
	resp_alumno = dict_alumno.get(pregunta, None)
	if resp_alumno is None:
	retroalimentacion.append(
	f"{pregunta}\nNo fue asignada al alumno.\n"
	)
	else:
	retroalimentacion.append(
	f"{pregunta}\n"
	f"Respuesta del alumno: {resp_alumno}\n"
	f"Respuesta correcta: {resp_correcta}\n"
	)
	return "\n".join(retroalimentacion)

	def revisar_examen(json_cred, pdf_docente, pdf_alumno):
	try:
	configurar_credenciales(json_cred.name)
	vertexai.init(project="deploygpt", location="us-central1")

	texto_docente = extraer_texto(pdf_docente.name)
	texto_alumno = extraer_texto(pdf_alumno.name)

	# 1) Instanciar el modelo
	model = GenerativeModel(
	"gemini-1.5-pro-001",
	system_instruction=["Eres un parser estricto."]
	)

	# 2) Convertir PDF Docente y Alumno en dict {Pregunta X: Respuesta X}
	dict_docente = parsear_con_llm(texto_docente, model)
	dict_alumno = parsear_con_llm(texto_alumno, model)

	# 3) Comparar y generar feedback
	feedback = comparar_preguntas_respuestas(dict_docente, dict_alumno)

	if len(feedback.strip()) < 5:
	return "No se encontraron preguntas o respuestas válidas."

	# 4) Generar un resumen
	summary_prompt = f"""
	Eres un profesor experto de bioquímica. Te muestro la comparación de preguntas y respuestas:
	{feedback}
	Por favor, genera un breve resumen del desempeño del alumno
	sin inventar preguntas adicionales.
	"""
	summary_part = Part.from_text(summary_prompt)
	summary_resp = model.generate_content(
	[summary_part],
	generation_config=generation_config,
	safety_settings=safety_settings,
	stream=False
	)
	return f"{feedback}\n\nResumen\n{summary_resp.text.strip()}"

	except Exception as e:
	return f"Error al procesar: {str(e)}"

	import gradio as gr

	interface = gr.Interface(
	fn=revisar_examen,
	inputs=[
	gr.File(label="Credenciales JSON"),
	gr.File(label="PDF Docente"),
	gr.File(label="PDF Alumno")
	],
	outputs=gr.Markdown(),
	title="Revisión de Exámenes con LLM (Permisivo)",
	description=("Sube credenciales, el PDF del docente y del alumno; "
	"se emplea un LLM para encontrar 'Explicá' y 'RESPUESTAS' etc. "
	"y evitar alucinaciones.")
	)

	interface.launch(debug=True)