calibrate / app.py
C2MV's picture
Update app.py
4e106ba verified
raw
history blame
21.9 kB
import gradio as gr
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from datetime import datetime
import docx
from docx.shared import Inches, Pt
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
import os
def generar_tabla(n_filas, concentracion_inicial, unidad_medida):
valores_base = [1.00, 0.80, 0.60, 0.40, 0.20, 0.10, 0.05]
if n_filas <= 7:
solucion_inoculo = valores_base[:n_filas]
agua = [round(1 - x, 2) for x in solucion_inoculo]
else:
solucion_inoculo = valores_base.copy()
ultimo_valor = valores_base[-1]
for _ in range(n_filas - 7):
nuevo_valor = round(ultimo_valor / 2, 3)
solucion_inoculo.append(nuevo_valor)
ultimo_valor = nuevo_valor
agua = [round(1 - x, 3) for x in solucion_inoculo]
data = {
f"Solución de inóculo ({concentracion_inicial} {unidad_medida})": solucion_inoculo,
"H2O": agua
}
df = pd.DataFrame(data)
nombre_columna = f"Solución de inóculo ({concentracion_inicial} {unidad_medida})"
df["Factor de Dilución"] = df[nombre_columna].apply(lambda x: round(1 / x, 2))
df[f"Concentración Predicha ({unidad_medida})"] = df["Factor de Dilución"].apply(
lambda x: round(concentracion_inicial / x, 0)
)
df[f"Concentración Real ({unidad_medida})"] = None
return df
def ajustar_decimales_evento(df, decimales):
df = df.copy()
# Identificar la columna de Concentración Predicha
col_predicha = [col for col in df.columns if 'Concentración Predicha' in col][0]
# Redondear la columna al número de decimales especificado
df[col_predicha] = df[col_predicha].astype(float).round(decimales)
# Actualizar el componente DataFrame con la nueva precisión
return gr.update(value=df, precision=decimales)
def generar_datos_sinteticos(df, desviacion_std):
col_predicha = [col for col in df.columns if 'Predicha' in col][0]
col_real = [col for col in df.columns if 'Real' in col][0]
# Generar datos sintéticos
valores_predichos = df[col_predicha].astype(float).values
datos_sinteticos = valores_predichos + np.random.normal(0, desviacion_std, size=len(valores_predichos))
datos_sinteticos = np.maximum(0, datos_sinteticos) # Asegurar que no haya valores negativos
datos_sinteticos = np.round(datos_sinteticos, 2)
df[col_real] = datos_sinteticos
return df
def generar_graficos(df_valid):
col_predicha = [col for col in df_valid.columns if 'Predicha' in col][0]
col_real = [col for col in df_valid.columns if 'Real' in col][0]
# Convertir a numérico
df_valid[col_predicha] = df_valid[col_predicha].astype(float)
df_valid[col_real] = df_valid[col_real].astype(float)
# Calcular regresión lineal
slope, intercept, r_value, p_value, std_err = stats.linregress(df_valid[col_predicha], df_valid[col_real])
df_valid['Ajuste Lineal'] = intercept + slope * df_valid[col_predicha]
# Configurar estilos
sns.set(style="whitegrid")
plt.rcParams.update({'figure.autolayout': True})
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))
# Gráfico de dispersión con línea de regresión
sns.scatterplot(
data=df_valid,
x=col_predicha,
y=col_real,
ax=ax1,
color='blue',
s=100,
label='Datos Reales',
marker='o'
)
# Línea de ajuste
sns.lineplot(
x=df_valid[col_predicha],
y=df_valid['Ajuste Lineal'],
ax=ax1,
color='green',
label='Ajuste Lineal',
linewidth=2
)
# Línea ideal
min_predicha = df_valid[col_predicha].min()
max_predicha = df_valid[col_predicha].max()
ax1.plot(
[min_predicha, max_predicha],
[min_predicha, max_predicha],
color='red',
linestyle='--',
label='Ideal'
)
ax1.set_title('Correlación entre Concentración Predicha y Real', fontsize=14)
ax1.set_xlabel('Concentración Predicha', fontsize=12)
ax1.set_ylabel('Concentración Real', fontsize=12)
# Añadir ecuación y R² en el gráfico
ax1.annotate(
f'y = {intercept:.2f} + {slope:.2f}x\n$R^2$ = {r_value**2:.4f}',
xy=(0.05, 0.95),
xycoords='axes fraction',
fontsize=12,
backgroundcolor='white',
verticalalignment='top'
)
# Posicionar la leyenda
ax1.legend(loc='lower right', fontsize=10)
# Gráfico de residuos
residuos = df_valid[col_real] - df_valid['Ajuste Lineal']
sns.scatterplot(
data=df_valid,
x=col_predicha,
y=residuos,
ax=ax2,
color='purple',
s=100,
marker='D',
label='Residuos'
)
ax2.axhline(y=0, color='black', linestyle='--', linewidth=1)
ax2.set_title('Gráfico de Residuos', fontsize=14)
ax2.set_xlabel('Concentración Predicha', fontsize=12)
ax2.set_ylabel('Residuo', fontsize=12)
ax2.legend(loc='upper right', fontsize=10)
plt.tight_layout()
plt.savefig('grafico.png') # Guardar el gráfico para incluirlo en el informe
return fig
def evaluar_calidad_calibracion(df_valid, r_squared, rmse, cv_percent):
"""Evaluar la calidad de la calibración y proporcionar recomendaciones"""
evaluacion = {
"calidad": "",
"recomendaciones": [],
"estado": "✅" if r_squared >= 0.95 and cv_percent <= 15 else "⚠️"
}
if r_squared >= 0.95:
evaluacion["calidad"] = "Excelente"
elif r_squared >= 0.90:
evaluacion["calidad"] = "Buena"
elif r_squared >= 0.85:
evaluacion["calidad"] = "Regular"
else:
evaluacion["calidad"] = "Deficiente"
if r_squared < 0.95:
evaluacion["recomendaciones"].append("- Considere repetir algunas mediciones para mejorar la correlación")
if cv_percent > 15:
evaluacion["recomendaciones"].append("- La variabilidad es alta. Revise el procedimiento de dilución")
if rmse > 0.1 * df_valid[df_valid.columns[-1]].astype(float).mean():
evaluacion["recomendaciones"].append("- El error de predicción es significativo. Verifique la técnica de medición")
return evaluacion
def generar_informe_completo(df_valid):
"""Generar un informe completo en formato markdown"""
col_predicha = [col for col in df_valid.columns if 'Predicha' in col][0]
col_real = [col for col in df_valid.columns if 'Real' in col][0]
# Convertir a numérico
df_valid[col_predicha] = df_valid[col_predicha].astype(float)
df_valid[col_real] = df_valid[col_real].astype(float)
# Calcular estadísticas
slope, intercept, r_value, p_value, std_err = stats.linregress(df_valid[col_predicha], df_valid[col_real])
r_squared = r_value ** 2
rmse = np.sqrt(((df_valid[col_real] - (intercept + slope * df_valid[col_predicha])) ** 2).mean())
cv = (df_valid[col_real].std() / df_valid[col_real].mean()) * 100 # CV de los valores reales
# Evaluar calidad
evaluacion = evaluar_calidad_calibracion(df_valid, r_squared, rmse, cv)
informe = f"""# Informe de Calibración {evaluacion['estado']}
Fecha: {datetime.now().strftime('%d/%m/%Y %H:%M')}
## Resumen Estadístico
- **Ecuación de Regresión**: y = {intercept:.4f} + {slope:.4f}x
- **Coeficiente de correlación (r)**: {r_value:.4f}
- **Coeficiente de determinación ($R^2$)**: {r_squared:.4f}
- **Valor p**: {p_value:.4e}
- **Error estándar de la pendiente**: {std_err:.4f}
- **Error cuadrático medio (RMSE)**: {rmse:.4f}
- **Coeficiente de variación (CV)**: {cv:.2f}%
## Evaluación de Calidad
- **Calidad de la calibración**: {evaluacion['calidad']}
## Recomendaciones
{chr(10).join(evaluacion['recomendaciones']) if evaluacion['recomendaciones'] else "No hay recomendaciones específicas. La calibración cumple con los criterios de calidad."}
## Decisión
{("✅ APROBADO - La calibración cumple con los criterios de calidad establecidos" if evaluacion['estado'] == "✅" else "⚠️ REQUIERE REVISIÓN - La calibración necesita ajustes según las recomendaciones anteriores")}
---
*Nota: Este informe fue generado automáticamente. Por favor, revise los resultados y valide según sus criterios específicos.*
"""
return informe, evaluacion['estado']
def actualizar_analisis(df):
if df is None or df.empty:
return "Error en los datos", None, "No se pueden generar análisis"
col_predicha = [col for col in df.columns if 'Predicha' in col][0]
col_real = [col for col in df.columns if 'Real' in col][0]
# Convertir columnas a numérico
df[col_predicha] = pd.to_numeric(df[col_predicha], errors='coerce')
df[col_real] = pd.to_numeric(df[col_real], errors='coerce')
df_valid = df.dropna(subset=[col_predicha, col_real])
if len(df_valid) < 2:
return "Se necesitan más datos", None, "Se requieren al menos dos valores reales para el análisis"
# Calcular la regresión y agregar 'Ajuste Lineal'
slope, intercept, r_value, p_value, std_err = stats.linregress(df_valid[col_predicha], df_valid[col_real])
df_valid['Ajuste Lineal'] = intercept + slope * df_valid[col_predicha]
fig = generar_graficos(df_valid)
informe, estado = generar_informe_completo(df_valid)
return estado, fig, informe
def exportar_informe_word(df_valid, informe_md):
# Crear documento Word
doc = docx.Document()
# Estilos APA 7
style = doc.styles['Normal']
font = style.font
font.name = 'Times New Roman'
font.size = Pt(12)
# Título centrado
titulo = doc.add_heading('Informe de Calibración', 0)
titulo.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# Fecha
fecha = doc.add_paragraph(f"Fecha: {datetime.now().strftime('%d/%m/%Y %H:%M')}")
fecha.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# Insertar gráfico
if os.path.exists('grafico.png'):
doc.add_picture('grafico.png', width=Inches(6))
ultimo_parrafo = doc.paragraphs[-1]
ultimo_parrafo.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# Leyenda del gráfico en estilo APA 7
leyenda = doc.add_paragraph('Figura 1. Gráfico de calibración.')
leyenda_format = leyenda.paragraph_format
leyenda_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
leyenda.style = doc.styles['Caption']
# Agregar contenido del informe
doc.add_heading('Resumen Estadístico', level=1)
for linea in informe_md.split('\n'):
if linea.startswith('##'):
doc.add_heading(linea.replace('##', '').strip(), level=2)
else:
doc.add_paragraph(linea)
# Añadir tabla de datos
doc.add_heading('Tabla de Datos de Calibración', level=1)
# Convertir DataFrame a lista de listas
tabla_datos = df_valid.reset_index(drop=True)
tabla_datos = tabla_datos.round(4) # Redondear a 4 decimales si es necesario
columnas = tabla_datos.columns.tolist()
registros = tabla_datos.values.tolist()
# Crear tabla en Word
tabla = doc.add_table(rows=1 + len(registros), cols=len(columnas))
tabla.style = 'Table Grid'
# Añadir los encabezados
hdr_cells = tabla.rows[0].cells
for idx, col_name in enumerate(columnas):
hdr_cells[idx].text = col_name
# Añadir los registros
for i, registro in enumerate(registros):
row_cells = tabla.rows[i + 1].cells
for j, valor in enumerate(registro):
row_cells[j].text = str(valor)
# Formatear fuente de la tabla
for row in tabla.rows:
for cell in row.cells:
for paragraph in cell.paragraphs:
paragraph.style = doc.styles['Normal']
# Guardar documento
filename = 'informe_calibracion.docx'
doc.save(filename)
return filename
def exportar_informe_latex(df_valid, informe_md):
# Generar código LaTeX
informe_tex = r"""\documentclass{article}
\usepackage[spanish]{babel}
\usepackage{amsmath}
\usepackage{graphicx}
\usepackage{booktabs}
\begin{document}
"""
informe_tex += informe_md.replace('#', '').replace('**', '\\textbf{').replace('*', '\\textit{')
informe_tex += r"""
\end{document}
"""
filename = 'informe_calibracion.tex'
with open(filename, 'w') as f:
f.write(informe_tex)
return filename
def exportar_word(df, informe_md):
df_valid = df.copy()
col_predicha = [col for col in df_valid.columns if 'Predicha' in col][0]
col_real = [col for col in df_valid.columns if 'Real' in col][0]
# Convertir columnas a numérico
df_valid[col_predicha] = pd.to_numeric(df_valid[col_predicha], errors='coerce')
df_valid[col_real] = pd.to_numeric(df_valid[col_real], errors='coerce')
df_valid = df_valid.dropna(subset=[col_predicha, col_real])
if df_valid.empty:
return None
filename = exportar_informe_word(df_valid, informe_md)
return filename # Retornamos el nombre del archivo
def exportar_latex(df, informe_md):
df_valid = df.copy()
col_predicha = [col for col in df_valid.columns if 'Predicha' in col][0]
col_real = [col for col in df_valid.columns if 'Real' in col][0]
# Convertir columnas a numérico
df_valid[col_predicha] = pd.to_numeric(df_valid[col_predicha], errors='coerce')
df_valid[col_real] = pd.to_numeric(df_valid[col_real], errors='coerce')
df_valid = df_valid.dropna(subset=[col_predicha, col_real])
if df_valid.empty:
return None
filename = exportar_informe_latex(df_valid, informe_md)
return filename # Retornamos el nombre del archivo
# Funciones de ejemplo
def cargar_ejemplo_ufc():
df = generar_tabla(7, 2000000, "UFC")
valores_reales = [2000000, 1600000, 1200000, 800000, 400000, 200000, 100000]
df[f"Concentración Real (UFC)"] = valores_reales
return 2000000, "UFC", 7, df
def cargar_ejemplo_od():
df = generar_tabla(7, 1.0, "OD")
valores_reales = [1.000, 0.800, 0.600, 0.400, 0.200, 0.100, 0.050]
df[f"Concentración Real (OD)"] = valores_reales
return 1.0, "OD", 7, df
def limpiar_datos():
df = generar_tabla(7, 2000000, "UFC")
return (
2000000, # Concentración Inicial
"UFC", # Unidad de Medida
7, # Número de filas
df, # Tabla Output
"", # Estado Output
None, # Gráficos Output
"" # Informe Output
)
def generar_datos_sinteticos_evento(df):
df = df.copy()
col_predicha = [col for col in df.columns if 'Predicha' in col][0]
df[col_predicha] = pd.to_numeric(df[col_predicha], errors='coerce')
desviacion_std = 0.05 * df[col_predicha].mean() # 5% de la media como desviación estándar
df = generar_datos_sinteticos(df, desviacion_std)
return df
def actualizar_tabla_evento(df, n_filas, concentracion, unidad):
# Actualizar tabla sin borrar "Concentración Real"
df_new = generar_tabla(n_filas, concentracion, unidad)
# Mapear columnas
col_predicha_new = [col for col in df_new.columns if 'Concentración Predicha' in col][0]
col_predicha_old = [col for col in df.columns if 'Concentración Predicha' in col][0]
col_real_new = [col for col in df_new.columns if 'Concentración Real' in col][0]
col_real_old = [col for col in df.columns if 'Concentración Real' in col][0]
# Reemplazar valores existentes en "Concentración Real"
df_new[col_real_new] = None
for idx in df_new.index:
if idx in df.index:
df_new.at[idx, col_real_new] = df.at[idx, col_real_old]
return df_new
# Interfaz Gradio
with gr.Blocks(theme=gr.themes.Soft()) as interfaz:
gr.Markdown("""
# 📊 Sistema Avanzado de Calibración con Análisis Estadístico
Configure los parámetros, edite los valores en la tabla y luego presione "Calcular" para obtener el análisis.
""")
with gr.Tab("📝 Datos de Calibración"):
with gr.Row():
concentracion_input = gr.Number(
value=2000000,
label="Concentración Inicial",
precision=0
)
unidad_input = gr.Textbox(
value="UFC",
label="Unidad de Medida",
placeholder="UFC, OD, etc..."
)
filas_slider = gr.Slider(
minimum=1,
maximum=20,
value=7,
step=1,
label="Número de filas"
)
decimales_slider = gr.Slider(
minimum=0,
maximum=5,
value=0,
step=1,
label="Número de Decimales"
)
with gr.Row():
calcular_btn = gr.Button("🔄 Calcular", variant="primary")
limpiar_btn = gr.Button("🗑 Limpiar Datos", variant="secondary")
ajustar_decimales_btn = gr.Button("🛠 Ajustar Decimales", variant="secondary")
with gr.Row():
ejemplo_ufc_btn = gr.Button("📋 Cargar Ejemplo UFC", variant="secondary")
ejemplo_od_btn = gr.Button("📋 Cargar Ejemplo OD", variant="secondary")
sinteticos_btn = gr.Button("🧪 Generar Datos Sintéticos", variant="secondary")
tabla_output = gr.DataFrame(
row_count=(1, "dynamic"),
col_count=(5, "fixed"),
wrap=True,
label="Tabla de Datos",
interactive=True,
datatype=["number", "number", "number", "number", "number"],
type="pandas",
precision=0 # Establecer precisión inicial
)
with gr.Tab("📊 Análisis y Reporte"):
estado_output = gr.Textbox(label="Estado", interactive=False)
graficos_output = gr.Plot(label="Gráficos de Análisis")
informe_output = gr.Markdown(elem_id="informe_output")
with gr.Row():
copiar_btn = gr.Button("📋 Copiar Informe", variant="secondary")
exportar_word_btn = gr.Button("💾 Exportar Informe Word", variant="primary")
exportar_latex_btn = gr.Button("💾 Exportar Informe LaTeX", variant="primary")
exportar_word_file = gr.File(label="Informe en Word")
exportar_latex_file = gr.File(label="Informe en LaTeX")
# Eventos
input_components = [tabla_output]
output_components = [estado_output, graficos_output, informe_output]
# Evento al presionar el botón Calcular
calcular_btn.click(
fn=actualizar_analisis,
inputs=tabla_output,
outputs=output_components
)
# Evento para limpiar datos
limpiar_btn.click(
fn=limpiar_datos,
inputs=[],
outputs=[concentracion_input, unidad_input, filas_slider, tabla_output, estado_output, graficos_output, informe_output]
)
# Eventos de los botones de ejemplo
ejemplo_ufc_btn.click(
fn=cargar_ejemplo_ufc,
outputs=[concentracion_input, unidad_input, filas_slider, tabla_output]
)
ejemplo_od_btn.click(
fn=cargar_ejemplo_od,
outputs=[concentracion_input, unidad_input, filas_slider, tabla_output]
)
# Evento para generar datos sintéticos
sinteticos_btn.click(
fn=generar_datos_sinteticos_evento,
inputs=tabla_output,
outputs=tabla_output
)
# Evento al presionar el botón Ajustar Decimales
ajustar_decimales_btn.click(
fn=ajustar_decimales_evento,
inputs=[tabla_output, decimales_slider],
outputs=tabla_output
)
# Actualizar tabla al cambiar los parámetros (sin borrar "Concentración Real")
concentracion_input.change(
fn=actualizar_tabla_evento,
inputs=[tabla_output, filas_slider, concentracion_input, unidad_input],
outputs=tabla_output
)
unidad_input.change(
fn=actualizar_tabla_evento,
inputs=[tabla_output, filas_slider, concentracion_input, unidad_input],
outputs=tabla_output
)
filas_slider.change(
fn=actualizar_tabla_evento,
inputs=[tabla_output, filas_slider, concentracion_input, unidad_input],
outputs=tabla_output
)
# No agregamos un evento para decimales_slider.change, para evitar borrar la columna "Concentración Real"
# Evento de copiar informe utilizando JavaScript
copiar_btn.click(
None,
[],
[],
js="""
function() {
const informeElement = document.querySelector('#informe_output');
const range = document.createRange();
range.selectNode(informeElement);
window.getSelection().removeAllRanges();
window.getSelection().addRange(range);
document.execCommand('copy');
window.getSelection().removeAllRanges();
alert('Informe copiado al portapapeles');
}
"""
)
# Eventos de exportar informes
exportar_word_btn.click(
fn=exportar_word,
inputs=[tabla_output, informe_output],
outputs=exportar_word_file
)
exportar_latex_btn.click(
fn=exportar_latex,
inputs=[tabla_output, informe_output],
outputs=exportar_latex_file
)
# Inicializar la interfaz con el ejemplo base
def iniciar_con_ejemplo():
df = generar_tabla(7, 2000000, "UFC")
valores_reales = [2000000, 1600000, 1200000, 800000, 400000, 200000, 100000]
df[f"Concentración Real (UFC)"] = valores_reales
estado, fig, informe = actualizar_analisis(df)
return (
2000000,
"UFC",
7,
df,
estado,
fig,
informe
)
interfaz.load(
fn=iniciar_con_ejemplo,
outputs=[concentracion_input, unidad_input, filas_slider, tabla_output, estado_output, graficos_output, informe_output]
)
# Lanzar la interfaz
if __name__ == "__main__":
interfaz.launch()