Spaces:

ibm-research
/

SMI-TED-demo1

Running

App Files Files Community

Enzo Reis de Oliveira commited on 17 days ago

Commit

4d799f2

1 Parent(s): f63af71

CSV fixed

Browse files

Files changed (2) hide show

app.py +49 -35
requirements.txt +5 -6

app.py CHANGED Viewed

@@ -1,54 +1,68 @@
-import os, sys
-BASE_DIR = os.path.dirname(__file__)
-INFERENCE_DIR = os.path.join(BASE_DIR, "smi-ted", "inference")
-sys.path.append(INFERENCE_DIR)
 import gradio as gr
 from smi_ted_light.load import load_smi_ted
-# 2) Caminho onde estão pesos e vocabulário
 MODEL_DIR = os.path.join("smi-ted", "inference", "smi_ted_light")
-# 3) Carrega o modelo SMI‑TED (Light)
-#    Se você renomeou o .pt ou o vocab, ajuste aqui.
 model = load_smi_ted(
     folder=MODEL_DIR,
     ckpt_filename="smi-ted-Light_40.pt",
     vocab_filename="bert_vocab_curated.txt",
 )
-# 4) Função utilizada pela interface
-def gerar_embedding(smiles: str):
-    """
-    Recebe uma string SMILES e devolve o embedding (lista de 768 floats).
-    Em caso de erro, devolve um dicionário com a mensagem.
-    """
     smiles = smiles.strip()
     if not smiles:
-        return {"erro": "digite uma sequência SMILES primeiro"}
     try:
-        # model.encode devolve tensor shape (1, 768) quando return_torch=True
-        vetor_torch = model.encode(smiles, return_torch=True)[0]
-        return vetor_torch.tolist()  # JSON‑serializável
     except Exception as e:
-        return {"erro": str(e)}
-# 5) Define a interface Gradio
-demo = gr.Interface(
-    fn=gerar_embedding,
-    inputs=gr.Textbox(label="SMILES", placeholder="Ex.: CCO"),
-    outputs=gr.JSON(label="Embedding (lista de floats)"),
-    title="SMI‑TED Embedding Generator",
-    description=(
-        "Cole uma sequência SMILES e receba o embedding gerado pelo modelo "
-        "SMI‑TED Light treinado pela IBM Research."
-    ),
-)
-# 6) Roda localmente ou no Hugging Face Space
 if __name__ == "__main__":
     demo.launch()

+import os
+import sys
+import tempfile
+import pandas as pd
 import gradio as gr
 from smi_ted_light.load import load_smi_ted
+# 1) Ajuste de paths para encontrar o inference
+BASE_DIR = os.path.dirname(__file__)
+INFERENCE_DIR = os.path.join(BASE_DIR, "smi-ted", "inference")
+sys.path.append(INFERENCE_DIR)
+# 2) Carregando o modelo
 MODEL_DIR = os.path.join("smi-ted", "inference", "smi_ted_light")
 model = load_smi_ted(
     folder=MODEL_DIR,
     ckpt_filename="smi-ted-Light_40.pt",
     vocab_filename="bert_vocab_curated.txt",
 )
+# 3) Função única que gera embedding E CSV
+def gerar_embedding_e_csv(smiles: str):
     smiles = smiles.strip()
     if not smiles:
+        # Se não digitou nada, retorna erro e esconde o botão de download
+        return {"erro": "digite uma sequência SMILES primeiro"}, gr.update(visible=False)
     try:
+        # Gera o embedding
+        vetor = model.encode(smiles, return_torch=True)[0].tolist()
+        # Cria DataFrame e escreve CSV num arquivo temporário
+        df = pd.DataFrame([vetor])
+        tmp = tempfile.NamedTemporaryFile(suffix=".csv", delete=False)
+        df.to_csv(tmp.name, index=False)
+        tmp.close()
+        # Retorna: 1) JSON, 2) update para o File (path + visível)
+        return vetor, gr.update(value=tmp.name, visible=True)
     except Exception as e:
+        # Em caso de erro interno, mostra mensagem e esconde o botão
+        return {"erro": str(e)}, gr.update(visible=False)
+# 4) Montando a interface Blocks
+with gr.Blocks() as demo:
+    gr.Markdown(
+        """
+        ## SMI-TED Embedding Generator
+        Cole uma sequência SMILES e receba:
+        1. O vetor embedding (768 floats) em JSON
+        2. Um botão para baixar esse vetor em CSV
+        """
+    )
+    with gr.Row():
+        inp_smiles = gr.Textbox(label="SMILES", placeholder="Ex.: CCO")
+        btn = gr.Button("Gerar Embedding")
+    with gr.Row():
+        out_json = gr.JSON(label="Embedding (lista de floats)")
+        out_file = gr.File(label="Download do CSV", visible=False)
+    # 5) Ligando o botão à função única (dois outputs)
+    btn.click(
+        fn=gerar_embedding_e_csv,
+        inputs=inp_smiles,
+        outputs=[out_json, out_file]
+    )
 if __name__ == "__main__":
     demo.launch()

requirements.txt CHANGED Viewed

@@ -1,10 +1,9 @@
-torch>=2.1.0
 transformers>=4.40.0
-regex
-numpy==1.26.4
-pandas==1.4.0
 tqdm>=4.66.4
 rdkit>=2024.3.5
-gradio==4.32.0
-gradio_client==0.17.0
 huggingface-hub

+torch>=2.1.0
 transformers>=4.40.0
+regex
+numpy==1.26.4
+pandas==1.4.0
 tqdm>=4.66.4
 rdkit>=2024.3.5
+gradio>=4.32.0
 huggingface-hub