Spaces:

AlexTransformer
/

ernie-4.5-logprob-compare

Sleeping

App Files Files Community

AlexTransformer commited on 24 days ago

Commit

707db97

verified ·

1 Parent(s): 80bae41

Create app.py

Browse files

Files changed (1) hide show

app.py +105 -0

app.py ADDED Viewed

	@@ -0,0 +1,105 @@

+import torch
+import torch.nn.functional as F
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import gradio as gr
+import pandas as pd
+# Load model and tokenizer
+model_ids = {
+    "ERNIE-4.5-PT": "baidu/ERNIE-4.5-0.3B-PT",
+    "ERNIE-4.5-Base-PT": "baidu/ERNIE-4.5-0.3B-Base-PT"
+}
+tokenizers = {
+    name: AutoTokenizer.from_pretrained(path)
+    for name, path in model_ids.items()
+}
+models = {
+    name: AutoModelForCausalLM.from_pretrained(path).eval()
+    for name, path in model_ids.items()
+}
+# Main function: compute token-wise log probabilities and top-k predictions
+@torch.no_grad()
+def compare_models(text, top_k=5):
+    results = {}
+    for model_name in model_ids:
+        tokenizer = tokenizers[model_name]
+        model = models[model_name]
+        # Tokenize input
+        inputs = tokenizer(text, return_tensors="pt")
+        input_ids = inputs["input_ids"]
+        # Get model output logits
+        outputs = model(**inputs)
+        shift_logits = outputs.logits[:, :-1, :]          # Align prediction with target
+        shift_labels = input_ids[:, 1:]                   # Shift labels to match predictions
+        # Compute log probabilities
+        log_probs = F.log_softmax(shift_logits, dim=-1)
+        token_log_probs = log_probs.gather(2, shift_labels.unsqueeze(-1)).squeeze(-1)
+        total_log_prob = token_log_probs.sum().item()
+        tokens = tokenizer.convert_ids_to_tokens(input_ids[0])[1:]  # Skip BOS token
+        # Generate top-k predictions for each position (up to first 20 tokens)
+        topk_list = []
+        for i in range(min(20, shift_logits.shape[1])):
+            topk = torch.topk(log_probs[0, i], k=top_k)
+            topk_ids = topk.indices.tolist()
+            topk_scores = topk.values.tolist()
+            topk_tokens = tokenizer.convert_ids_to_tokens(topk_ids)
+            topk_probs = [round(float(torch.exp(s)), 4) for s in topk_scores]
+            pair_list = [f"{tok} ({prob})" for tok, prob in zip(topk_tokens, topk_probs)]
+            topk_list.append(", ".join(pair_list))
+        # Prepare dataframe for display
+        df = pd.DataFrame({
+            "Token": tokens[:20],
+            "LogProb": [round(float(x), 4) for x in token_log_probs[0][:20]],
+            f"Top-{top_k} Predictions": topk_list
+        })
+        results[model_name] = {
+            "df": df,
+            "total_log_prob": total_log_prob
+        }
+    # Merge two model results into one table
+    merged = pd.DataFrame({
+        "Token": results["ERNIE-4.5-PT"]["df"]["Token"],
+        "ERNIE-4.5-PT LogProb": results["ERNIE-4.5-PT"]["df"]["LogProb"],
+        "ERNIE-4.5-PT Top-k": results["ERNIE-4.5-PT"]["df"][f"Top-{top_k} Predictions"],
+        "ERNIE-4.5-Base-PT LogProb": results["ERNIE-4.5-Base-PT"]["df"]["LogProb"],
+        "ERNIE-4.5-Base-PT Top-k": results["ERNIE-4.5-Base-PT"]["df"][f"Top-{top_k} Predictions"],
+    })
+    # Summarize total log probability for each model
+    summary = (
+        f"🧠 Total Log Prob:\n"
+        f"- ERNIE-4.5-PT: {results['ERNIE-4.5-PT']['total_log_prob']:.2f}\n"
+        f"- ERNIE-4.5-Base-PT: {results['ERNIE-4.5-Base-PT']['total_log_prob']:.2f}"
+    )
+    return merged, summary
+# Gradio interface
+demo = gr.Interface(
+    fn=compare_models,
+    inputs=[
+        gr.Textbox(lines=2, placeholder="Type a sentence here...", label="Input Sentence"),
+        gr.Slider(minimum=1, maximum=10, value=5, step=1, label="Top-k Predictions")
+    ],
+    outputs=[
+        gr.Dataframe(label="Token LogProbs and Top-k Predictions"),
+        gr.Textbox(label="Sentence Total Log Probability", lines=3)
+    ],
+    title="🧪 ERNIE 4.5 Model Comparison with Top-k Predictions",
+    description="Compare ERNIE-4.5-0.3B Instruct and Base model by computing token logprobs and Top-k predictions"
+)
+if __name__ == "__main__":
+    demo.launch()