Spaces:

atsnetwork
/

chatbot-tinyllama-inf-ust

Sleeping

App Files Files Community

atsnetwork commited on Jul 21

Commit

83d8c54

verified ·

1 Parent(s): 8ce67f6

logging prediksi jawaban ada/tidak

Browse files

mengubah app.py agar memprediksi indikasi jawaban tidak ada/tidak ditemukan

Files changed (1) hide show

app.py +118 -7

app.py CHANGED Viewed

@@ -1,14 +1,125 @@
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 import gradio as gr
-model = AutoModelForCausalLM.from_pretrained("atsnetwork/my-custom-tinyllama-chatbot")
-tokenizer = AutoTokenizer.from_pretrained("atsnetwork/my-custom-tinyllama-chatbot")
-def generate_response(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt")
-    outputs = model.generate(**inputs, max_new_tokens=100)
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)
-iface = gr.Interface(fn=generate_response, inputs="text", outputs="text")
 iface.launch()

 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 import gradio as gr
+import numpy as np # Import numpy jika belum ada
+# --- 1. Inisialisasi Model dan Tokenizer (Dilakukan Sekali Saat Aplikasi Dimulai) ---
+# Pastikan 'model_name' ini adalah model yang sudah kamu unggah ke Hugging Face Hub
+# atau model publik lain yang ingin kamu gunakan.
+model_name = "atsnetwork/my-custom-tinyllama-chatbot"
+model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+tokenizer.pad_token = tokenizer.eos_token # Pastikan token padding diatur
+tokenizer.padding_side = "right" # Penting untuk efisiensi saat memproses sequence
+# --- 2. Fungsi Pemroses Utama untuk Chatbot (Dipanggil Oleh Gradio) ---
+# Fungsi ini mengintegrasikan logika inferensi dan analisis developer info
+def generate_response_with_dev_info(prompt, max_new_tokens=100, temperature=0.7, top_k=50):
+    formatted_prompt = f"<s>[INST] {prompt} [/INST]"
+    inputs = tokenizer(formatted_prompt, return_tensors="pt").to(model.device)
+    # Generate dengan output_scores=True untuk analisis probabilitas
+    outputs = model.generate(
+        **inputs,
+        max_new_tokens=max_new_tokens,
+        do_sample=True,
+        temperature=temperature,
+        top_k=top_k,
+        eos_token_id=tokenizer.eos_token_id,
+        pad_token_id=tokenizer.pad_token_id,
+        return_dict_in_generate=True,
+        output_scores=True
+    )
+    generated_ids = outputs.sequences[0]
+    generated_text = tokenizer.decode(generated_ids, skip_special_tokens=True)
+    # Ekstrak jawaban bersih
+    answer = ""
+    start_answer = generated_text.find("[/INST]")
+    if start_answer != -1:
+        answer = generated_text[start_answer + len("[/INST]"):].strip()
+        if answer.endswith("</s>"):
+            answer = answer[:-len("</s>")].strip()
+    else:
+        answer = generated_text.strip() # Fallback jika format tidak ditemukan
+    # --- Analisis Konfidensi Berbasis Probabilitas Token ---
+    avg_max_prob = 0
+    total_generated_tokens = 0
+    if outputs.scores:
+        # Menghitung rata-rata probabilitas token tertinggi
+        for score_tensor in outputs.scores:
+            probabilities = torch.softmax(score_tensor, dim=-1)
+            max_prob = torch.max(probabilities).item()
+            avg_max_prob += max_prob
+            total_generated_tokens += 1
+        if total_generated_tokens > 0:
+            avg_max_prob /= total_generated_tokens
+    confidence_threshold = 0.5 # Ambang batas konfidensi rata-rata (bisa disesuaikan)
+    confidence_status = "HIGH_CONFIDENCE"
+    if avg_max_prob < confidence_threshold:
+        confidence_status = "LOW_CONFIDENCE"
+    # --- Analisis Frasa "Tidak Tahu" yang Dilatih ---
+    is_explicitly_unknown = False
+    explicit_unknown_reason = ""
+    unknown_phrases = [
+        "maaf, saya tidak memiliki informasi",
+        "saya tidak familiar dengan",
+        "di luar cakupan data pelatihan saya",
+        "saya tidak tahu",
+        "tidak dapat menemukan informasi"
+    ]
+    answer_lower = answer.lower()
+    for phrase in unknown_phrases:
+        if phrase in answer_lower:
+            is_explicitly_unknown = True
+            explicit_unknown_reason = f"Model menggunakan frasa 'tidak tahu': '{phrase}'"
+            break # Hentikan setelah menemukan frasa pertama
+    # --- Gabungkan Informasi untuk Developer ---
+    developer_info = {
+        "confidence_score": f"{avg_max_prob:.4f}",
+        "confidence_status": confidence_status,
+        "explicit_unknown_phrase_detected": is_explicitly_unknown,
+        "explicit_unknown_reason": explicit_unknown_reason if is_explicitly_unknown else "Tidak ada frasa 'tidak tahu' eksplisit.",
+        # "raw_generated_text": generated_text # Bisa diaktifkan untuk debug, tapi akan terlihat di UI
+    }
+    # Untuk tampilan user, hanya tampilkan jawabannya.
+    # Informasi developer bisa ditampilkan di antarmuka terpisah atau log.
+    return answer, developer_info
+# --- 3. Fungsi Adaptor untuk Gradio Interface (Mengonversi Dictionary info menjadi String) ---
+# Gradio Interface mengharapkan output string/angka, bukan dictionary.
+# Fungsi ini akan mengubah dictionary developer_info menjadi string yang mudah dibaca.
+def gradio_interface_fn(prompt):
+    answer, dev_info = generate_response_with_dev_info(prompt)
+    # Format developer info untuk ditampilkan di Gradio
+    dev_info_str = "--- Developer Info ---\n"
+    dev_info_str += f"Confidence Score: {dev_info['confidence_score']} ({dev_info['confidence_status']})\n"
+    dev_info_str += f"Explicit Unknown Phrase Detected: {dev_info['explicit_unknown_phrase_detected']}\n"
+    dev_info_str += f"Reason: {dev_info['explicit_unknown_reason']}\n"
+    # dev_info_str += f"Raw Generated Text: {dev_info['raw_generated_text']}\n"
+    return answer, dev_info_str
+# --- 4. Inisialisasi Antarmuka Gradio ---
+# Ini yang akan membangun UI di Hugging Face Space.
+iface = gr.Interface(
+    fn=gradio_interface_fn, # Fungsi yang akan dipanggil saat ada input
+    inputs=gr.Textbox(lines=2, label="Your Question"), # Input berupa kotak teks untuk pertanyaan
+    outputs=[
+        gr.Textbox(label="Chatbot Response", lines=5), # Output pertama untuk jawaban chatbot
+        gr.Textbox(label="Developer Information", lines=5) # Output kedua untuk informasi developer
+    ],
+    title="TinyLlama Custom Chatbot with Developer Insights 🚀",
+    description="Ask anything and get a response from the chatbot. Additional information for developers will be displayed below."
+)
+# --- 5. Jalankan Aplikasi Gradio ---
 iface.launch()