File size: 1,733 Bytes
7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 7d2e8eb 4019227 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 |
---
library_name: transformers
language:
- tr
base_model:
- dbmdz/bert-base-turkish-uncased
tags:
- text-classification
- sequence-classification
- transformers
- turkish
- intent-classification
datasets:
- custom
metrics:
- accuracy
- f1
- precision
- recall
---
# 🔍 Query Classifier: Turkish BERT Model
Bu model, Türkçe sorguları **"keyword"** ve **"semantic"** olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.
## 🧾 Kullanım Senaryosu
Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha geniş anlamsal bağlam içeren** bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.
## 🧠 Model Detayları
- **Model mimarisi:** BERT (`dbmdz/bert-base-turkish-uncased`)
- **Eğitim verisi:** Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
- **Etiketler:**
- `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: *Gece Gelen*, *Episode 9*)
- `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: *2020 yılı dram filmleri*, *Bilimkurgu filmleri*)
## 📈 Model Başarımı
Test kümesi üzerinde elde edilen sonuçlar:
```text
precision recall f1-score support
keyword 0.97 0.95 0.96 552
semantic 0.71 0.81 0.76 86
accuracy 0.93 638
macro avg 0.84 0.88 0.86 638
weighted avg 0.93 0.93 0.93 638
|