Update README.md
Browse files
README.md
CHANGED
@@ -24,11 +24,13 @@ metrics:
|
|
24 |
|
25 |
Bu model, Türkçe sorguları **"keyword"** ve **"semantic"** olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.
|
26 |
|
27 |
-
|
|
|
28 |
|
29 |
Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha geniş anlamsal bağlam içeren** bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.
|
30 |
|
31 |
-
|
|
|
32 |
|
33 |
- **Model mimarisi:** BERT (`dbmdz/bert-base-turkish-uncased`)
|
34 |
- **Eğitim verisi:** Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
|
@@ -36,9 +38,15 @@ Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha ge
|
|
36 |
- `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: *Gece Gelen*, *Ozan Kılıç*)
|
37 |
- `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: *2020 yılı dram filmleri*, *Bilim kurgu filmleri*)
|
38 |
|
39 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
40 |
|
41 |
-
Test kümesi üzerinde elde edilen sonuçlar:
|
42 |
|
43 |
```text
|
44 |
precision recall f1-score support
|
@@ -50,7 +58,7 @@ Test kümesi üzerinde elde edilen sonuçlar:
|
|
50 |
macro avg 0.84 0.88 0.86 638
|
51 |
weighted avg 0.93 0.93 0.93 638
|
52 |
```
|
53 |
-
## 🚀 Kullanım Örneği
|
54 |
|
55 |
```python
|
56 |
from transformers import AutoTokenizer, AutoModelForSequenceClassification
|
@@ -67,7 +75,7 @@ pred = torch.argmax(outputs.logits, dim=1).item()
|
|
67 |
labels = ["keyword", "semantic"]
|
68 |
print(f"Tahmin edilen sınıf: {labels[pred]}")
|
69 |
```
|
70 |
-
## Lisans
|
71 |
Bu model, araştırma ve eğitim amaçlı olarak paylaşılmıştır. Ticari kullanımlar için model sahibi ile iletişime geçiniz.
|
72 |
|
73 |
This model is shared for research and educational purposes. For commercial use, please contact the model owner.
|
|
|
24 |
|
25 |
Bu model, Türkçe sorguları **"keyword"** ve **"semantic"** olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.
|
26 |
|
27 |
+
This model is a `BERT` based sequence classification model trained to classify Turkish queries into two classes, **“keyword ”** and **“semantic ”**. The model can be used to determine the intent of short texts or search queries.
|
28 |
+
## 🧾 Kullanım Senaryosu ( Usage Scenario)
|
29 |
|
30 |
Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha geniş anlamsal bağlam içeren** bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.
|
31 |
|
32 |
+
It is used to determine whether a query from a user is **keyword-based** or contains a **broader semantic context**. In this way, queries can be directed to different processing strategies.
|
33 |
+
## 🧠 Model Detayları (Model Details)
|
34 |
|
35 |
- **Model mimarisi:** BERT (`dbmdz/bert-base-turkish-uncased`)
|
36 |
- **Eğitim verisi:** Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
|
|
|
38 |
- `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: *Gece Gelen*, *Ozan Kılıç*)
|
39 |
- `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: *2020 yılı dram filmleri*, *Bilim kurgu filmleri*)
|
40 |
|
41 |
+
- **Model architecture:** BERT (`dbmdz/bert-base-turkish-uncased`)
|
42 |
+
- **Training data:** Specially labeled 2-class query dataset
|
43 |
+
- **Tags:**
|
44 |
+
- `keyword`: Mostly titles or short key phrases (e.g. *Gece Gelen*, *Ozan Kılıç*)
|
45 |
+
- `semantic`: More descriptive or meaningful phrases (for example: *2020 drama movies*, *science fiction movies*)
|
46 |
+
|
47 |
+
## 📈 Model Başarımı (Model Success)
|
48 |
|
49 |
+
Test kümesi üzerinde elde edilen sonuçlar (Results obtained on the test set):
|
50 |
|
51 |
```text
|
52 |
precision recall f1-score support
|
|
|
58 |
macro avg 0.84 0.88 0.86 638
|
59 |
weighted avg 0.93 0.93 0.93 638
|
60 |
```
|
61 |
+
## 🚀 Kullanım Örneği (Usage)
|
62 |
|
63 |
```python
|
64 |
from transformers import AutoTokenizer, AutoModelForSequenceClassification
|
|
|
75 |
labels = ["keyword", "semantic"]
|
76 |
print(f"Tahmin edilen sınıf: {labels[pred]}")
|
77 |
```
|
78 |
+
## Lisans (License)
|
79 |
Bu model, araştırma ve eğitim amaçlı olarak paylaşılmıştır. Ticari kullanımlar için model sahibi ile iletişime geçiniz.
|
80 |
|
81 |
This model is shared for research and educational purposes. For commercial use, please contact the model owner.
|