melique commited on
Commit
7c86b0a
·
verified ·
1 Parent(s): 189380e

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +14 -6
README.md CHANGED
@@ -24,11 +24,13 @@ metrics:
24
 
25
  Bu model, Türkçe sorguları **"keyword"** ve **"semantic"** olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.
26
 
27
- ## 🧾 Kullanım Senaryosu
 
28
 
29
  Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha geniş anlamsal bağlam içeren** bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.
30
 
31
- ## 🧠 Model Detayları
 
32
 
33
  - **Model mimarisi:** BERT (`dbmdz/bert-base-turkish-uncased`)
34
  - **Eğitim verisi:** Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
@@ -36,9 +38,15 @@ Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha ge
36
  - `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: *Gece Gelen*, *Ozan Kılıç*)
37
  - `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: *2020 yılı dram filmleri*, *Bilim kurgu filmleri*)
38
 
39
- ## 📈 Model Başarımı
 
 
 
 
 
 
40
 
41
- Test kümesi üzerinde elde edilen sonuçlar:
42
 
43
  ```text
44
  precision recall f1-score support
@@ -50,7 +58,7 @@ Test kümesi üzerinde elde edilen sonuçlar:
50
  macro avg 0.84 0.88 0.86 638
51
  weighted avg 0.93 0.93 0.93 638
52
  ```
53
- ## 🚀 Kullanım Örneği
54
 
55
  ```python
56
  from transformers import AutoTokenizer, AutoModelForSequenceClassification
@@ -67,7 +75,7 @@ pred = torch.argmax(outputs.logits, dim=1).item()
67
  labels = ["keyword", "semantic"]
68
  print(f"Tahmin edilen sınıf: {labels[pred]}")
69
  ```
70
- ## Lisans
71
  Bu model, araştırma ve eğitim amaçlı olarak paylaşılmıştır. Ticari kullanımlar için model sahibi ile iletişime geçiniz.
72
 
73
  This model is shared for research and educational purposes. For commercial use, please contact the model owner.
 
24
 
25
  Bu model, Türkçe sorguları **"keyword"** ve **"semantic"** olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.
26
 
27
+ This model is a `BERT` based sequence classification model trained to classify Turkish queries into two classes, **“keyword ”** and **“semantic ”**. The model can be used to determine the intent of short texts or search queries.
28
+ ## 🧾 Kullanım Senaryosu ( Usage Scenario)
29
 
30
  Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha geniş anlamsal bağlam içeren** bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.
31
 
32
+ It is used to determine whether a query from a user is **keyword-based** or contains a **broader semantic context**. In this way, queries can be directed to different processing strategies.
33
+ ## 🧠 Model Detayları (Model Details)
34
 
35
  - **Model mimarisi:** BERT (`dbmdz/bert-base-turkish-uncased`)
36
  - **Eğitim verisi:** Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
 
38
  - `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: *Gece Gelen*, *Ozan Kılıç*)
39
  - `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: *2020 yılı dram filmleri*, *Bilim kurgu filmleri*)
40
 
41
+ - **Model architecture:** BERT (`dbmdz/bert-base-turkish-uncased`)
42
+ - **Training data:** Specially labeled 2-class query dataset
43
+ - **Tags:**
44
+ - `keyword`: Mostly titles or short key phrases (e.g. *Gece Gelen*, *Ozan Kılıç*)
45
+ - `semantic`: More descriptive or meaningful phrases (for example: *2020 drama movies*, *science fiction movies*)
46
+
47
+ ## 📈 Model Başarımı (Model Success)
48
 
49
+ Test kümesi üzerinde elde edilen sonuçlar (Results obtained on the test set):
50
 
51
  ```text
52
  precision recall f1-score support
 
58
  macro avg 0.84 0.88 0.86 638
59
  weighted avg 0.93 0.93 0.93 638
60
  ```
61
+ ## 🚀 Kullanım Örneği (Usage)
62
 
63
  ```python
64
  from transformers import AutoTokenizer, AutoModelForSequenceClassification
 
75
  labels = ["keyword", "semantic"]
76
  print(f"Tahmin edilen sınıf: {labels[pred]}")
77
  ```
78
+ ## Lisans (License)
79
  Bu model, araştırma ve eğitim amaçlı olarak paylaşılmıştır. Ticari kullanımlar için model sahibi ile iletişime geçiniz.
80
 
81
  This model is shared for research and educational purposes. For commercial use, please contact the model owner.