TurkishCodeMan commited on
Commit
8ad19e9
·
verified ·
1 Parent(s): 40741e7

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +33 -7
README.md CHANGED
@@ -1,7 +1,33 @@
1
- ---
2
- license: apache-2.0
3
- tags:
4
- - unsloth
5
- - trl
6
- - sft
7
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ tags:
4
+ - unsloth
5
+ - trl
6
+ - sft
7
+ ---
8
+
9
+ # DeepSeek-R1-Turkish-Dialog-Dataset
10
+
11
+ Türkçe doğal dil işleme (NLP) görevleri için hazırlanmış, çeşitli konu başlıklarını kapsayan diyalog veri seti. Bu veri seti, sohbet botları, dil modelleri ve diyalog sistemleri geliştirmek için kullanılabilir.
12
+
13
+ ---
14
+
15
+ ## 📌 Öne Çıkan Özellikler
16
+ - **Geniş Kapsam**: Günlük sohbetler, teknik tartışmalar, kültürel konular ve daha fazlası.
17
+ - **Doğal Dil Çeşitliliği**: Türkçe'nin günlük kullanımına uygun informal ifadeler ve resmi dil yapıları.
18
+ - **Yapılandırılmış Format**: JSON, CSV veya TXT formatlarında temizlenmiş ve etiketlenmiş veri.
19
+ - **Ölçeklenebilirlik**: 50.000+ diyalog çifti (örnek sayısı projeye göre güncellenebilir).
20
+
21
+ ---
22
+
23
+ ## 📂 Veri Seti Yapısı
24
+ ### Örnek JSON Formatı:
25
+ ```json
26
+ {
27
+ "dialog_id": "DLG-001",
28
+ "context": ["Merhaba!", "Selam, nasılsın?"],
29
+ "response": "İyiyim, teşekkür ederim. Sen nasılsın?",
30
+ "topic": "günlük_sohbet",
31
+ "source": "sentetik_veri",
32
+ "lang": "tr"
33
+ }