TurkishCodeMan commited on
Commit
9cc7a65
·
verified ·
1 Parent(s): eb9de1e

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +24 -20
README.md CHANGED
@@ -13,28 +13,32 @@ base_model:
13
  - deepseek-ai/DeepSeek-R1-Distill-Llama-8B
14
  ---
15
 
16
- # DeepSeek-R1-Turkish-Dialog-Dataset
17
 
18
- Türkçe doğal dil işleme (NLP) görevleri için hazırlanmış, çeşitli konu başlıklarını kapsayan diyalog veri seti. Bu veri seti, sohbet botları, dil modelleri ve diyalog sistemleri geliştirmek için kullanılabilir.
19
 
20
- ---
21
 
22
- ## 📌 Öne Çıkan Özellikler
23
- - **Geniş Kapsam**: Günlük sohbetler, teknik tartışmalar, kültürel konular ve daha fazlası.
24
- - **Doğal Dil Çeşitliliği**: Türkçe'nin günlük kullanımına uygun informal ifadeler ve resmi dil yapıları.
25
- - **Yapılandırılmış Format**: JSON, CSV veya TXT formatlarında temizlenmiş ve etiketlenmiş veri.
26
- - **Ölçeklenebilirlik**: 50.000+ diyalog çifti (örnek sayısı projeye göre güncellenebilir).
27
 
28
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
29
 
30
- ## 📂 Veri Seti Yapısı
31
- ### Örnek JSON Formatı:
32
- ```json
33
- {
34
- "dialog_id": "DLG-001",
35
- "context": ["Merhaba!", "Selam, nasılsın?"],
36
- "response": "İyiyim, teşekkür ederim. Sen nasılsın?",
37
- "topic": "günlük_sohbet",
38
- "source": "sentetik_veri",
39
- "lang": "tr"
40
- }
 
13
  - deepseek-ai/DeepSeek-R1-Distill-Llama-8B
14
  ---
15
 
16
+ # 🔍 DeepSeek-R1-Turkish-Finetuned
17
 
18
+ **Türkçe Sohbetler için İnce Ayar Yapılmış Dil Modeli**
19
 
20
+ Bu model, [DeepSeek-R1](https://huggingface.co/deepseek-ai) temel alınarak [TFLai/Turkish-Dialog-Dataset](https://huggingface.co/datasets/TFLai/Turkish-Dialog-Dataset) ile ince ayar yapılmıştır. Türkçe diyalog üretme, sohbet botları ve metin tamamlama görevleri için optimize edilmiştir.
21
 
22
+ ![Banner](https://via.placeholder.com/1500x500.png?text=DeepSeek-R1-Turkish+Dialog+Model) <!-- Kendi banner resminizi ekleyin -->
 
 
 
 
23
 
24
+ ## 🚀 Özellikler
25
+ - **Temel Model**: DeepSeek-R1 (6B parametre)
26
+ - **Eğitim Verisi**: 50k+ Türkçe diyalog çifti
27
+ - **Optimizasyon**: PyTorch + Hugging Face Transformers
28
+ - **Desteklenen Görevler**: Metin üretme, sohbet simülasyonu
29
+
30
+ ## 📚 Kullanım
31
+
32
+ ### 🤗 Transformers ile Hızlı Başlangıç
33
+ ```python
34
+ from transformers import AutoTokenizer, AutoModelForCausalLM
35
+
36
+ model_name = "[your-username]/DeepSeek-R1-Turkish-Finetuned"
37
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
38
+ model = AutoModelForCausalLM.from_pretrained(model_name)
39
 
40
+ # Diyalog örneği
41
+ input_text = "Merhaba! Nasılsın?"
42
+ inputs = tokenizer.encode(input_text, return_tensors="pt")
43
+ outputs = model.generate(inputs, max_length=100)
44
+ print(tokenizer.decode(outputs[0]))