TurkishCodeMan
/

DeepSeek-R1-Turkish-Dialog-Dataset

Model card Files Files and versions

TurkishCodeMan commited on Feb 26

Commit

9cc7a65

·

verified ·

1 Parent(s): eb9de1e

Update README.md

Files changed (1) hide show

README.md +24 -20

README.md CHANGED Viewed

@@ -13,28 +13,32 @@ base_model:
 - deepseek-ai/DeepSeek-R1-Distill-Llama-8B
 ---
-# DeepSeek-R1-Turkish-Dialog-Dataset
-Türkçe doğal dil işleme (NLP) görevleri için hazırlanmış, çeşitli konu başlıklarını kapsayan diyalog veri seti. Bu veri seti, sohbet botları, dil modelleri ve diyalog sistemleri geliştirmek için kullanılabilir.
----
-## 📌 Öne Çıkan Özellikler
-- **Geniş Kapsam**: Günlük sohbetler, teknik tartışmalar, kültürel konular ve daha fazlası.
-- **Doğal Dil Çeşitliliği**: Türkçe'nin günlük kullanımına uygun informal ifadeler ve resmi dil yapıları.
-- **Yapılandırılmış Format**: JSON, CSV veya TXT formatlarında temizlenmiş ve etiketlenmiş veri.
-- **Ölçeklenebilirlik**: 50.000+ diyalog çifti (örnek sayısı projeye göre güncellenebilir).
----
-## 📂 Veri Seti Yapısı
-### Örnek JSON Formatı:
-```json
-{
-  "dialog_id": "DLG-001",
-  "context": ["Merhaba!", "Selam, nasılsın?"],
-  "response": "İyiyim, teşekkür ederim. Sen nasılsın?",
-  "topic": "günlük_sohbet",
-  "source": "sentetik_veri",
-  "lang": "tr"
-}

 - deepseek-ai/DeepSeek-R1-Distill-Llama-8B
 ---
+# 🔍 DeepSeek-R1-Turkish-Finetuned
+**Türkçe Sohbetler için İnce Ayar Yapılmış Dil Modeli**
+Bu model, [DeepSeek-R1](https://huggingface.co/deepseek-ai) temel alınarak [TFLai/Turkish-Dialog-Dataset](https://huggingface.co/datasets/TFLai/Turkish-Dialog-Dataset) ile ince ayar yapılmıştır. Türkçe diyalog üretme, sohbet botları ve metin tamamlama görevleri için optimize edilmiştir.
+![Banner](https://via.placeholder.com/1500x500.png?text=DeepSeek-R1-Turkish+Dialog+Model) <!-- Kendi banner resminizi ekleyin -->
+## 🚀 Özellikler
+- **Temel Model**: DeepSeek-R1 (6B parametre)
+- **Eğitim Verisi**: 50k+ Türkçe diyalog çifti
+- **Optimizasyon**: PyTorch + Hugging Face Transformers
+- **Desteklenen Görevler**: Metin üretme, sohbet simülasyonu
+## 📚 Kullanım
+### 🤗 Transformers ile Hızlı Başlangıç
+```python
+from transformers import AutoTokenizer, AutoModelForCausalLM
+model_name = "[your-username]/DeepSeek-R1-Turkish-Finetuned"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name)
+# Diyalog örneği
+input_text = "Merhaba! Nasılsın?"
+inputs = tokenizer.encode(input_text, return_tensors="pt")
+outputs = model.generate(inputs, max_length=100)
+print(tokenizer.decode(outputs[0]))