Spaces:

hackergeek
/

Tuning

Running

App Files Files Community

hackergeek commited on Mar 17

Commit

3f9d883

verified ·

1 Parent(s): b6d5f19

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -27

app.py CHANGED Viewed

@@ -4,17 +4,17 @@ from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments,
 from peft import get_peft_model, LoraConfig, TaskType
 from datasets import load_dataset
-# ✅ Check if a GPU is available, otherwise use CPU
 device = "cuda" if torch.cuda.is_available() else "cpu"
-# ✅ Function to start training
 def train_model(dataset_url, model_url, epochs):
     try:
-        # Load tokenizer and model
         tokenizer = AutoTokenizer.from_pretrained(model_url)
         model = AutoModelForCausalLM.from_pretrained(model_url).to(device)
-        # ✅ Apply LoRA (Reduces trainable parameters)
         lora_config = LoraConfig(
             task_type=TaskType.CAUSAL_LM,
             r=8,
@@ -26,30 +26,30 @@ def train_model(dataset_url, model_url, epochs):
         model = get_peft_model(model, lora_config)
         model.to(device)
-        # ✅ Load dataset
         dataset = load_dataset(dataset_url)
-        # ✅ Tokenization function
         def tokenize_function(examples):
             return tokenizer(examples["text"], truncation=True, padding="max_length", max_length=256)
         tokenized_datasets = dataset.map(tokenize_function, batched=True)
         train_dataset = tokenized_datasets["train"]
-        # ✅ Training Arguments (Optimized for CPU)
         training_args = TrainingArguments(
             output_dir="./deepseek_lora_cpu",
             evaluation_strategy="epoch",
             learning_rate=5e-4,
-            per_device_train_batch_size=1,  # Keeps memory low
             per_device_eval_batch_size=1,
             num_train_epochs=int(epochs),
             save_strategy="epoch",
             save_total_limit=2,
             logging_dir="./logs",
             logging_steps=10,
-            fp16=False,  # Disable FP16 for CPU
-            gradient_checkpointing=True,  # Saves memory
             optim="adamw_torch",
             report_to="none"
         )
@@ -60,30 +60,34 @@ def train_model(dataset_url, model_url, epochs):
             train_dataset=train_dataset
         )
-        # ✅ Start Training
         trainer.train()
-        # ✅ Save the Fine-Tuned Model
-        model.save_pretrained("./deepseek_lora_finetuned")
         tokenizer.save_pretrained("./deepseek_lora_finetuned")
-        return "✅ Training Completed! Model saved successfully."
     except Exception as e:
-        return f"❌ Error: {str(e)}"
-# ✅ Gradio UI
 with gr.Blocks() as app:
-    gr.Markdown("# 🚀 AutoTrain DeepSeek R1 (CPU)")
-    dataset_url = gr.Textbox(label="Dataset URL (Hugging Face)", placeholder="e.g. samsum")
-    model_url = gr.Textbox(label="Model URL (Hugging Face)", placeholder="e.g. deepseek-ai/deepseek-r1")
-    epochs = gr.Slider(minimum=1, maximum=10, step=1, value=3, label="Number of Training Epochs")
-    train_button = gr.Button("Start Training")
-    output_text = gr.Textbox(label="Training Output")
-    train_button.click(train_model, inputs=[dataset_url, model_url, epochs], outputs=output_text)
-# ✅ Launch the app
-app.launch(server_name="0.0.0.0", server_port=7860)

 from peft import get_peft_model, LoraConfig, TaskType
 from datasets import load_dataset
+# ✅ بررسی سخت‌افزار (CPU/GPU)
 device = "cuda" if torch.cuda.is_available() else "cpu"
+# ✅ تابع اجرای ترینینگ (قفل شده تا پایان)
 def train_model(dataset_url, model_url, epochs):
     try:
+        # 🚀 بارگیری مدل و توکنایزر
         tokenizer = AutoTokenizer.from_pretrained(model_url)
         model = AutoModelForCausalLM.from_pretrained(model_url).to(device)
+        # ✅ تنظیم LoRA برای کاهش مصرف حافظه
         lora_config = LoraConfig(
             task_type=TaskType.CAUSAL_LM,
             r=8,
         model = get_peft_model(model, lora_config)
         model.to(device)
+        # ✅ بارگیری دیتاست
         dataset = load_dataset(dataset_url)
+        # ✅ توکنایز کردن داده‌ها
         def tokenize_function(examples):
             return tokenizer(examples["text"], truncation=True, padding="max_length", max_length=256)
         tokenized_datasets = dataset.map(tokenize_function, batched=True)
         train_dataset = tokenized_datasets["train"]
+        # ✅ تنظیمات ترینینگ
         training_args = TrainingArguments(
             output_dir="./deepseek_lora_cpu",
             evaluation_strategy="epoch",
             learning_rate=5e-4,
+            per_device_train_batch_size=1,  # کاهش مصرف RAM
             per_device_eval_batch_size=1,
             num_train_epochs=int(epochs),
             save_strategy="epoch",
             save_total_limit=2,
             logging_dir="./logs",
             logging_steps=10,
+            fp16=False,  # عدم استفاده از FP16 روی CPU
+            gradient_checkpointing=True,  # ذخیره حافظه
             optim="adamw_torch",
             report_to="none"
         )
             train_dataset=train_dataset
         )
+        # 🚀 شروع ترینینگ (قفل شده تا پایان)
         trainer.train()
+        trainer.save_model("./deepseek_lora_finetuned")  # ذخیره نهایی مدل
         tokenizer.save_pretrained("./deepseek_lora_finetuned")
+        return "✅ ترینینگ کامل شد! مدل ذخیره شد."
     except Exception as e:
+        return f"❌ خطا: {str(e)}"
+# ✅ Gradio UI با دکمه‌ی غیرفعال‌شونده
 with gr.Blocks() as app:
+    gr.Markdown("# 🚀 AutoTrain DeepSeek R1 (CPU) - (بدون توقف تا پایان)")
+    dataset_url = gr.Textbox(label="Dataset URL (Hugging Face)", placeholder="مثال: samsum")
+    model_url = gr.Textbox(label="Model URL (Hugging Face)", placeholder="مثال: deepseek-ai/deepseek-r1")
+    epochs = gr.Slider(minimum=1, maximum=10, step=1, value=3, label="تعداد Epochs")
+    train_button = gr.Button("شروع ترینینگ", interactive=True)
+    output_text = gr.Textbox(label="وضعیت ترینینگ")
+    # 🚀 بعد از کلیک دکمه را غیرفعال کنیم تا کار متوقف نشود
+    def disable_button(*args):
+        train_button.interactive = False  # غیرفعال کردن دکمه
+        return train_model(*args)
+    train_button.click(disable_button, inputs=[dataset_url, model_url, epochs], outputs=output_text)
+# ✅ اجرای Gradio در حالت قفل شده
+app.queue()  # این خط تضمین می‌کند که پردازش متوقف نشو��
+app.launch(server_name="0.0.0.0", server_port=7860, share=True, blocking=True)