Spaces:

cheberle
/

testtrain

Sleeping

testtrain / app.py

4d35d17 6 months ago

2.26 kB

	import gradio as gr
	from datasets import Dataset
	from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, Trainer
	import pandas as pd
	from huggingface_hub import login
	import torch

	def train_model(file, hf_token):
	try:
	# Login to Hugging Face
	if not hf_token:
	return "Please provide a Hugging Face token"
	login(hf_token)

	# Load and prepare data
	df = pd.read_csv(file.name)
	dataset = Dataset.from_pandas(df)

	# Model setup - force CPU
	model_name = "facebook/opt-125m"
	device_map = "cpu" # Force CPU usage
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForCausalLM.from_pretrained(
	model_name,
	device_map=device_map,
	torch_dtype=torch.float32 # Use float32 for CPU
	)

	# Training configuration
	training_args = TrainingArguments(
	output_dir="./results",
	num_train_epochs=3,
	per_device_train_batch_size=1, # Reduced for CPU
	learning_rate=3e-5,
	save_strategy="epoch",
	push_to_hub=True,
	hub_token=hf_token,
	no_cuda=True, # Force CPU usage
	report_to="none" # Disable wandb logging
	)

	# Initialize trainer
	trainer = Trainer(
	model=model,
	args=training_args,
	train_dataset=dataset,
	tokenizer=tokenizer
	)

	# Run training
	trainer.train()

	# Push to hub
	model.push_to_hub(f"cheberle/product-classifier-{pd.Timestamp.now().strftime('%Y%m%d')}")

	return "Training completed successfully!"

	except Exception as e:
	return f"Error occurred: {str(e)}"

	# Create Gradio interface
	demo = gr.Interface(
	fn=train_model,
	inputs=[
	gr.File(label="Upload your CSV file"),
	gr.Textbox(label="Hugging Face Token", type="password")
	],
	outputs="text",
	title="Product Classifier Training",
	description="Upload your CSV data to train a product classifier model on CPU."
	)

	if __name__ == "__main__":
	demo.launch(share=False)