text-MatthiasPicard2

Sleeping

MatthiasPicard commited on Jan 31

Commit

2ae952d

verified ·

1 Parent(s): de418a0

Update tasks/text.py

Files changed (1) hide show

tasks/text.py CHANGED Viewed

@@ -66,7 +66,7 @@ async def evaluate_text(request: TextEvaluationRequest):
     # Make random predictions (placeholder for actual model inference)
     true_labels = test_dataset["label"]
     predictions = [random.randint(0, 7) for _ in range(len(true_labels))]
-    path_adapter = 'Rcarvalo/Qwen_finetuned'
     path_model = "Qwen/Qwen2.5-3B-Instruct"
     bnb_config = BitsAndBytesConfig(
@@ -93,15 +93,16 @@ async def evaluate_text(request: TextEvaluationRequest):
     def preprocess_function(df):
         return tokenizer(df["quote"], truncation=True)
     tokenized_test = test_dataset.map(preprocess_function, batched=True)
-    # training_args = torch.load("training_args.bin")
-    # training_args.eval_strategy='no'
     trainer = Trainer(
         model=model,
-        tokenizer=tokenizer
     )
     preds = trainer.predict(tokenized_test)

     # Make random predictions (placeholder for actual model inference)
     true_labels = test_dataset["label"]
     predictions = [random.randint(0, 7) for _ in range(len(true_labels))]
+    path_adapter = 'MatthiasPicard/Qwen_test'
     path_model = "Qwen/Qwen2.5-3B-Instruct"
     bnb_config = BitsAndBytesConfig(
     def preprocess_function(df):
         return tokenizer(df["quote"], truncation=True)
     tokenized_test = test_dataset.map(preprocess_function, batched=True)
+    data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
     trainer = Trainer(
         model=model,
+        tokenizer=tokenizer,
+        data_collator=data_collator,
     )
+    per_device_eval_batch_size=8
     preds = trainer.predict(tokenized_test)