frugal-ai-submission-template

Sleeping

Tonic commited on Feb 10

Commit

0c9dbe5

unverified ·

1 Parent(s): 30f3a06

fix model loading error

Files changed (1) hide show

tasks/text.py CHANGED Viewed

@@ -7,7 +7,7 @@ import os
 from concurrent.futures import ThreadPoolExecutor
 from typing import List, Dict, Tuple
 import torch
-from transformers import AutoModelForSequenceClassification, AutoTokenizer, AutoConfig
 from huggingface_hub import login
 from dotenv import load_dotenv
@@ -38,15 +38,19 @@ class TextClassifier:
         for attempt in range(max_retries):
             try:
-                # Load config and modify it to remove bias parameter
                 self.config = AutoConfig.from_pretrained(model_name)
                 if hasattr(self.config, 'norm_bias'):
                     delattr(self.config, 'norm_bias')
                 # Initialize tokenizer
                 self.tokenizer = AutoTokenizer.from_pretrained(
                     model_name,
-                    model_max_length=2048
                 )
                 # Initialize model with modified config
@@ -75,10 +79,10 @@ class TextClassifier:
             # Tokenize
             inputs = self.tokenizer(
                 batch,
-                padding=True,
                 truncation=True,
-                max_length=2048,
-                return_tensors="pt"
             ).to(self.device)
             # Get predictions

 from concurrent.futures import ThreadPoolExecutor
 from typing import List, Dict, Tuple
 import torch
+from transformers import AutoTokenizer, AutoModelForSequenceClassification, AutoConfig
 from huggingface_hub import login
 from dotenv import load_dotenv
         for attempt in range(max_retries):
             try:
+                # Load config and modify it
                 self.config = AutoConfig.from_pretrained(model_name)
+                # Remove problematic bias parameters
                 if hasattr(self.config, 'norm_bias'):
                     delattr(self.config, 'norm_bias')
                 # Initialize tokenizer
                 self.tokenizer = AutoTokenizer.from_pretrained(
                     model_name,
+                    model_max_length=512,
+                    padding_side='right',
+                    truncation_side='right'
                 )
                 # Initialize model with modified config
             # Tokenize
             inputs = self.tokenizer(
                 batch,
+                return_tensors="pt",
                 truncation=True,
+                max_length=512,
+                padding='max_length'
             ).to(self.device)
             # Get predictions