frugal-ai-submission-template

Sleeping

App Files Files Community

Tonic commited on Feb 10

Commit

322840a

verified ·

1 Parent(s): 85c5204

fix text classifier bias parameter thing

Browse files

Files changed (1) hide show

tasks/text.py +12 -5

tasks/text.py CHANGED Viewed

@@ -35,11 +35,11 @@ class TextClassifier:
     def __init__(self):
         self.device = "cuda" if torch.cuda.is_available() else "cpu"
         max_retries = 3
-        model_name = "Tonic/climate-guard-toxic-agent"
         for attempt in range(max_retries):
             try:
-                # Load config
                 self.config = AutoConfig.from_pretrained(
                     model_name,
                     num_labels=8,
@@ -47,6 +47,12 @@ class TextClassifier:
                     trust_remote_code=True
                 )
                 # Initialize tokenizer
                 self.tokenizer = AutoTokenizer.from_pretrained(
                     model_name,
@@ -56,12 +62,13 @@ class TextClassifier:
                     trust_remote_code=True
                 )
-                # Initialize model
                 self.model = AutoModelForSequenceClassification.from_pretrained(
                     model_name,
                     config=self.config,
                     trust_remote_code=True,
-                    torch_dtype=torch.float32
                 )
                 # Move model to appropriate device
@@ -81,7 +88,7 @@ class TextClassifier:
         try:
             print(f"Processing batch {batch_idx} with {len(batch)} items")
-            # Tokenize
             inputs = self.tokenizer(
                 batch,
                 return_tensors="pt",

     def __init__(self):
         self.device = "cuda" if torch.cuda.is_available() else "cpu"
         max_retries = 3
+        model_name = "answerdotai/ModernBERT-base"
         for attempt in range(max_retries):
             try:
+                # Load config with modified settings
                 self.config = AutoConfig.from_pretrained(
                     model_name,
                     num_labels=8,
                     trust_remote_code=True
                 )
+                # Remove problematic config attributes
+                if hasattr(self.config, 'norm_bias'):
+                    delattr(self.config, 'norm_bias')
+                if hasattr(self.config, 'bias'):
+                    delattr(self.config, 'bias')
                 # Initialize tokenizer
                 self.tokenizer = AutoTokenizer.from_pretrained(
                     model_name,
                     trust_remote_code=True
                 )
+                # Initialize model with modified config
                 self.model = AutoModelForSequenceClassification.from_pretrained(
                     model_name,
                     config=self.config,
                     trust_remote_code=True,
+                    torch_dtype=torch.float32,
+                    ignore_mismatched_sizes=True
                 )
                 # Move model to appropriate device
         try:
             print(f"Processing batch {batch_idx} with {len(batch)} items")
+            # Tokenize with padding and truncation
             inputs = self.tokenizer(
                 batch,
                 return_tensors="pt",