Spaces:

Baleegh
/

Fluency_Score

Sleeping

App Files Files Community

Abdulmohsena commited on Mar 3

Commit

3514916

verified ·

1 Parent(s): 998e3e0

Update Fluency_Score.py

Browse files

Files changed (1) hide show

Fluency_Score.py +23 -22

Fluency_Score.py CHANGED Viewed

@@ -3,12 +3,13 @@ import datasets
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
-class FluencyScore(evaluate.Metric):
     def _info(self):
         return evaluate.MetricInfo(
-            description="Computes the fluency score of a given text using a pre-trained model.",
             citation="",
-            inputs_description="A list of text strings to evaluate for fluency.",
             features=datasets.Features(
                 {
                     "texts": datasets.Value("string", id="sequence"),
@@ -16,31 +17,31 @@ class FluencyScore(evaluate.Metric):
             ),
             reference_urls=[],
         )
-    def __init__(self, device=None):
-        super().__init__()
         if device is None:
             device = "cuda" if torch.cuda.is_available() else "cpu"
-        self.device = device
-        # Load the tokenizer and model
         self.tokenizer = AutoTokenizer.from_pretrained("Baleegh/Fluency_Score")
         self.model = AutoModelForSequenceClassification.from_pretrained("Baleegh/Fluency_Score")
-        self.model.to(self.device)
-    def _compute(self, texts):
-        # Tokenize the input texts
         inputs = self.tokenizer(
-            texts,
-            return_tensors="pt",
-            truncation=True,
-            padding='max_length',
             max_length=128
-        ).to(self.device)
-        # Get model predictions
-        with torch.no_grad():
             output = self.model(**inputs)
-            predictions = output.logits.clip(0, 1).squeeze().tolist()  # Convert to list
-        return {"fluency_scores": predictions}

 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
+class Fluency_Score(evaluate.Metric):
     def _info(self):
         return evaluate.MetricInfo(
+            description="",
             citation="",
+            inputs_description="",
             features=datasets.Features(
                 {
                     "texts": datasets.Value("string", id="sequence"),
             ),
             reference_urls=[],
         )
+    def _download_and_prepare(self, dl_manager, device=None):
         if device is None:
             device = "cuda" if torch.cuda.is_available() else "cpu"
+        # Load the tokenizer and model from the specified repository
         self.tokenizer = AutoTokenizer.from_pretrained("Baleegh/Fluency_Score")
         self.model = AutoModelForSequenceClassification.from_pretrained("Baleegh/Fluency_Score")
+        self.model.to(device)
+        self.device = device
+    def _compute(self, texts, temperature=2):
+        device = self.device
         inputs = self.tokenizer(
+            texts,
+            return_tensors="pt",
+            truncation=True,
+            padding='max_length',
             max_length=128
+        ).to(device)
+        with torch.inference_mode():
             output = self.model(**inputs)
+            prediction = output.logits.clip(0, 1)
+        return {"classical_score": prediction}|