Spaces:

AIML-TUDA
/

VerifiableRewardsForScalableLogicalReasoning

Running

LukasHug commited on 10 days ago

Commit

bf1b494

1 Parent(s): 78670b1

rule validation post extraction

Files changed (1) hide show

VerifiableRewardsForScalableLogicalReasoning.py CHANGED Viewed

@@ -118,14 +118,7 @@ def _evaluate_with_prolog(prediction, validation_program, eval_config, timeout=5
     """
     Evaluates a predicted rule against the validation program using Prolog.
     """
-    is_valid, validation_msg = validate_rule_no_hardcoded_cars(prediction)
-    if not is_valid:
-        return {
-            "is_correct": False,
-            "partial_score": 0.0,
-            "syntax_valid": False,
-            "error": f"Rule validation failed: {validation_msg}"
-        }
     # Extract configuration
     positive_pred = eval_config.get("positive_predicate", "eastbound")
@@ -134,6 +127,16 @@ def _evaluate_with_prolog(prediction, validation_program, eval_config, timeout=5
     # extract predicate from rule_to_evaluate
     rule_to_evaluate = extract_ilp_from_text_v2(prediction, positive_pred, allow_multiple_rules)
     if positive_pred not in rule_to_evaluate:
         p = prediction.replace('\n', ' ')
         return {

     """
     Evaluates a predicted rule against the validation program using Prolog.
     """
     # Extract configuration
     positive_pred = eval_config.get("positive_predicate", "eastbound")
     # extract predicate from rule_to_evaluate
     rule_to_evaluate = extract_ilp_from_text_v2(prediction, positive_pred, allow_multiple_rules)
+    is_valid, validation_msg = validate_rule_no_hardcoded_cars(rule_to_evaluate)
+    if not is_valid:
+        return {
+            "is_correct": False,
+            "partial_score": 0.0,
+            "syntax_valid": False,
+            "error": f"Rule validation failed: {validation_msg}"
+        }
     if positive_pred not in rule_to_evaluate:
         p = prediction.replace('\n', ' ')
         return {