Spaces:

wandb
/

guardrails-genie

Runtime error

App Files Files Community

ash0ts commited on Dec 3, 2024

Commit

3caf047

1 Parent(s): 13d2f14

Make PII evals work

Browse files

Weave evals run but the results dont match the normal benchmark script

Files changed (7) hide show

application_pages/chat_app.py +4 -4
guardrails_genie/guardrails/entity_recognition/pii_examples/pii_benchmark.py +75 -4
guardrails_genie/guardrails/entity_recognition/pii_examples/pii_benchmark_weave.py +322 -0
guardrails_genie/guardrails/entity_recognition/presidio_entity_recognition_guardrail.py +3 -6
guardrails_genie/guardrails/entity_recognition/regex_entity_recognition_guardrail.py +30 -12
guardrails_genie/guardrails/entity_recognition/transformers_entity_recognition_guardrail.py +1 -1
guardrails_genie/regex_model.py +18 -13

application_pages/chat_app.py CHANGED Viewed

@@ -66,28 +66,28 @@ def initialize_guardrails():
                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
-                )()
             )
         elif guardrail_name == "RegexEntityRecognitionGuardrail":
             st.session_state.guardrails.append(
                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
-                )()
             )
         elif guardrail_name == "TransformersEntityRecognitionGuardrail":
             st.session_state.guardrails.append(
                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
-                )()
             )
         elif guardrail_name == "RestrictedTermsJudge":
             st.session_state.guardrails.append(
                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
-                )()
             )
     st.session_state.guardrails_manager = GuardrailManager(
         guardrails=st.session_state.guardrails

                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
+                )(should_anonymize=True)
             )
         elif guardrail_name == "RegexEntityRecognitionGuardrail":
             st.session_state.guardrails.append(
                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
+                )(should_anonymize=True)
             )
         elif guardrail_name == "TransformersEntityRecognitionGuardrail":
             st.session_state.guardrails.append(
                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
+                )(should_anonymize=True)
             )
         elif guardrail_name == "RestrictedTermsJudge":
             st.session_state.guardrails.append(
                 getattr(
                     importlib.import_module("guardrails_genie.guardrails"),
                     guardrail_name,
+                )(should_anonymize=True)
             )
     st.session_state.guardrails_manager = GuardrailManager(
         guardrails=st.session_state.guardrails

guardrails_genie/guardrails/entity_recognition/pii_examples/pii_benchmark.py CHANGED Viewed

@@ -6,6 +6,35 @@ import json
 from pathlib import Path
 import weave
 def load_ai4privacy_dataset(num_samples: int = 100, split: str = "validation") -> List[Dict]:
     """
     Load and prepare samples from the ai4privacy dataset.
@@ -81,6 +110,17 @@ def evaluate_model(guardrail, test_cases: List[Dict]) -> Tuple[Dict, List[Dict]]
         detected = result.detected_entities
         expected = test_case['expected_entities']
         # Track entity-level metrics
         all_entity_types = set(list(detected.keys()) + list(expected.keys()))
         entity_results = {}
@@ -137,12 +177,20 @@ def evaluate_model(guardrail, test_cases: List[Dict]) -> Tuple[Dict, List[Dict]]
         else:
             metrics["failed"] += 1
-    # Calculate final entity metrics
     for entity_type, counts in metrics["entity_metrics"].items():
         tp = counts["total_true_positives"]
         fp = counts["total_false_positives"]
         fn = counts["total_false_negatives"]
         precision = tp / (tp + fp) if (tp + fp) > 0 else 0
         recall = tp / (tp + fn) if (tp + fn) > 0 else 0
         f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
@@ -153,6 +201,20 @@ def evaluate_model(guardrail, test_cases: List[Dict]) -> Tuple[Dict, List[Dict]]
             "f1": f1
         })
     return metrics, detailed_results
 def save_results(metrics: Dict, detailed_results: List[Dict], model_name: str, output_dir: str = "evaluation_results"):
@@ -177,6 +239,15 @@ def print_metrics_summary(metrics: Dict):
     print(f"Failed: {metrics['failed']}")
     print(f"Success Rate: {(metrics['passed']/metrics['total'])*100:.1f}%")
     print("\nEntity-level Metrics:")
     print("-" * 80)
     print(f"{'Entity Type':<20} {'Precision':>10} {'Recall':>10} {'F1':>10}")
@@ -193,9 +264,9 @@ def main():
     # Initialize models to evaluate
     models = {
-        "regex": RegexEntityRecognitionGuardrail(should_anonymize=True),
-        "presidio": PresidioEntityRecognitionGuardrail(should_anonymize=True),
-        "transformers": TransformersEntityRecognitionGuardrail(should_anonymize=True)
     }
     # Evaluate each model

 from pathlib import Path
 import weave
+# Add this mapping dictionary near the top of the file
+PRESIDIO_TO_TRANSFORMER_MAPPING = {
+    "EMAIL_ADDRESS": "EMAIL",
+    "PHONE_NUMBER": "TELEPHONENUM",
+    "US_SSN": "SOCIALNUM",
+    "CREDIT_CARD": "CREDITCARDNUMBER",
+    "IP_ADDRESS": "IDCARDNUM",
+    "DATE_TIME": "DATEOFBIRTH",
+    "US_PASSPORT": "IDCARDNUM",
+    "US_DRIVER_LICENSE": "DRIVERLICENSENUM",
+    "US_BANK_NUMBER": "ACCOUNTNUM",
+    "LOCATION": "CITY",
+    "URL": "USERNAME",  # URLs often contain usernames
+    "IN_PAN": "TAXNUM",  # Indian Permanent Account Number
+    "UK_NHS": "IDCARDNUM",
+    "SG_NRIC_FIN": "IDCARDNUM",
+    "AU_ABN": "TAXNUM",  # Australian Business Number
+    "AU_ACN": "TAXNUM",  # Australian Company Number
+    "AU_TFN": "TAXNUM",  # Australian Tax File Number
+    "AU_MEDICARE": "IDCARDNUM",
+    "IN_AADHAAR": "IDCARDNUM",  # Indian national ID
+    "IN_VOTER": "IDCARDNUM",
+    "IN_PASSPORT": "IDCARDNUM",
+    "CRYPTO": "ACCOUNTNUM",  # Cryptocurrency addresses
+    "IBAN_CODE": "ACCOUNTNUM",
+    "MEDICAL_LICENSE": "IDCARDNUM",
+    "IN_VEHICLE_REGISTRATION": "IDCARDNUM"
+}
 def load_ai4privacy_dataset(num_samples: int = 100, split: str = "validation") -> List[Dict]:
     """
     Load and prepare samples from the ai4privacy dataset.
         detected = result.detected_entities
         expected = test_case['expected_entities']
+        # Map Presidio entities if this is the Presidio guardrail
+        if isinstance(guardrail, PresidioEntityRecognitionGuardrail):
+            mapped_detected = {}
+            for entity_type, values in detected.items():
+                mapped_type = PRESIDIO_TO_TRANSFORMER_MAPPING.get(entity_type)
+                if mapped_type:
+                    if mapped_type not in mapped_detected:
+                        mapped_detected[mapped_type] = []
+                    mapped_detected[mapped_type].extend(values)
+            detected = mapped_detected
         # Track entity-level metrics
         all_entity_types = set(list(detected.keys()) + list(expected.keys()))
         entity_results = {}
         else:
             metrics["failed"] += 1
+    # Calculate final entity metrics and track totals for overall metrics
+    total_tp = 0
+    total_fp = 0
+    total_fn = 0
     for entity_type, counts in metrics["entity_metrics"].items():
         tp = counts["total_true_positives"]
         fp = counts["total_false_positives"]
         fn = counts["total_false_negatives"]
+        total_tp += tp
+        total_fp += fp
+        total_fn += fn
         precision = tp / (tp + fp) if (tp + fp) > 0 else 0
         recall = tp / (tp + fn) if (tp + fn) > 0 else 0
         f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
             "f1": f1
         })
+    # Calculate overall metrics
+    overall_precision = total_tp / (total_tp + total_fp) if (total_tp + total_fp) > 0 else 0
+    overall_recall = total_tp / (total_tp + total_fn) if (total_tp + total_fn) > 0 else 0
+    overall_f1 = 2 * (overall_precision * overall_recall) / (overall_precision + overall_recall) if (overall_precision + overall_recall) > 0 else 0
+    metrics["overall"] = {
+        "precision": overall_precision,
+        "recall": overall_recall,
+        "f1": overall_f1,
+        "total_true_positives": total_tp,
+        "total_false_positives": total_fp,
+        "total_false_negatives": total_fn
+    }
     return metrics, detailed_results
 def save_results(metrics: Dict, detailed_results: List[Dict], model_name: str, output_dir: str = "evaluation_results"):
     print(f"Failed: {metrics['failed']}")
     print(f"Success Rate: {(metrics['passed']/metrics['total'])*100:.1f}%")
+    # Print overall metrics
+    print("\nOverall Metrics:")
+    print("-" * 80)
+    print(f"{'Metric':<20} {'Value':>10}")
+    print("-" * 80)
+    print(f"{'Precision':<20} {metrics['overall']['precision']:>10.2f}")
+    print(f"{'Recall':<20} {metrics['overall']['recall']:>10.2f}")
+    print(f"{'F1':<20} {metrics['overall']['f1']:>10.2f}")
     print("\nEntity-level Metrics:")
     print("-" * 80)
     print(f"{'Entity Type':<20} {'Precision':>10} {'Recall':>10} {'F1':>10}")
     # Initialize models to evaluate
     models = {
+        "regex": RegexEntityRecognitionGuardrail(should_anonymize=True, show_available_entities=True),
+        "presidio": PresidioEntityRecognitionGuardrail(should_anonymize=True, show_available_entities=True),
+        "transformers": TransformersEntityRecognitionGuardrail(should_anonymize=True, show_available_entities=True)
     }
     # Evaluate each model

guardrails_genie/guardrails/entity_recognition/pii_examples/pii_benchmark_weave.py ADDED Viewed

	@@ -0,0 +1,322 @@

+from datasets import load_dataset
+from typing import Dict, List, Tuple, Optional
+import random
+from tqdm import tqdm
+import json
+from pathlib import Path
+import weave
+from weave.scorers import Scorer
+from weave import Evaluation
+import asyncio
+# Add this mapping dictionary near the top of the file
+PRESIDIO_TO_TRANSFORMER_MAPPING = {
+    "EMAIL_ADDRESS": "EMAIL",
+    "PHONE_NUMBER": "TELEPHONENUM",
+    "US_SSN": "SOCIALNUM",
+    "CREDIT_CARD": "CREDITCARDNUMBER",
+    "IP_ADDRESS": "IDCARDNUM",
+    "DATE_TIME": "DATEOFBIRTH",
+    "US_PASSPORT": "IDCARDNUM",
+    "US_DRIVER_LICENSE": "DRIVERLICENSENUM",
+    "US_BANK_NUMBER": "ACCOUNTNUM",
+    "LOCATION": "CITY",
+    "URL": "USERNAME",  # URLs often contain usernames
+    "IN_PAN": "TAXNUM",  # Indian Permanent Account Number
+    "UK_NHS": "IDCARDNUM",
+    "SG_NRIC_FIN": "IDCARDNUM",
+    "AU_ABN": "TAXNUM",  # Australian Business Number
+    "AU_ACN": "TAXNUM",  # Australian Company Number
+    "AU_TFN": "TAXNUM",  # Australian Tax File Number
+    "AU_MEDICARE": "IDCARDNUM",
+    "IN_AADHAAR": "IDCARDNUM",  # Indian national ID
+    "IN_VOTER": "IDCARDNUM",
+    "IN_PASSPORT": "IDCARDNUM",
+    "CRYPTO": "ACCOUNTNUM",  # Cryptocurrency addresses
+    "IBAN_CODE": "ACCOUNTNUM",
+    "MEDICAL_LICENSE": "IDCARDNUM",
+    "IN_VEHICLE_REGISTRATION": "IDCARDNUM"
+}
+class EntityRecognitionScorer(Scorer):
+    """Scorer for evaluating entity recognition performance"""
+    @weave.op()
+    async def score(self, model_output: Optional[dict], input_text: str, expected_entities: Dict) -> Dict:
+        """Score entity recognition results"""
+        if not model_output:
+            return {"f1": 0.0}
+        # Convert Pydantic model to dict if necessary
+        if hasattr(model_output, "model_dump"):
+            model_output = model_output.model_dump()
+        elif hasattr(model_output, "dict"):
+            model_output = model_output.dict()
+        detected = model_output.get("detected_entities", {})
+        # Map Presidio entities if needed
+        if model_output.get("model_type") == "presidio":
+            mapped_detected = {}
+            for entity_type, values in detected.items():
+                mapped_type = PRESIDIO_TO_TRANSFORMER_MAPPING.get(entity_type)
+                if mapped_type:
+                    if mapped_type not in mapped_detected:
+                        mapped_detected[mapped_type] = []
+                    mapped_detected[mapped_type].extend(values)
+            detected = mapped_detected
+        # Track entity-level metrics
+        all_entity_types = set(list(detected.keys()) + list(expected_entities.keys()))
+        entity_metrics = {}
+        for entity_type in all_entity_types:
+            detected_set = set(detected.get(entity_type, []))
+            expected_set = set(expected_entities.get(entity_type, []))
+            # Calculate metrics
+            true_positives = len(detected_set & expected_set)
+            false_positives = len(detected_set - expected_set)
+            false_negatives = len(expected_set - detected_set)
+            if entity_type not in entity_metrics:
+                entity_metrics[entity_type] = {
+                    "total_true_positives": 0,
+                    "total_false_positives": 0,
+                    "total_false_negatives": 0
+                }
+            entity_metrics[entity_type]["total_true_positives"] += true_positives
+            entity_metrics[entity_type]["total_false_positives"] += false_positives
+            entity_metrics[entity_type]["total_false_negatives"] += false_negatives
+            # Calculate per-entity metrics
+            precision = true_positives / (true_positives + false_positives) if (true_positives + false_positives) > 0 else 0
+            recall = true_positives / (true_positives + false_negatives) if (true_positives + false_negatives) > 0 else 0
+            f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
+            entity_metrics[entity_type].update({
+                "precision": precision,
+                "recall": recall,
+                "f1": f1
+            })
+        # Calculate overall metrics
+        total_tp = sum(metrics["total_true_positives"] for metrics in entity_metrics.values())
+        total_fp = sum(metrics["total_false_positives"] for metrics in entity_metrics.values())
+        total_fn = sum(metrics["total_false_negatives"] for metrics in entity_metrics.values())
+        overall_precision = total_tp / (total_tp + total_fp) if (total_tp + total_fp) > 0 else 0
+        overall_recall = total_tp / (total_tp + total_fn) if (total_tp + total_fn) > 0 else 0
+        overall_f1 = 2 * (overall_precision * overall_recall) / (overall_precision + overall_recall) if (overall_precision + overall_recall) > 0 else 0
+        entity_metrics["overall"] = {
+            "precision": overall_precision,
+            "recall": overall_recall,
+            "f1": overall_f1,
+            "total_true_positives": total_tp,
+            "total_false_positives": total_fp,
+            "total_false_negatives": total_fn
+        }
+        return entity_metrics
+def load_ai4privacy_dataset(num_samples: int = 100, split: str = "validation") -> List[Dict]:
+    """
+    Load and prepare samples from the ai4privacy dataset.
+    Args:
+        num_samples: Number of samples to evaluate
+        split: Dataset split to use ("train" or "validation")
+    Returns:
+        List of prepared test cases
+    """
+    # Load the dataset
+    dataset = load_dataset("ai4privacy/pii-masking-400k")
+    # Get the specified split
+    data_split = dataset[split]
+    # Randomly sample entries if num_samples is less than total
+    if num_samples < len(data_split):
+        indices = random.sample(range(len(data_split)), num_samples)
+        samples = [data_split[i] for i in indices]
+    else:
+        samples = data_split
+    # Convert to test case format
+    test_cases = []
+    for sample in samples:
+        # Extract entities from privacy_mask
+        entities: Dict[str, List[str]] = {}
+        for entity in sample['privacy_mask']:
+            label = entity['label']
+            value = entity['value']
+            if label not in entities:
+                entities[label] = []
+            entities[label].append(value)
+        test_case = {
+            "description": f"AI4Privacy Sample (ID: {sample['uid']})",
+            "input_text": sample['source_text'],
+            "expected_entities": entities,
+            "masked_text": sample['masked_text'],
+            "language": sample['language'],
+            "locale": sample['locale']
+        }
+        test_cases.append(test_case)
+    return test_cases
+def save_results(weave_results: Dict, model_name: str, output_dir: str = "evaluation_results"):
+    """Save evaluation results to files"""
+    output_dir = Path(output_dir)
+    output_dir.mkdir(exist_ok=True)
+    # Extract and process results
+    scorer_results = weave_results.get("EntityRecognitionScorer", [])
+    if not scorer_results or all(r is None for r in scorer_results):
+        print(f"No valid results to save for {model_name}")
+        return
+    # Calculate summary metrics
+    total_samples = len(scorer_results)
+    passed = sum(1 for r in scorer_results if r is not None and not isinstance(r, str))
+    # Aggregate entity-level metrics
+    entity_metrics = {}
+    for result in scorer_results:
+        try:
+            if isinstance(result, str) or not result:
+                continue
+            for entity_type, metrics in result.items():
+                if entity_type not in entity_metrics:
+                    entity_metrics[entity_type] = {
+                        "precision": [],
+                        "recall": [],
+                        "f1": []
+                    }
+                entity_metrics[entity_type]["precision"].append(metrics["precision"])
+                entity_metrics[entity_type]["recall"].append(metrics["recall"])
+                entity_metrics[entity_type]["f1"].append(metrics["f1"])
+        except (AttributeError, TypeError, KeyError):
+            continue
+    # Calculate averages
+    summary_metrics = {
+        "total": total_samples,
+        "passed": passed,
+        "failed": total_samples - passed,
+        "success_rate": (passed/total_samples) if total_samples > 0 else 0,
+        "entity_metrics": {
+            entity_type: {
+                "precision": sum(metrics["precision"]) / len(metrics["precision"]) if metrics["precision"] else 0,
+                "recall": sum(metrics["recall"]) / len(metrics["recall"]) if metrics["recall"] else 0,
+                "f1": sum(metrics["f1"]) / len(metrics["f1"]) if metrics["f1"] else 0
+            }
+            for entity_type, metrics in entity_metrics.items()
+        }
+    }
+    # Save files
+    with open(output_dir / f"{model_name}_metrics.json", "w") as f:
+        json.dump(summary_metrics, f, indent=2)
+    # Save detailed results, filtering out string results
+    detailed_results = [r for r in scorer_results if not isinstance(r, str) and r is not None]
+    with open(output_dir / f"{model_name}_detailed_results.json", "w") as f:
+        json.dump(detailed_results, f, indent=2)
+def print_metrics_summary(weave_results: Dict):
+    """Print a summary of the evaluation metrics"""
+    print("\nEvaluation Summary")
+    print("=" * 80)
+    # Extract results from Weave's evaluation format
+    scorer_results = weave_results.get("EntityRecognitionScorer", {})
+    if not scorer_results:
+        print("No valid results available")
+        return
+    # Calculate overall metrics
+    total_samples = int(weave_results.get("model_latency", {}).get("count", 0))
+    passed = total_samples  # Since we have results, all samples passed
+    failed = 0
+    print(f"Total Samples: {total_samples}")
+    print(f"Passed: {passed}")
+    print(f"Failed: {failed}")
+    print(f"Success Rate: {(passed/total_samples)*100:.2f}%")
+    # Print overall metrics
+    if "overall" in scorer_results:
+        overall = scorer_results["overall"]
+        print("\nOverall Metrics:")
+        print("-" * 80)
+        print(f"{'Metric':<20} {'Value':>10}")
+        print("-" * 80)
+        print(f"{'Precision':<20} {overall['precision']['mean']:>10.2f}")
+        print(f"{'Recall':<20} {overall['recall']['mean']:>10.2f}")
+        print(f"{'F1':<20} {overall['f1']['mean']:>10.2f}")
+    # Print entity-level metrics
+    print("\nEntity-Level Metrics:")
+    print("-" * 80)
+    print(f"{'Entity Type':<20} {'Precision':>10} {'Recall':>10} {'F1':>10}")
+    print("-" * 80)
+    for entity_type, metrics in scorer_results.items():
+        if entity_type == "overall":
+            continue
+        precision = metrics.get("precision", {}).get("mean", 0)
+        recall = metrics.get("recall", {}).get("mean", 0)
+        f1 = metrics.get("f1", {}).get("mean", 0)
+        print(f"{entity_type:<20} {precision:>10.2f} {recall:>10.2f} {f1:>10.2f}")
+def preprocess_model_input(example: Dict) -> Dict:
+    """Preprocess dataset example to match model input format."""
+    return {
+        "prompt": example["input_text"],
+        "model_type": example.get("model_type", "unknown")  # Add model type for Presidio mapping
+    }
+def main():
+    """Main evaluation function"""
+    weave.init("guardrails-genie-pii-evaluation")
+    # Load test cases
+    test_cases = load_ai4privacy_dataset(num_samples=100)
+    # Add model type to test cases for Presidio mapping
+    models = {
+        # "regex": RegexEntityRecognitionGuardrail(should_anonymize=True),
+        "presidio": PresidioEntityRecognitionGuardrail(should_anonymize=True),
+        # "transformers": TransformersEntityRecognitionGuardrail(should_anonymize=True)
+    }
+    scorer = EntityRecognitionScorer()
+    # Evaluate each model
+    for model_name, guardrail in models.items():
+        print(f"\nEvaluating {model_name} model...")
+        # Add model type to test cases
+        model_test_cases = [{**case, "model_type": model_name} for case in test_cases]
+        evaluation = Evaluation(
+            dataset=model_test_cases,
+            scorers=[scorer],
+            preprocess_model_input=preprocess_model_input
+        )
+        results = asyncio.run(evaluation.evaluate(guardrail))
+if __name__ == "__main__":
+    from guardrails_genie.guardrails.entity_recognition.regex_entity_recognition_guardrail import RegexEntityRecognitionGuardrail
+    from guardrails_genie.guardrails.entity_recognition.presidio_entity_recognition_guardrail import PresidioEntityRecognitionGuardrail
+    from guardrails_genie.guardrails.entity_recognition.transformers_entity_recognition_guardrail import TransformersEntityRecognitionGuardrail
+    main()

guardrails_genie/guardrails/entity_recognition/presidio_entity_recognition_guardrail.py CHANGED Viewed

@@ -60,12 +60,9 @@ class PresidioEntityRecognitionGuardrail(Guardrail):
                 print(f"- {entity}")
             print("=" * 25 + "\n")
-        # Initialize default values
         if selected_entities is None:
-            selected_entities = [
-                "CREDIT_CARD", "US_SSN", "EMAIL_ADDRESS", "PHONE_NUMBER",
-                "IP_ADDRESS", "URL", "DATE_TIME"
-            ]
         # Get available entities dynamically
         available_entities = self.get_available_entities()
@@ -135,7 +132,7 @@ class PresidioEntityRecognitionGuardrail(Guardrail):
         """
         # Analyze text for entities
         analyzer_results = self.analyzer.analyze(
-            text=prompt,
             entities=self.selected_entities,
             language=self.language
         )

                 print(f"- {entity}")
             print("=" * 25 + "\n")
+        # Initialize default values to all available entities
         if selected_entities is None:
+            selected_entities = self.get_available_entities()
         # Get available entities dynamically
         available_entities = self.get_available_entities()
         """
         # Analyze text for entities
         analyzer_results = self.analyzer.analyze(
+            text=str(prompt),
             entities=self.selected_entities,
             language=self.language
         )

guardrails_genie/guardrails/entity_recognition/regex_entity_recognition_guardrail.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from typing import Dict, Optional, ClassVar
 import weave
 from pydantic import BaseModel
@@ -35,24 +35,34 @@ class RegexEntityRecognitionGuardrail(Guardrail):
     should_anonymize: bool = False
     DEFAULT_PATTERNS: ClassVar[Dict[str, str]] = {
-        "email": r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}",
-        "phone_number": r"\b(?:\+?1[-.]?)?\(?(?:[0-9]{3})\)?[-.]?(?:[0-9]{3})[-.]?(?:[0-9]{4})\b",
-        "ssn": r"\b\d{3}[-]?\d{2}[-]?\d{4}\b",
-        "credit_card": r"\b\d{4}[-.]?\d{4}[-.]?\d{4}[-.]?\d{4}\b",
-        "ip_address": r"\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b",
-        "date_of_birth": r"\b\d{2}[-/]\d{2}[-/]\d{4}\b",
-        "passport": r"\b[A-Z]{1,2}[0-9]{6,9}\b",
-        "drivers_license": r"\b[A-Z]\d{7}\b",
-        "bank_account": r"\b\d{8,17}\b",
-        "zip_code": r"\b\d{5}(?:[-]\d{4})?\b"
     }
-    def __init__(self, use_defaults: bool = True, should_anonymize: bool = False, **kwargs):
         patterns = {}
         if use_defaults:
             patterns = self.DEFAULT_PATTERNS.copy()
         if kwargs.get("patterns"):
             patterns.update(kwargs["patterns"])
         # Create the RegexModel instance
         regex_model = RegexModel(patterns=patterns)
@@ -72,6 +82,14 @@ class RegexEntityRecognitionGuardrail(Guardrail):
         escaped_text = re.escape(text)
         # Create a pattern that matches the exact text, case-insensitive
         return rf"\b{escaped_text}\b"
     @weave.op()
     def guard(self, prompt: str, custom_terms: Optional[list[str]] = None, return_detected_types: bool = True, aggregate_redaction: bool = True, **kwargs) -> RegexEntityRecognitionResponse | RegexEntityRecognitionSimpleResponse:

+from typing import Dict, Optional, ClassVar, List
 import weave
 from pydantic import BaseModel
     should_anonymize: bool = False
     DEFAULT_PATTERNS: ClassVar[Dict[str, str]] = {
+        "EMAIL": r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b',
+        "TELEPHONENUM": r'\b(\+\d{1,3}[-.]?)?\(?\d{3}\)?[-.]?\d{3}[-.]?\d{4}\b',
+        "SOCIALNUM": r'\b\d{3}[-]?\d{2}[-]?\d{4}\b',
+        "CREDITCARDNUMBER": r'\b\d{4}[-\s]?\d{4}[-\s]?\d{4}[-\s]?\d{4}\b',
+        "DATEOFBIRTH": r'\b(0[1-9]|1[0-2])[-/](0[1-9]|[12]\d|3[01])[-/](19|20)\d{2}\b',
+        "DRIVERLICENSENUM": r'[A-Z]\d{7}',  # Example pattern, adjust for your needs
+        "ACCOUNTNUM": r'\b\d{10,12}\b',  # Example pattern for bank accounts
+        "ZIPCODE": r'\b\d{5}(?:-\d{4})?\b',
+        "GIVENNAME": r'\b[A-Z][a-z]+\b',  # Basic pattern for first names
+        "SURNAME": r'\b[A-Z][a-z]+\b',    # Basic pattern for last names
+        "CITY": r'\b[A-Z][a-z]+(?:[\s-][A-Z][a-z]+)*\b',
+        "STREET": r'\b\d+\s+[A-Z][a-z]+\s+(?:Street|St|Avenue|Ave|Road|Rd|Boulevard|Blvd|Lane|Ln|Drive|Dr)\b',
+        "IDCARDNUM": r'[A-Z]\d{7,8}',  # Generic pattern for ID cards
+        "USERNAME": r'@[A-Za-z]\w{3,}',  # Basic username pattern
+        "PASSWORD": r'[A-Za-z0-9@#$%^&+=]{8,}',  # Basic password pattern
+        "TAXNUM": r'\b\d{2}[-]\d{7}\b',  # Example tax number pattern
+        "BUILDINGNUM": r'\b\d+[A-Za-z]?\b'  # Basic building number pattern
     }
+    def __init__(self, use_defaults: bool = True, should_anonymize: bool = False, show_available_entities: bool = False, **kwargs):
         patterns = {}
         if use_defaults:
             patterns = self.DEFAULT_PATTERNS.copy()
         if kwargs.get("patterns"):
             patterns.update(kwargs["patterns"])
+        if show_available_entities:
+            self._print_available_entities(patterns.keys())
         # Create the RegexModel instance
         regex_model = RegexModel(patterns=patterns)
         escaped_text = re.escape(text)
         # Create a pattern that matches the exact text, case-insensitive
         return rf"\b{escaped_text}\b"
+    def _print_available_entities(self, entities: List[str]):
+        """Print available entities"""
+        print("\nAvailable entity types:")
+        print("=" * 25)
+        for entity in entities:
+            print(f"- {entity}")
+        print("=" * 25 + "\n")
     @weave.op()
     def guard(self, prompt: str, custom_terms: Optional[list[str]] = None, return_detected_types: bool = True, aggregate_redaction: bool = True, **kwargs) -> RegexEntityRecognitionResponse | RegexEntityRecognitionSimpleResponse:

guardrails_genie/guardrails/entity_recognition/transformers_entity_recognition_guardrail.py CHANGED Viewed

@@ -37,7 +37,7 @@ class TransformersEntityRecognitionGuardrail(Guardrail):
         model_name: str = "iiiorg/piiranha-v1-detect-personal-information",
         selected_entities: Optional[List[str]] = None,
         should_anonymize: bool = False,
-        show_available_entities: bool = True,
     ):
         # Load model config and extract available entities
         config = AutoConfig.from_pretrained(model_name)

         model_name: str = "iiiorg/piiranha-v1-detect-personal-information",
         selected_entities: Optional[List[str]] = None,
         should_anonymize: bool = False,
+        show_available_entities: bool = False,
     ):
         # Load model config and extract available entities
         config = AutoConfig.from_pretrained(model_name)

guardrails_genie/regex_model.py CHANGED Viewed

@@ -28,7 +28,7 @@ class RegexModel(weave.Model):
         }
     @weave.op()
-    def check(self, text: str) -> RegexResult:
         """
         Check text against all patterns and return detailed results.
@@ -38,23 +38,28 @@ class RegexModel(weave.Model):
         Returns:
             RegexResult containing pass/fail status and details about matches
         """
-        matches: Dict[str, List[str]] = {}
-        failed_patterns: List[str] = []
-        for pattern_name, compiled_pattern in self._compiled_patterns.items():
-            found_matches = compiled_pattern.findall(text)
-            if found_matches:
-                matches[pattern_name] = found_matches
             else:
                 failed_patterns.append(pattern_name)
-        # Consider it passed only if no patterns matched (no PII found)
-        passed = len(matches) == 0
         return RegexResult(
-            passed=passed,
-            matched_patterns=matches,
-            failed_patterns=failed_patterns
         )
     @weave.op()

         }
     @weave.op()
+    def check(self, prompt: str) -> RegexResult:
         """
         Check text against all patterns and return detailed results.
         Returns:
             RegexResult containing pass/fail status and details about matches
         """
+        matched_patterns = {}
+        failed_patterns = []
+        for pattern_name, pattern in self.patterns.items():
+            matches = []
+            for match in re.finditer(pattern, prompt):
+                if match.groups():
+                    # If there are capture groups, join them with a separator
+                    matches.append('-'.join(str(g) for g in match.groups() if g is not None))
+                else:
+                    # If no capture groups, use the full match
+                    matches.append(match.group(0))
+            if matches:
+                matched_patterns[pattern_name] = matches
             else:
                 failed_patterns.append(pattern_name)
         return RegexResult(
+            matched_patterns=matched_patterns,
+            failed_patterns=failed_patterns,
+            passed=len(matched_patterns) == 0
         )
     @weave.op()