Spaces:

kpfadnis
/

InspectorRAGet

Running

App Files Files

kpfadnis commited on Oct 11, 2024

Commit

5db7074

1 Parent(s): 988e116

feat (aggregator): Added support for median aggregator.

Browse files

Signed-off-by: Kshitij Fadnis <[email protected]>

Files changed (4) hide show

src/utilities/aggregators.ts +48 -4
src/utilities/metrics.ts +116 -25
src/views/model-behavior/ModelBehavior.tsx +2 -1
src/views/performance-overview/PerformanceOverview.tsx +11 -4

src/utilities/aggregators.ts CHANGED Viewed

@@ -24,11 +24,11 @@ import {
   AggregationStatistics,
   MetricValue,
 } from '@/src/types';
-import { castToNumber } from '@/src/utilities/metrics';
-export const averageAggregator: Aggregator = {
-  name: 'averagae',
-  displayName: 'Average',
   apply: (
     scores: number[] | string[],
     references: MetricValue[],
@@ -64,6 +64,50 @@ export const averageAggregator: Aggregator = {
   },
 };
 export const majorityAggregator: Aggregator = {
   name: 'majority',
   displayName: 'Majority',

   AggregationStatistics,
   MetricValue,
 } from '@/src/types';
+import { castToNumber, castToValue } from '@/src/utilities/metrics';
+export const meanAggregator: Aggregator = {
+  name: 'mean',
+  displayName: 'Mean',
   apply: (
     scores: number[] | string[],
     references: MetricValue[],
   },
 };
+export const medianAggregator: Aggregator = {
+  name: 'median',
+  displayName: 'Median',
+  apply: (
+    scores: number[] | string[],
+    references: MetricValue[],
+  ): AggregationStatistics => {
+    // Step 1: Cast score to numbers
+    const numericScores = scores.map((score) =>
+      typeof score === 'string' ? castToNumber(score, references) : score,
+    );
+    // Step 2: Sort the numeric scores
+    const sortedNumericScores = numericScores.toSorted();
+    // Step 3: Calculate aggregate value & standard deviation
+    const median =
+      sortedNumericScores.length % 2 == 0
+        ? sortedNumericScores[sortedNumericScores.length / 2]
+        : sortedNumericScores[(sortedNumericScores.length + 1) / 2];
+    const std = Math.sqrt(
+      sortedNumericScores
+        .map((score) => Math.pow(score - median, 2))
+        .reduce((a, b) => a + b) / sortedNumericScores.length,
+    );
+    // Step 4: Calculate confidence level
+    const sorted_counter = Object.entries(countBy(scores));
+    const numberOfUniqueValues = sorted_counter.length;
+    const mostCommonValueCount = sorted_counter[0][1];
+    return {
+      value: castToValue(median, references),
+      std: Math.round((std + Number.EPSILON) * 100) / 100,
+      confidence:
+        mostCommonValueCount === scores.length
+          ? AggregationConfidenceLevels.HIGH
+          : numberOfUniqueValues === scores.length
+            ? AggregationConfidenceLevels.LOW
+            : AggregationConfidenceLevels.MEDIUM,
+    };
+  },
+};
 export const majorityAggregator: Aggregator = {
   name: 'majority',
   displayName: 'Majority',

src/utilities/metrics.ts CHANGED Viewed

@@ -77,6 +77,33 @@ export function extractMetricDisplayName(metric: Metric): string {
     : metric.name.charAt(0).toUpperCase() + metric.name.slice(1).toLowerCase();
 }
 export function castToNumber(
   value: string | number,
   references?: MetricValue[],
@@ -116,61 +143,121 @@ export function castToNumber(
 }
 /**
- * Compute average value
- * @param counter distribution of values
- * @param numberOfAnnotators number of annotators
  * @returns
  */
-function computeAverage(
   metric: Metric,
-  counter: { [key: string]: number },
-  numberOfAnnotators: number,
 ): { level: number; value: number | string } {
-  // Step 0: Sort counter values
   const sorted_counter = Object.entries(counter);
   sorted_counter.sort((x, y) => {
     return y[1] - x[1];
   });
-  // Step 1: Number of unique values, most common value and its count
   const numberOfUniqueValues = sorted_counter.length;
   const mostCommonValueCount = sorted_counter[0][1];
-  // Step 2: Calculate average
   let sum: number = 0;
   for (const [value, count] of Object.entries(counter)) {
     sum +=
       (typeof value === 'string' ? castToNumber(value, metric.values) : value) *
       count;
   }
-  const average =
-    Math.round((sum / numberOfAnnotators + Number.EPSILON) * 100) / 100;
-  // Step 3: Common patterns
-  // Step 3.a: Absolute agreement
-  if (mostCommonValueCount === numberOfAnnotators)
     return {
       level: AgreementLevels.ABSOLUTE_AGREEMENT,
-      value: average,
     };
-  // Step 3.b: Absolute disagreement/No agreement
-  if (numberOfUniqueValues === numberOfAnnotators)
     return {
       level: AgreementLevels.NO_AGREEMENT,
-      value: average,
     };
-  // Step 4: Default return
   return {
     level: AgreementLevels.HIGH_AGREEMENT,
-    value: average,
   };
 }
 /**
  * Compute majority value
- * @param metric
  * @param counter distribution of values
  * @param numberOfAnnotators number of annotators
  * @returns
@@ -257,8 +344,10 @@ export function calculateAggregateValue(
       let scores: string[] | number[] = Object.values(entries).map(
         (entry) => entry.value,
       );
-      if (metric.aggregator === 'average') {
-        return computeAverage(metric, countBy(scores), scores.length);
       } else {
         return computeMajority(metric, countBy(scores), scores.length);
       }
@@ -273,8 +362,10 @@ export function calculateAggregateValue(
       let scores: string[] | number[] = Object.values(entries).map(
         (entry) => entry.value,
       );
-      if (metric.aggregator === 'average') {
-        return computeAverage(metric, countBy(scores), scores.length);
       } else {
         return computeMajority(metric, countBy(scores), scores.length);
       }

     : metric.name.charAt(0).toUpperCase() + metric.name.slice(1).toLowerCase();
 }
+/**
+ * Converts numeric value to metric value using references in case of 'categorical' metrics
+ * @param value numeric value to convert
+ * @param references reference metric values
+ * @returns metric value
+ */
+export function castToValue(
+  value: number,
+  references?: MetricValue[],
+): string | number {
+  // Step 1: Check if references are provided to convert "numeric" value to "string" value
+  if (references) {
+    // Step 1.a: Find appropriate reference by comparing "string" values
+    const reference = references.find((entry) => entry.numericValue === value);
+    // Step 1.b: If value exists in reference, then return it
+    if (reference && reference.value) {
+      return reference.value;
+    } else {
+      return value;
+    }
+  }
+  // Default return
+  return value;
+}
 export function castToNumber(
   value: string | number,
   references?: MetricValue[],
 }
 /**
+ * Compute mean value
+ * @param metric metric under consideration
+ * @param scores distribution of values
  * @returns
  */
+function computeMean(
   metric: Metric,
+  scores: string[] | number[],
 ): { level: number; value: number | string } {
+  // Step 1: Create counter
+  const counter: { [key: string]: number } = countBy(scores);
+  // Step 2: Sort counter values
   const sorted_counter = Object.entries(counter);
   sorted_counter.sort((x, y) => {
     return y[1] - x[1];
   });
+  // Step 3: Number of unique values, most common value and its count
   const numberOfUniqueValues = sorted_counter.length;
   const mostCommonValueCount = sorted_counter[0][1];
+  // Step 4: Calculate mean
   let sum: number = 0;
   for (const [value, count] of Object.entries(counter)) {
     sum +=
       (typeof value === 'string' ? castToNumber(value, metric.values) : value) *
       count;
   }
+  const mean = Math.round((sum / scores.length + Number.EPSILON) * 100) / 100;
+  // Step 5: Common patterns
+  // Step 5.a: Absolute agreement
+  if (mostCommonValueCount === scores.length)
     return {
       level: AgreementLevels.ABSOLUTE_AGREEMENT,
+      value: mean,
     };
+  // Step 5.b: Absolute disagreement/No agreement
+  if (numberOfUniqueValues === scores.length)
+    return {
+      level: AgreementLevels.NO_AGREEMENT,
+      value: mean,
+    };
+  // Step 6: Default return
+  return {
+    level: AgreementLevels.HIGH_AGREEMENT,
+    value: mean,
+  };
+}
+/**
+ * Compute median value
+ * @param metric metric under consideration
+ * @param counter distribution of values
+ * @returns
+ */
+function computeMedian(
+  metric: Metric,
+  scores: string[] | number[],
+): { level: number; value: number | string } {
+  // Step 1: Create counter
+  const counter: { [key: string]: number } = countBy(scores);
+  // Step 2: Sort counter values
+  const sorted_counter = Object.entries(counter);
+  sorted_counter.sort((x, y) => {
+    return y[1] - x[1];
+  });
+  // Step 3: Number of unique values, most common value and its count
+  const numberOfUniqueValues = sorted_counter.length;
+  const mostCommonValueCount = sorted_counter[0][1];
+  // Step 4: Cast score to numbers
+  const numericScores = scores.map((score) =>
+    typeof score === 'string' ? castToNumber(score, metric.values) : score,
+  );
+  // Step 5: Sort the numeric scores
+  const sortedNumericScores = numericScores.toSorted();
+  // Step 6: Calculate median
+  const median =
+    sortedNumericScores.length % 2 == 0
+      ? sortedNumericScores[sortedNumericScores.length / 2]
+      : sortedNumericScores[(sortedNumericScores.length + 1) / 2 - 1];
+  // Step 7: Common patterns
+  // Step 7.a: Absolute agreement
+  if (mostCommonValueCount === scores.length)
+    return {
+      level: AgreementLevels.ABSOLUTE_AGREEMENT,
+      value: castToValue(median, metric.values),
+    };
+  // Step 7.b: Absolute disagreement/No agreement
+  if (numberOfUniqueValues === scores.length)
     return {
       level: AgreementLevels.NO_AGREEMENT,
+      value: castToValue(median, metric.values),
     };
+  // Step 8: Default return
   return {
     level: AgreementLevels.HIGH_AGREEMENT,
+    value: castToValue(median, metric.values),
   };
 }
 /**
  * Compute majority value
+ * @param metric metric under consideration
  * @param counter distribution of values
  * @param numberOfAnnotators number of annotators
  * @returns
       let scores: string[] | number[] = Object.values(entries).map(
         (entry) => entry.value,
       );
+      if (metric.aggregator === 'average' || metric.aggregator === 'mean') {
+        return computeMean(metric, scores);
+      } else if (metric.aggregator === 'median') {
+        return computeMedian(metric, scores);
       } else {
         return computeMajority(metric, countBy(scores), scores.length);
       }
       let scores: string[] | number[] = Object.values(entries).map(
         (entry) => entry.value,
       );
+      if (metric.aggregator === 'average' || metric.aggregator === 'mean') {
+        return computeMean(metric, scores);
+      } else if (metric.aggregator === 'median') {
+        return computeMedian(metric, scores);
       } else {
         return computeMajority(metric, countBy(scores), scores.length);
       }

src/views/model-behavior/ModelBehavior.tsx CHANGED Viewed

@@ -140,7 +140,8 @@ function prepareGroupBarChartData(
       return {
         ...entry,
         key:
-          metric.aggregator && metric.aggregator === 'majority'
             ? extractMetricDisplayValue(entry.key, metric.values)
             : entry.key,
       };

       return {
         ...entry,
         key:
+          metric.aggregator &&
+          (metric.aggregator === 'majority' || metric.aggregator === 'median')
             ? extractMetricDisplayValue(entry.key, metric.values)
             : entry.key,
       };

src/views/performance-overview/PerformanceOverview.tsx CHANGED Viewed

@@ -53,7 +53,8 @@ import {
   castToNumber,
 } from '@/src/utilities/metrics';
 import {
-  averageAggregator,
   majorityAggregator,
 } from '@/src/utilities/aggregators';
 import { areObjectsIntersecting } from '@/src/utilities/objects';
@@ -372,7 +373,11 @@ export default function PerformanceOverview({
   const [WindowHeight, setWindowHeight] = useState<number>(
     global?.window && window.innerHeight,
   );
-  const aggregators: Aggregator[] = [averageAggregator, majorityAggregator];
   const [selectedAggregators, setSelectedAggregators] = useState<{
     [key: string]: Aggregator;
   }>(
@@ -383,7 +388,9 @@ export default function PerformanceOverview({
           metric.name,
           metric.aggregator === 'majority'
             ? majorityAggregator
-            : averageAggregator,
         ]),
     ),
   );
@@ -460,7 +467,7 @@ export default function PerformanceOverview({
       for (const [metric, evaluations] of Object.entries(
         evaluationsPerMetric,
       )) {
-        const aggregator = selectedAggregators[metric] || averageAggregator;
         // Select evaluations based on selected filters
         const selectedEvaluations = !isEmpty(selectedFilters)

   castToNumber,
 } from '@/src/utilities/metrics';
 import {
+  meanAggregator,
+  medianAggregator,
   majorityAggregator,
 } from '@/src/utilities/aggregators';
 import { areObjectsIntersecting } from '@/src/utilities/objects';
   const [WindowHeight, setWindowHeight] = useState<number>(
     global?.window && window.innerHeight,
   );
+  const aggregators: Aggregator[] = [
+    meanAggregator,
+    medianAggregator,
+    majorityAggregator,
+  ];
   const [selectedAggregators, setSelectedAggregators] = useState<{
     [key: string]: Aggregator;
   }>(
           metric.name,
           metric.aggregator === 'majority'
             ? majorityAggregator
+            : metric.aggregator === 'median'
+              ? medianAggregator
+              : meanAggregator,
         ]),
     ),
   );
       for (const [metric, evaluations] of Object.entries(
         evaluationsPerMetric,
       )) {
+        const aggregator = selectedAggregators[metric] || meanAggregator;
         // Select evaluations based on selected filters
         const selectedEvaluations = !isEmpty(selectedFilters)