Spaces:

evaluate-metric
/

mauve

Running

App Files Files Community

lvwerra HF Staff commited on Sep 22, 2022

Commit

17dddc6

1 Parent(s): 017e24f

Update Space (evaluate main: c447fc8e)

Browse files

Files changed (2) hide show

mauve.py +38 -54
requirements.txt +1 -1

mauve.py CHANGED Viewed

@@ -14,9 +14,6 @@
 # limitations under the License.
 """ MAUVE metric from https://github.com/krishnap25/mauve. """
-from dataclasses import dataclass
-from typing import List, Optional, Union
 import datasets
 import faiss  # Here to have a nice missing dependency error message early on
 import numpy  # Here to have a nice missing dependency error message early on
@@ -88,47 +85,14 @@ Examples:
 """
-@dataclass
-class MauveConfig(evaluate.info.Config):
-    name: str = "default"
-    pos_label: Union[str, int] = 1
-    average: str = "binary"
-    labels: Optional[List[str]] = None
-    sample_weight: Optional[List[float]] = None
-    p_features: Optional[List] = None
-    q_features: Optional[List] = None
-    p_tokens: Optional[List] = None
-    q_tokens: Optional[List] = None
-    num_buckets: str = "auto"
-    pca_max_data: int = -1
-    kmeans_explained_var: float = 0.9
-    kmeans_num_redo: int = 5
-    kmeans_max_iter: int = 500
-    featurize_model_name: str = "gpt2-large"
-    device_id: int = (-1,)
-    max_text_length: int = 1024
-    divergence_curve_discretization_size: int = 25
-    mauve_scaling_factor: int = 5
-    verbose: bool = True
-    seed: int = 25
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
 class Mauve(evaluate.Metric):
-    CONFIG_CLASS = MauveConfig
-    ALLOWED_CONFIG_NAMES = ["default"]
-    def _info(self, config):
         return evaluate.MetricInfo(
             description=_DESCRIPTION,
             citation=_CITATION,
             homepage="https://github.com/krishnap25/mauve",
             inputs_description=_KWARGS_DESCRIPTION,
-            config=config,
             features=datasets.Features(
                 {
                     "predictions": datasets.Value("string", id="sequence"),
@@ -142,25 +106,45 @@ class Mauve(evaluate.Metric):
             ],
         )
-    def _compute(self, predictions, references):
         out = compute_mauve(
             p_text=predictions,
             q_text=references,
-            p_features=self.config.p_features,
-            q_features=self.config.q_features,
-            p_tokens=self.config.p_tokens,
-            q_tokens=self.config.q_tokens,
-            num_buckets=self.config.num_buckets,
-            pca_max_data=self.config.pca_max_data,
-            kmeans_explained_var=self.config.kmeans_explained_var,
-            kmeans_num_redo=self.config.kmeans_num_redo,
-            kmeans_max_iter=self.config.kmeans_max_iter,
-            featurize_model_name=self.config.featurize_model_name,
-            device_id=self.config.device_id,
-            max_text_length=self.config.max_text_length,
-            divergence_curve_discretization_size=self.config.divergence_curve_discretization_size,
-            mauve_scaling_factor=self.config.mauve_scaling_factor,
-            verbose=self.config.verbose,
-            seed=self.config.seed,
         )
         return out

 # limitations under the License.
 """ MAUVE metric from https://github.com/krishnap25/mauve. """
 import datasets
 import faiss  # Here to have a nice missing dependency error message early on
 import numpy  # Here to have a nice missing dependency error message early on
 """
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
 class Mauve(evaluate.Metric):
+    def _info(self):
         return evaluate.MetricInfo(
             description=_DESCRIPTION,
             citation=_CITATION,
             homepage="https://github.com/krishnap25/mauve",
             inputs_description=_KWARGS_DESCRIPTION,
             features=datasets.Features(
                 {
                     "predictions": datasets.Value("string", id="sequence"),
             ],
         )
+    def _compute(
+        self,
+        predictions,
+        references,
+        p_features=None,
+        q_features=None,
+        p_tokens=None,
+        q_tokens=None,
+        num_buckets="auto",
+        pca_max_data=-1,
+        kmeans_explained_var=0.9,
+        kmeans_num_redo=5,
+        kmeans_max_iter=500,
+        featurize_model_name="gpt2-large",
+        device_id=-1,
+        max_text_length=1024,
+        divergence_curve_discretization_size=25,
+        mauve_scaling_factor=5,
+        verbose=True,
+        seed=25,
+    ):
         out = compute_mauve(
             p_text=predictions,
             q_text=references,
+            p_features=p_features,
+            q_features=q_features,
+            p_tokens=p_tokens,
+            q_tokens=q_tokens,
+            num_buckets=num_buckets,
+            pca_max_data=pca_max_data,
+            kmeans_explained_var=kmeans_explained_var,
+            kmeans_num_redo=kmeans_num_redo,
+            kmeans_max_iter=kmeans_max_iter,
+            featurize_model_name=featurize_model_name,
+            device_id=device_id,
+            max_text_length=max_text_length,
+            divergence_curve_discretization_size=divergence_curve_discretization_size,
+            mauve_scaling_factor=mauve_scaling_factor,
+            verbose=verbose,
+            seed=seed,
         )
         return out

requirements.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-git+https://github.com/huggingface/evaluate@e4a2724377909fe2aeb4357e3971e5a569673b39
 faiss-cpu
 sklearn
 mauve-text

+git+https://github.com/huggingface/evaluate@c447fc8eda9c62af501bfdc6988919571050d950
 faiss-cpu
 sklearn
 mauve-text