GeoCosmos2.1

Running

App Files Files Community

emidiosouza commited on 25 days ago

Commit

960f8ac

1 Parent(s): fdec39b

fix: ajustes de filtros de data e de limite de itens categóricos

Browse files

Files changed (1) hide show

utils/filter.py +16 -4

utils/filter.py CHANGED Viewed

@@ -32,7 +32,7 @@ def flatten_unique_values(series: pd.Series) -> list:
             unique_values_set.add(val)
     return list(unique_values_set)
-def filter_dataframe(df: pd.DataFrame) -> pd.DataFrame:
     df = df.copy()
     # Primeiro, converta todos os valores da DataFrame para hashable
@@ -62,7 +62,7 @@ def filter_dataframe(df: pd.DataFrame) -> pd.DataFrame:
             left.write("↳")
             # Para colunas categóricas ou com poucos valores únicos, use multiselect
-            if is_categorical_dtype(df[column]) or df[column].nunique() < 5000:
                 raw_unique_values = df[column].dropna().unique()
                 # Verifica se há valores do tipo tupla (decorrentes de listas convertidas)
                 if any(isinstance(val, tuple) for val in raw_unique_values):
@@ -119,7 +119,7 @@ def filter_dataframe(df: pd.DataFrame) -> pd.DataFrame:
                     unique_values = list(raw_unique_values)
                     is_flattened = False
-                if len(unique_values) < 5000:
                     user_text_input = right.multiselect(
                         f"Valores para {column}",
                         unique_values,
@@ -135,7 +135,19 @@ def filter_dataframe(df: pd.DataFrame) -> pd.DataFrame:
                             df = df[df[column].isin(user_text_input)]
                 else:
                     user_text_input = right.text_input(
-                        f"Substring ou regex em {column}",
                     )
                     if user_text_input:
                         df = df[df[column].astype(str).str.contains(user_text_input, na=False)]

             unique_values_set.add(val)
     return list(unique_values_set)
+def filter_dataframe(df: pd.DataFrame, ignore_unique_limit = ["Alvo ou depósito"]) -> pd.DataFrame:
     df = df.copy()
     # Primeiro, converta todos os valores da DataFrame para hashable
             left.write("↳")
             # Para colunas categóricas ou com poucos valores únicos, use multiselect
+            if is_categorical_dtype(df[column]) or df[column].nunique() < 100 or column in ignore_unique_limit:
                 raw_unique_values = df[column].dropna().unique()
                 # Verifica se há valores do tipo tupla (decorrentes de listas convertidas)
                 if any(isinstance(val, tuple) for val in raw_unique_values):
                     unique_values = list(raw_unique_values)
                     is_flattened = False
+                if len(unique_values) < 100:
                     user_text_input = right.multiselect(
                         f"Valores para {column}",
                         unique_values,
                             df = df[df[column].isin(user_text_input)]
                 else:
                     user_text_input = right.text_input(
+                        f"Substring ou regex em {column}",
+                        help="""
+                            **Pesquise palavras ou padrões usando regex:**
+                            - **Múltiplos termos:** `maçã|banana` (busca "maçã" ou "banana").
+                            - **Início da palavra:** `^carro` (encontra "carro", "carroça", etc.).
+                            - **Fim da palavra:** `casa$` (encontra "minha casa", "tua casa", etc.).
+                            - **Números:** `\d+` (encontra qualquer número, como "123", "2024").
+                            - **Número específico:** `123` (encontra exatamente o número "123").
+                            - **Palavras e números:** `carro|123` (encontra "carro" ou "123").
+                            Deixe vazio para não filtrar.
+                        """
                     )
                     if user_text_input:
                         df = df[df[column].astype(str).str.contains(user_text_input, na=False)]