--- license: cc-by-nc-sa-4.0 language: - pt base_model: - google-bert/bert-base-multilingual-cased pipeline_tag: text-classification tags: - legal --- # Modelo BERT para Classificação de Sentenças Jurídicas: Fato, Tese e Ruído Este repositório disponibiliza um modelo BERT fine-tuned a partir do `google-bert/bert-base-multilingual-cased`, com o objetivo de classificar sentenças extraídas de processos judiciais em três categorias: - **FATO**: Sentenças que descrevem acontecimentos ou elementos objetivos do caso. - **TESE**: Sentenças que apresentam argumentos jurídicos ou fundamentos legais. - **RUÍDO**: Sentenças que não se enquadram como fato nem como tese (ex: trechos genéricos, introdutórios ou sem relevância jurídica direta). > Desenvolvido pela **Diretoria de Inteligência Artificial, Ciência de Dados e Estatística** do **Tribunal de Justiça do Estado de Goiás (TJGO)**. ## 1. Instalação Para instalar as dependências necessárias, execute o comando abaixo: ```bash pip install transformers ``` ## 2. Utilização do Modelo ```Python from transformers import pipeline text = """a empresa requerente atua...""" classifier = pipeline("text-classification", model=r"DIACDE/BERT_FATO_TESE", return_all_scores=True, truncation=True) print(classifier(text)) #[ # {'label': 'FATO', 'score': 0.85}, # {'label': 'TESE', 'score': 0.10} # {'label': 'RUIDO', 'score': 0.5} #] ```