|
--- |
|
license: cc-by-nc-sa-2.0 |
|
datasets: |
|
- peluz/lener_br |
|
language: |
|
- pt |
|
pipeline_tag: feature-extraction |
|
library_name: spacy |
|
tags: |
|
- legal |
|
--- |
|
# Modelo spaCy NER para Identificação de Leis em Textos Jurídicos |
|
|
|
Este repositório contém um modelo de **Reconhecimento de Entidades Nomeadas (NER)** desenvolvido com a biblioteca **spaCy**, especialmente treinado para identificar **leis** em textos jurídicos. |
|
|
|
Desenvolvido pela **Diretoria de Inteligência Artificial, Ciência de Dados e Estatística do Tribunal de Justiça do Estado de Goiás**. |
|
|
|
|
|
## Como Usar |
|
|
|
### 1. Instalação |
|
|
|
Para instalar todas as dependências necessárias, execute o seguinte comando: |
|
|
|
```bash |
|
pip install spacy |
|
``` |
|
|
|
## 2. Carregamento do Modelo: |
|
|
|
```Python |
|
import spacy |
|
|
|
nlp = spacy.load("modelo_leis") |
|
``` |
|
|
|
## 3. Processamento de Texto: |
|
|
|
```Python |
|
texto = "Posta assim a questão e nos termos do art. 226, § 6º da Constituição Federal, cuja redação decorrente da Emenda Constitucional 66/2010 dispõe sobre a dissolubilidade do casamento civil pelo divórcio" |
|
doc = nlp(texto) |
|
|
|
for ent in doc.ents: |
|
print(f"{ent.text} -> {ent.label_}") |
|
``` |
|
|
|
## Conjunto de dados e treinamento |
|
Conjunto de dados: [peluz/lener_br](https://huggingface.co/datasets/peluz/lener_br) |
|
|
|
Baseado em: https://www.kaggle.com/code/flaviagg/treinando-spacy-ner-para-o-lener-br/notebook |