ilovebots/FlauBERT large SDG French

Ce modèle permet de classer les textes en fonction des objectifs de développement durable (ODD) des Nations Unies.

image

Source: https://www.un.org/development/desa/disabilities/about-us/sustainable-development-goals-sdgs-and-disability.html

Détails du modèle

Description du modèle

Ce modèle de classification de texte a été développé en fine-tuning le modèle pré-entraîné dbmdz/bert-base-french-europeana-cased. Les données d'entraînement de ce modèle affiné proviennent de l'ensemble de données communautaires OSDG (OSDG-CD) accessible au public à l'adresse https://zenodo.org/record/5550238#.ZBulfcJByF4. Ce modèle a été réalisé dans le cadre d'une recherche universitaire à l'Université Laval.
L'objectif était de créer un modèle de classification de texte SDG basé sur transformers en français.
Les principaux détails du modèle sont mis en évidence ci-dessous :

  • Model type: Text classification
  • Language(s) (NLP): French
  • License: mit
  • Finetuned from model : flaubert/flaubert_large_cased

Model Sources

How to Get Started with the Model

Utilisez le code ci-dessous pour commencer à utiliser le modèle.

from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("ilovebots/Flaubert_large_SDG_French")
model = AutoModelForSequenceClassification.from_pretrained("ilovebots/Flaubert_large_SDG_French")

Training Data

La base disponible dans https://zenodo.org/record/5550238#.ZBulfcJByF4 a été enrichie des objectifs de développement durable des Nations Unies et traduite en en français.

Training Hyperparameters

  • Num_epoch = 4
  • Learning rate = 2e-5
  • Epsilon = 1e-8
  • Optimizer = AdamW
  • Batch size = 32
  • Seed random = 42

Evaluation

Metrics

  • Accuracy = 0.84
image

Citation

Martinez, D.F. (2023). SDG classification with BERT. https://huggingface.co/ilovebots/Flaubert_large_SDG_French

Downloads last month
15
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.