--- language: - fr license: apache-2.0 tags: - text-generation-inference - transformers - unsloth - gemma - summarizer - lora base_model: unsloth/gemma-2b-it-bnb-4bit --- # Uploaded as lora model - **Developed by:** Labagaite - **License:** apache-2.0 - **Finetuned from model :** unsloth/gemma-2b-it-bnb-4bit # Training Logs ## Traning metrics ![Evaluation Loss Plot](eval_loss_plot.png) ## Evaluation score ### Évaluation des rapports générés par les modèles d'IA : #### Modèle de base unsloth/gemma-2b-it-bnb-4bit : 1. **Performance de la structuration du rapport : 6/10** - Le rapport est structuré en chapitres, mais la transition entre les chapitres n'est pas toujours fluide. 2. **Qualité du langage : 7/10** - Le langage utilisé est professionnel et formel, mais il manque parfois de précision dans les termes techniques. 3. **Cohérence : 6/10** - La cohérence entre les différentes parties du rapport est parfois faible, ce qui rend la lecture moins fluide. #### Modèle fine-tuned /home/will/LM_summarizer_trainer/model/gemma-Summarizer-2b-it-bnb-4bit : 1. **Performance de la structuration du rapport : 8/10** - Le rapport est bien structuré en chapitres clairs et la transition entre les parties est plus fluide. 2. **Qualité du langage : 8/10** - Le langage utilisé est professionnel et précis, avec une meilleure utilisation des termes techniques. 3. **Cohérence : 7/10** - La cohérence entre les parties du rapport est améliorée par rapport au modèle de base, mais il reste quelques incohérences mineures. #### Score global : - Modèle de base : 6.3/10 - Modèle fine-tuned : 7.7/10 ### Conclusion : Le modèle fine-tuned /home/will/LM_summarizer_trainer/model/gemma-Summarizer-2b-it-bnb-4bit présente une amélioration significative par rapport au modèle de base unsloth/gemma-2b-it-bnb-4bit. Il offre une meilleure structuration du rapport, une qualité de langage plus précise et une cohérence améliorée. Cependant, il reste encore des marges d'amélioration pour atteindre une perfection totale. [Evaluation report and scoring](evaluation/run-unsloth/gemma-2b-it-bnb-4bit-7449/Model_evaluator-gemma-Summarizer-2b-it-bnb-4bit.md) ## Wandb logs You can view the training logs [](https://wandb.ai/william-derue/LLM-summarizer_trainer/runs/nlrru9au). ## Training details ### training data - Dataset : [fr-summarizer-dataset](https://huggingface.co/datasets/Labagaite/fr-summarizer-dataset) - Data-size : 7.65 MB - train : 1.97k rows - validation : 440 rows - roles : user , assistant - Format chatml "role": "role", "content": "content", "user": "user", "assistant": "assistant"
*French audio podcast transcription* # Project details [](https://github.com/WillIsback/Report_Maker) Fine-tuned on French audio podcast transcription data for summarization task. As a result, the model is able to summarize French audio podcast transcription data. The model will be used for an AI application: [Report Maker](https://github.com/WillIsback/Report_Maker) wich is a powerful tool designed to automate the process of transcribing and summarizing meetings. It leverages state-of-the-art machine learning models to provide detailed and accurate reports. This gemma model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library. This gemma was trained with [LLM summarizer trainer](images/Llm_Summarizer_trainer_icon-removebg.png) [](https://github.com/unslothai/unsloth) **LLM summarizer trainer** [](https://github.com/WillIsback/LLM_Summarizer_Trainer)