Update README.md
Browse files
README.md
CHANGED
@@ -1,16 +1,17 @@
|
|
1 |
-
---
|
2 |
-
metrics:
|
3 |
-
- accuracy
|
4 |
-
- perplexity
|
5 |
-
pipeline_tag: text-generation
|
6 |
-
language:
|
7 |
-
- pt
|
8 |
-
---
|
9 |
|
10 |
# Modelo Llama 1 para Tiny Shakespeare
|
11 |
|
12 |
Este repositório contém um modelo de linguagem Llama 1 com 2.3 milhões de parâmetros treinado no dataset Tiny Shakespeare. O modelo foi projetado para tarefas de geração de texto, em especial para o estilo de escrita do Shakespeare.
|
13 |
-
Vale ressaltar que existem dois modelos neste repositório. O `llama1-model.pt` é o modelo obtido ao final do treinamento, e o `best-model.pt` é o modelo com os melhores valores das métricas de acurácia e perplexidade.
|
|
|
14 |
|
15 |
## Arquitetura
|
16 |
|
|
|
1 |
+
---
|
2 |
+
metrics:
|
3 |
+
- accuracy
|
4 |
+
- perplexity
|
5 |
+
pipeline_tag: text-generation
|
6 |
+
language:
|
7 |
+
- pt
|
8 |
+
---
|
9 |
|
10 |
# Modelo Llama 1 para Tiny Shakespeare
|
11 |
|
12 |
Este repositório contém um modelo de linguagem Llama 1 com 2.3 milhões de parâmetros treinado no dataset Tiny Shakespeare. O modelo foi projetado para tarefas de geração de texto, em especial para o estilo de escrita do Shakespeare.
|
13 |
+
Vale ressaltar que existem dois modelos neste repositório. O `llama1-model.pt` é o modelo obtido ao final do treinamento, e o `best-model.pt` é o modelo com os melhores valores das métricas de acurácia e perplexidade.
|
14 |
+
Ambos foram testados e o desempenho foi bem similar, logo, é mais conveniente utilizar o `llama1-model.pt`, pois ele foi treinado até a condição de parada ser atingida.
|
15 |
|
16 |
## Arquitetura
|
17 |
|