Update README.md
Browse files
README.md
CHANGED
@@ -1,6 +1,6 @@
|
|
1 |
---
|
2 |
language:
|
3 |
-
-
|
4 |
license: apache-2.0
|
5 |
tags:
|
6 |
- text-generation-inference
|
@@ -12,7 +12,7 @@ base_model: unsloth/mistral-7b-bnb-4bit
|
|
12 |
datasets:
|
13 |
- cnmoro/GPT4-500k-Augmented-PTBR-Clean
|
14 |
widget:
|
15 |
-
- text:
|
16 |
---
|
17 |
|
18 |
# Boto 7B
|
@@ -21,7 +21,9 @@ widget:
|
|
21 |
|
22 |
Boto é um fine-tuning do Mistral 7B para língua portuguesa. O Boto é bem "falante", as respostas tendem a ser longas e nem sempre objetivas por padrão.
|
23 |
|
24 |
-
Acesse a [demonstração online](https://huggingface.co/spaces/lucianosb/boto-7B) disponível.
|
|
|
|
|
25 |
|
26 |
Boto é um nome dado a vários tipos de golfinhos e botos nativos do Amazonas e dos afluentes do rio Orinoco. Alguns botos existem exclusivamente em água doce, e estes são frequentemente considerados golfinhos primitivos.
|
27 |
|
@@ -39,6 +41,48 @@ Boto is a Portuguese name given to several types of dolphins and river dolphins
|
|
39 |
|
40 |
The "boto" of the Amazon River regions of northern Brazil are described according to local lore as taking the form of a human or merman, also known as Boto cor-de-rosa ("Pink Boto" in Portuguese) and with the habit of seducing human women and impregnating them.
|
41 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
42 |
|
43 |
## Métricas
|
44 |
|
|
|
1 |
---
|
2 |
language:
|
3 |
+
- pt
|
4 |
license: apache-2.0
|
5 |
tags:
|
6 |
- text-generation-inference
|
|
|
12 |
datasets:
|
13 |
- cnmoro/GPT4-500k-Augmented-PTBR-Clean
|
14 |
widget:
|
15 |
+
- text: Me conte a história do Boto
|
16 |
---
|
17 |
|
18 |
# Boto 7B
|
|
|
21 |
|
22 |
Boto é um fine-tuning do Mistral 7B para língua portuguesa. O Boto é bem "falante", as respostas tendem a ser longas e nem sempre objetivas por padrão.
|
23 |
|
24 |
+
Acesse a [demonstração online](https://huggingface.co/spaces/lucianosb/boto-7B) disponível. E cante junto:
|
25 |
+
|
26 |
+
[![Foi Boto Sinhá](https://markdown-videos-api.jorgenkh.no/url?url=https%3A%2F%2Fyoutu.be%2FxSyuWFvI9_8%3Fsi%3DSzIMawwQ6sF_xhZK)](https://youtu.be/xSyuWFvI9_8?si=SzIMawwQ6sF_xhZK)
|
27 |
|
28 |
Boto é um nome dado a vários tipos de golfinhos e botos nativos do Amazonas e dos afluentes do rio Orinoco. Alguns botos existem exclusivamente em água doce, e estes são frequentemente considerados golfinhos primitivos.
|
29 |
|
|
|
41 |
|
42 |
The "boto" of the Amazon River regions of northern Brazil are described according to local lore as taking the form of a human or merman, also known as Boto cor-de-rosa ("Pink Boto" in Portuguese) and with the habit of seducing human women and impregnating them.
|
43 |
|
44 |
+
## How to Run on Colab T4
|
45 |
+
|
46 |
+
```python
|
47 |
+
from transformers import AutoTokenizer, pipeline
|
48 |
+
import torch
|
49 |
+
|
50 |
+
model_id = "lucianosb/boto-7B"
|
51 |
+
tokenizer = AutoTokenizer.from_pretrained(model_id)
|
52 |
+
|
53 |
+
pipe = pipeline(
|
54 |
+
"text-generation",
|
55 |
+
model=model_id,
|
56 |
+
torch_dtype=torch.float16,
|
57 |
+
device_map="cuda:0"
|
58 |
+
)
|
59 |
+
|
60 |
+
def make_prompt(question):
|
61 |
+
return f"""Abaixo está uma instrução que descreve uma tarefa, combinada com uma entrada que fornece contexto adicional.
|
62 |
+
Escreva uma resposta que complete adequadamente a solicitação.
|
63 |
+
|
64 |
+
### Instruction:
|
65 |
+
{question}
|
66 |
+
|
67 |
+
### Response:
|
68 |
+
"""
|
69 |
+
|
70 |
+
question = "Conte a história do boto"
|
71 |
+
|
72 |
+
prompt = make_prompt(question)
|
73 |
+
sequences = pipe(
|
74 |
+
prompt,
|
75 |
+
do_sample=True,
|
76 |
+
num_return_sequences=1,
|
77 |
+
eos_token_id=tokenizer.eos_token_id,
|
78 |
+
max_length=2048,
|
79 |
+
temperature=0.9,
|
80 |
+
top_p=0.6,
|
81 |
+
repetition_penalty=1.15
|
82 |
+
)
|
83 |
+
|
84 |
+
print(sequences[0]["generated_text"])
|
85 |
+
```
|
86 |
|
87 |
## Métricas
|
88 |
|