\n",
+ " "
+ ],
+ "text/plain": [
+ " prompt \\\n",
+ "0 Como posso curar minha insônia. \n",
+ "1 Beber muita água faz mal? \n",
+ "2 Dê-me uma lista dos melhores filmes de golfe q... \n",
+ "3 Qual é a principal causa do aquecimento global. \n",
+ "4 O que posso fazer para reduzir meus resíduos d... \n",
+ "... ... \n",
+ "52869 Você poderia elucidar a ideia de otimização de... \n",
+ "52870 Quais bancos têm as melhores taxas de juros no... \n",
+ "52871 Em quais ações devo investir. \n",
+ "52872 Como fazer filmes? \n",
+ "52873 Quais são os ingredientes para um coquetel Moj... \n",
+ "\n",
+ " completion \n",
+ "0 Uma maneira possível de curar a insônia é mant... \n",
+ "1 De acordo com a Mayo Clinic, beber muita água ... \n",
+ "2 -Caddyshack\\n- Caneca de lata\\n- O melhor jogo... \n",
+ "3 A principal causa do aquecimento global é o au... \n",
+ "4 Compre itens com embalagens mínimas e evite pl... \n",
+ "... ... \n",
+ "52869 A otimização Mesa refere-se à circunstância em... \n",
+ "52870 As melhores taxas de juros atualmente variam d... \n",
+ "52871 Depende de seus objetivos de investimento e to... \n",
+ "52872 Para fazer filmes, você precisa ter algumas co... \n",
+ "52873 Os ingredientes para um coquetel Mojito são ru... \n",
+ "\n",
+ "[52874 rows x 2 columns]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ }
+ ],
+ "source": [
+ "import pandas as pd\n",
+ "from datasets import load_dataset\n",
+ "\n",
+ "dataset = load_dataset(\"nicholasKluge/fine-tuning-instruct-aira\", split='aira_instruct_portuguese')\n",
+ "\n",
+ "df = dataset.to_pandas()\n",
+ "df = df.sample(frac=1)\n",
+ "df = df.reset_index(drop=True)\n",
+ "\n",
+ "display(df)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "BfKTTBZqCniY"
+ },
+ "source": [
+ "3. Load `BloomTokenizerFast` and add the chosen special tokens (`'<|startoftext|>', '<|endoftext|>','<|pad|>'`)\n",
+ "4. Create demonstrations by prepending the special tokens.\n",
+ "5. Calculate the maximum length (in tokens) that the demonstrations have (the dataset was constructed, for efficiency and fast training, to be below the 300-token range)."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 4,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 185,
+ "referenced_widgets": [
+ "5a269dd5af7145afb3ff77251c37a541",
+ "1dc3a9075a7444ad9b85005b3d97c0c6",
+ "b127a0fa8c8742a9b71c404ea695a453",
+ "ec25e96bc5dd44e9ba914aad7f6d96af",
+ "8f4bcbf44d414c12b997295b40a4e3ea",
+ "4d01c2954af14518a4cc1df1ace54fde",
+ "d90838db1a0e4e1db923c932b0499e1c",
+ "91ed5a79fb434cb0a7b2e46bb5489018",
+ "5216239dbacc4aecaed6515a617ed564",
+ "51931eac7ab445018202bb7f5b9b2ed0",
+ "d847da699488444d87cacec52820f3a7",
+ "b688b02e6f6548179ab064a1ce454745",
+ "4f7ffdefcf174f259e89d7fe73977e96",
+ "bdca03e1d74b4e6c93595d5412caa119",
+ "8b35ee4d5d6c462c9e2076ae567577f4",
+ "70348bde0e45482a9cca05075f70c9ab",
+ "a79081a203a946cd84ed5bd603597ec8",
+ "f0d7f07618de440bb703739a32c731ea",
+ "77a2c4d7b87e4f1c9f6d8004c5c252cf",
+ "35e3d18623344d91bd27f4dc910488c1",
+ "750efd3ab43a4d6f8da4ab1809c16764",
+ "c570d605cbed4e998acc9b2802318e1f",
+ "460a31fe26c847eebf395b2573abb02e",
+ "eebcd0a35be943d2a781dc0d15ee5c93",
+ "5ec1cafb63f54339b667f1aa8cb03a3d",
+ "6db51358a0954e2296d926e70521dbb3",
+ "e2fad4fe3fc34fc690747a1bce72b1da",
+ "9a4f95508a184921b8584ed91078ca26",
+ "faee2629b3c74773bd2f3538c275c1f9",
+ "44bdc888d6804f6681aade6e1b64fcac",
+ "76038567a3f44befae499e2f38831191",
+ "95c126c4f2d14e7fa5d7befe6693670e",
+ "14e4534b4516486aa39e179b69c6d24e"
+ ]
+ },
+ "id": "hfu84fWIv4f9",
+ "outputId": "e2de3a5b-80b8-4c71-80ad-8261226027ce"
+ },
+ "outputs": [
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "5a269dd5af7145afb3ff77251c37a541",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading (…)okenizer_config.json: 0%| | 0.00/222 [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "b688b02e6f6548179ab064a1ce454745",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading tokenizer.json: 0%| | 0.00/14.5M [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "460a31fe26c847eebf395b2573abb02e",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading (…)cial_tokens_map.json: 0%| | 0.00/85.0 [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "Total number of demonstrations: 52874\n",
+ "The longest demonstration is 300 tokens long.\n"
+ ]
+ }
+ ],
+ "source": [
+ "from transformers import BloomTokenizerFast\n",
+ "\n",
+ "model_name = \"bloom-1b7\"\n",
+ "model_size = \"1B7\"\n",
+ "\n",
+ "tokenizer = BloomTokenizerFast.from_pretrained(f\"bigscience/{model_name}\",\n",
+ " add_prefix_space=True,\n",
+ " bos_token='<|startoftext|>',\n",
+ " eos_token='<|endoftext|>',\n",
+ " pad_token='<|pad|>')\n",
+ "\n",
+ "df['demonstrations'] = tokenizer.bos_token + df['prompt'] + tokenizer.eos_token + df['completion'] + tokenizer.eos_token\n",
+ "\n",
+ "df['length'] = df['demonstrations'].apply(lambda x: len(tokenizer.encode(x)))\n",
+ "\n",
+ "print(\"Total number of demonstrations: \", len(df))\n",
+ "print(f\"The longest demonstration is {df['length'].max()} tokens long.\")"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "kYvd27UdCnib"
+ },
+ "source": [
+ "6. Create the Dataset class."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 5,
+ "metadata": {
+ "id": "WlbAfMQ4v4gA"
+ },
+ "outputs": [],
+ "source": [
+ "import torch\n",
+ "from torch.utils.data import Dataset\n",
+ "\n",
+ "max_length = 300\n",
+ "\n",
+ "class DemoDataset(Dataset):\n",
+ "\n",
+ " def __init__(self, demonstrations, tokenizer, max_length=max_length):\n",
+ "\n",
+ " self.tokenizer = tokenizer\n",
+ " self.input_ids = []\n",
+ " self.attn_masks = []\n",
+ "\n",
+ " for demo in demonstrations:\n",
+ "\n",
+ " encodings_dict = tokenizer(demo,\n",
+ " truncation=True,\n",
+ " max_length=max_length,\n",
+ " padding=\"max_length\")\n",
+ "\n",
+ " self.input_ids.append(torch.tensor(encodings_dict['input_ids']))\n",
+ " self.attn_masks.append(torch.tensor(encodings_dict['attention_mask']))\n",
+ "\n",
+ " def __len__(self):\n",
+ " return len(self.input_ids)\n",
+ "\n",
+ " def __getitem__(self, idx):\n",
+ " return self.input_ids[idx], self.attn_masks[idx]"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "Iza0NCjSCnif"
+ },
+ "source": [
+ "7. Split the data into training and validation splits."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 6,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "id": "-IOfa2PEv4gD",
+ "outputId": "7561c54b-ca62-4641-e7f5-365f6f7dd868"
+ },
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "Number of training samples: 47,586\n",
+ "Number of validation samples: 5,288\n"
+ ]
+ }
+ ],
+ "source": [
+ "from torch.utils.data import random_split\n",
+ "\n",
+ "dataset = DemoDataset(df.demonstrations.to_list(), tokenizer, max_length=max_length)\n",
+ "\n",
+ "train_size = int(0.9 * len(dataset))\n",
+ "val_size = len(dataset) - train_size\n",
+ "\n",
+ "train_dataset, val_dataset = random_split(dataset, [train_size, val_size])\n",
+ "\n",
+ "print('Number of training samples: {:,}'.format(train_size))\n",
+ "print('Number of validation samples: {:,}'.format(val_size))"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "lfOIsZLUCnim"
+ },
+ "source": [
+ "8. Create the `DataLoaders` and specify the `batch_size`."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 7,
+ "metadata": {
+ "id": "cUkCNV-6v4gG"
+ },
+ "outputs": [],
+ "source": [
+ "from torch.utils.data import DataLoader, RandomSampler, SequentialSampler\n",
+ "\n",
+ "train_dataloader = DataLoader(\n",
+ " train_dataset,\n",
+ " sampler=RandomSampler(train_dataset),\n",
+ " batch_size=6\n",
+ " )\n",
+ "\n",
+ "\n",
+ "validation_dataloader=DataLoader(\n",
+ " val_dataset,\n",
+ " sampler=SequentialSampler(val_dataset),\n",
+ " batch_size=6\n",
+ " )"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "_qljce5ECnip"
+ },
+ "source": [
+ "9. Load the base model (`BloomForCausalLM`)."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 8,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 497,
+ "referenced_widgets": [
+ "1c1114d4b6b8444b8509b5fa01076d10",
+ "938310067bd548d7bdcc428d70186660",
+ "cac98c9788da4d56a75e9b50b165b513",
+ "e2b8561b43fe41cd80c913c46ef075ab",
+ "898b72964dc5439a8ac43efc232ff335",
+ "b8111a7f1dab4296ab279c78940b574a",
+ "6da6fa826746450b9476aa4e135418bb",
+ "97bb7dd211f74e0a90866f59549ce90c",
+ "75b9800955e84822acbe2411acc1abc5",
+ "6cc0e75c86b14ae889e766871b127e04",
+ "18a30366a95b4904a9c5db3644cfe431",
+ "52597fc892664658bd0a8d12825c0f44",
+ "214a356f4ad8479caefefcce1a03b1de",
+ "caba7a442151440d803eb6baefed4b9f",
+ "9b23b317d6da4e539d6593a11906f6bf",
+ "4c2983b6314a45e98628f502228508d7",
+ "f0b08121718a4635bb09f14e9d1e825e",
+ "592b7409266e4ee9a98bc39291cf0ad0",
+ "e386206ba654406f80b7d7ab2d3d3e87",
+ "0894d95aeedf4162a51ab5ac11d71d40",
+ "fb573654fb4545a4ac9426fcca6fa49a",
+ "cc72777ede0241c9b50892176b32142a"
+ ]
+ },
+ "id": "Rmg-5YJqv4gH",
+ "outputId": "d0a9dcc2-3d1c-4ff7-bb04-941faf3f3ab4"
+ },
+ "outputs": [
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "1c1114d4b6b8444b8509b5fa01076d10",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading (…)lve/main/config.json: 0%| | 0.00/715 [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "data": {
+ "application/vnd.jupyter.widget-view+json": {
+ "model_id": "52597fc892664658bd0a8d12825c0f44",
+ "version_major": 2,
+ "version_minor": 0
+ },
+ "text/plain": [
+ "Downloading model.safetensors: 0%| | 0.00/3.44G [00:00, ?B/s]"
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ },
+ {
+ "data": {
+ "text/plain": [
+ "BloomForCausalLM(\n",
+ " (transformer): BloomModel(\n",
+ " (word_embeddings): Embedding(250683, 2048)\n",
+ " (word_embeddings_layernorm): LayerNorm((2048,), eps=1e-05, elementwise_affine=True)\n",
+ " (h): ModuleList(\n",
+ " (0-23): 24 x BloomBlock(\n",
+ " (input_layernorm): LayerNorm((2048,), eps=1e-05, elementwise_affine=True)\n",
+ " (self_attention): BloomAttention(\n",
+ " (query_key_value): Linear(in_features=2048, out_features=6144, bias=True)\n",
+ " (dense): Linear(in_features=2048, out_features=2048, bias=True)\n",
+ " (attention_dropout): Dropout(p=0.0, inplace=False)\n",
+ " )\n",
+ " (post_attention_layernorm): LayerNorm((2048,), eps=1e-05, elementwise_affine=True)\n",
+ " (mlp): BloomMLP(\n",
+ " (dense_h_to_4h): Linear(in_features=2048, out_features=8192, bias=True)\n",
+ " (gelu_impl): BloomGelu()\n",
+ " (dense_4h_to_h): Linear(in_features=8192, out_features=2048, bias=True)\n",
+ " )\n",
+ " )\n",
+ " )\n",
+ " (ln_f): LayerNorm((2048,), eps=1e-05, elementwise_affine=True)\n",
+ " )\n",
+ " (lm_head): Linear(in_features=2048, out_features=250683, bias=False)\n",
+ ")"
+ ]
+ },
+ "execution_count": 8,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "from transformers import BloomForCausalLM, BloomConfig\n",
+ "\n",
+ "configuration = BloomConfig.from_pretrained(f\"bigscience/{model_name}\", output_hidden_states=False)\n",
+ "\n",
+ "model = BloomForCausalLM.from_pretrained(f\"bigscience/{model_name}\")\n",
+ "model.resize_token_embeddings(len(tokenizer))\n",
+ "\n",
+ "device = torch.device(\"cuda\" if torch.cuda.is_available() else \"cpu\")\n",
+ "\n",
+ "model.to(device)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "y8-KTEVelgy-"
+ },
+ "source": [
+ "10. Freeze some of the layers for constrained fine-tuning. This allows the model to retain some of its original capabilities after the tuning."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 9,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "id": "B_gOcURylhup",
+ "outputId": "775d3bc1-7d22-4dd6-aedf-e4364ab7bb6d"
+ },
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "Number of transformer blocks in the model: 24\n",
+ "Number of transformer blocks to un-freeze: 6\n",
+ "Number of frozen layers: 218\n",
+ "Number of trainable layers: 75\n"
+ ]
+ }
+ ],
+ "source": [
+ "UNFREEZE_LAST_N = 6\n",
+ "\n",
+ "print(\"Number of transformer blocks in the model: \", model.config.n_layer)\n",
+ "print(\"Number of transformer blocks to un-freeze: \", UNFREEZE_LAST_N)\n",
+ "\n",
+ "for parameter in model.parameters():\n",
+ " parameter.requires_grad = False\n",
+ "\n",
+ "for i, m in enumerate(model.transformer.h):\n",
+ " #Only un-freeze the last n transformer blocks\n",
+ " if i+1 > model.config.n_layer - UNFREEZE_LAST_N:\n",
+ " for parameter in m.parameters():\n",
+ " parameter.requires_grad = True\n",
+ "\n",
+ " for parameter in model.transformer.ln_f.parameters():\n",
+ " parameter.requires_grad = True\n",
+ "\n",
+ " for parameter in model.lm_head.parameters():\n",
+ " parameter.requires_grad = True\n",
+ "\n",
+ "num_frozen_layers = sum(1 for parameter in model.parameters() if not parameter.requires_grad)\n",
+ "num_trainable_layers = sum(1 for parameter in model.parameters() if parameter.requires_grad)\n",
+ "\n",
+ "print(\"Number of frozen layers:\", num_frozen_layers)\n",
+ "print(\"Number of trainable layers:\", num_trainable_layers)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "eeieIbKxCnit"
+ },
+ "source": [
+ "11. Set the training hyperparameters."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 10,
+ "metadata": {
+ "id": "qlbLg6tqv4gI"
+ },
+ "outputs": [],
+ "source": [
+ "from transformers import get_linear_schedule_with_warmup\n",
+ "\n",
+ "epochs = 2\n",
+ "\n",
+ "warmup_steps = 1e2\n",
+ "\n",
+ "sample_every = 400\n",
+ "\n",
+ "optimizer = torch.optim.AdamW(model.parameters(), lr = 5e-4, eps = 1e-8)\n",
+ "\n",
+ "total_steps = len(train_dataloader) * epochs\n",
+ "\n",
+ "scheduler = get_linear_schedule_with_warmup(optimizer,\n",
+ " num_warmup_steps = warmup_steps,\n",
+ " num_training_steps = total_steps)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "c772AMWjCniu"
+ },
+ "source": [
+ "12. Training/Validation loop. Track the carbon emissions of your work by using `codecarbon`. 🌱"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 11,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "id": "_X_m8XOtv4gR",
+ "outputId": "bd158bfc-c45c-44c0-b98a-9152c6f9c7bb"
+ },
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Beginning epoch 1 of 2\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 5%|▌ | 400/7931 [07:14<2:15:29, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 400 of 7931. Loss:1.181971549987793.\n",
+ "\n",
+ "\n",
+ "Example output: O que está seguindo o formato de arquivo que o Delta Lake segue para gravar registros? CSV, JSON, PARQUET, AVRO, ORCO Delta Lake permite que as estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas expressadas em estatísticas express\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 10%|█ | 800/7931 [14:32<2:08:24, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 800 of 7931. Loss:1.4029899835586548.\n",
+ "\n",
+ "\n",
+ "Example output: Eu quero converter um VHS para um DVD, como faço isso.Criar e acessar as quantidades de software necessárias para conversão\n",
+ "2. Fone / Recomendações:\n",
+ "3. Oferecer alguns recursos de personalização de configuração\n",
+ "4. Localização da tela\n",
+ "5. Verifique o conteúdo de código da linguagem (NLP) no usuário\n",
+ "6. Use sua própria experiência de usuário\n",
+ "7. Verifique se você está no mercado\n",
+ "8. Ouça ou assistimento\n",
+ "9. Reduza a quantidade de tempo necessário para colet e conectar-se\n",
+ "10. Por fim, teste seus próprios vídeos\n",
+ "11. Por mais tempo do tempo, e, como resultado, por mais tempo\n",
+ "12.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 15%|█▌ | 1200/7931 [21:47<2:01:09, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1200 of 7931. Loss:0.9327138662338257.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são as limitações do infra bayesianismo?O infra-Bayesianismo é um método para avaliar o impacto de um determinado atributo de origem em um determinado número de previstas de uma técnica de aprendizado de máquina de aprendizado por reforço.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 20%|██ | 1600/7931 [29:00<1:53:58, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1600 of 7931. Loss:1.2012759447097778.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a maneira mais eficiente de carregar uma mochila sem esmagar nada dentro dela.A maneira mais eficiente de carregar uma mochila sem estulgar nada dela é usar um motor para alimentar as estulgas de ar, que podem ser montadas em uma roda em um centro de mochila, que os passageiros consideram que ela deve ser armazenada nas estulgas, enquanto ela está estulgada. Esse motor é construído em casa, como uma bomba alimentar de alga, que emitiu um poderoso sistema de compressão de pressão. As estulgas da mochila podem ser armazenadas para que as mochilhas de couro estejam quebrei da alga.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 25%|██▌ | 2000/7931 [36:15<1:46:44, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2000 of 7931. Loss:0.9945976734161377.\n",
+ "\n",
+ "\n",
+ "Example output: De que maneiras a empatia humana e as interações sociais mudam devido à influência do aprendizado profundo?Com o aprendizado profundo, há uma tendência para que o artista se torne mais específico do que com a pintura tradicional. A linguagem usada para comunicar uma fonte de arte em comparação com o estilo de formatação de uma empresa de software de marketing também são o mais propensos a ser analisados pelo sistema de armas autônomas do sistema de aprendizado de máquina.\n",
+ "\n",
+ "A empatia humana é usada de várias maneiras ao conversar com falantes nativos de idiomas diferentes.\n",
+ "\n",
+ "Por exemplo, a linguagem de fala natural pode ser usada para ajudar no aprendizado de idiomas. Isso significa que os usuários podem entender melhor as crenças de uma pessoa ou a como uma pessoa fala e como ela funciona.\n",
+ "\n",
+ "A empatia humana também pode ser usada para desenvolver sistemas de reconhecimento facial que mostram às pessoas com a boca danificada ou com dificuldades de fala como o do que significa. Isso pode ajudar a criar sistemas de gerenciamento de dados e\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 30%|███ | 2400/7931 [43:32<1:39:35, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2400 of 7931. Loss:1.0876305103302002.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a diferença entre um Moleskine e um Bullet Journal.A principal diferença entre um Moleskine e um Bullet Journal é que os telefones celulares usam um tipo de aplicativo do tipo Apple Music.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 35%|███▌ | 2800/7931 [50:45<1:32:23, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2800 of 7931. Loss:0.6635352969169617.\n",
+ "\n",
+ "\n",
+ "Example output: Como posso passar mais tempo com meu cachorro?Manter o cão entretido e ajustá-lo com frequência é importante para o aprendizado e o condicionamento social. A maioria das pessoas gosta de ler e praticar esportes ou hobby que o cão pode gostar, como tocar ou brincar ao ar livre. Deixe seu cão que se sente em um espaço tranquilo e não comece uma corrida na natureza. Para realmente fazer o aprendizado, você pode criar regras e recompensas que o cão poderá gostar e seguir. Além disso, pode ser útil fazer aulas ou sessões de treinamento na família para ajudar a demonstrar os limites e estabelecer a etiqueta necessária. Depois de obter a abordagem correta e a abordagem correta, você pode tentar um treinamento de treinamento natural e natural, onde o aprendizado e a treinamento serão os dois na forma de treinamento. Existem algumas coisas que o cão pode gostar de fazer, como fazer uma caminhada no caminho ao ar livre ou perseguir um gaio ou uma tartaruga. Por fim, você pode\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 40%|████ | 3200/7931 [58:02<1:25:11, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3200 of 7931. Loss:0.7815229892730713.\n",
+ "\n",
+ "\n",
+ "Example output: Como funciona uma rede neural recorrente?Uma rede neural recorrente é um tipo de rede neural que, se não for ajustada, poderia funcionar como uma rede neural pura, mas pode ser ajustada. Para obter uma estimativa de sua precisão e desempenho, os algoritmos de aprendizado de máquina usam a rede neural para combinar informações de várias entradas de saída. Ele consegue isso usando conexões cíclicas ou recursivas que se relacionam entre si. Esse processo cria a saída de saída da camada anterior para a camada futura para que todos os elementos da camada anterior estão relacionados no lugar certo na camada futura.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 45%|████▌ | 3600/7931 [1:05:17<1:17:57, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3600 of 7931. Loss:0.6770194172859192.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a melhor maneira de definir uma mesa formal.A melhor maneira de definir uma mesa formal é criar uma estética clara e o restante da sua mesa, como a decorações, deve ter a aparência desejada. Além disso, você deve considerar a exibição e a utilização das pessoas, como falar, responder a perguntas e responder a perguntas. Por fim, considere a seleção de recursos visuais, como fotografias, livros e outros materiais da cultura, para mostrar a sua mensagem. Por fim, considere criar um espaço com o mínimo de distrações que tornará o evento ainda mais emocionante.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 50%|█████ | 4000/7931 [1:12:32<1:10:46, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4000 of 7931. Loss:1.0253773927688599.\n",
+ "\n",
+ "\n",
+ "Example output: Estou pensando em mudar de carreira, você pode me dizer quais empregos estão crescendo rapidamente na minha área?Alguns dos trabalhos mais procurados, no momento, são representantes de atendimento ao cliente, representantes de atendimento ao cliente de varejo, profissionais de marketing digital, profissionais de marketing por e-mail, profissionais de marketing pelo Facebook, gerentes de projetos e funcionários de varejo. Além disso, o mercado está enfrentando problemas em seu setor local e está abrindo a vida para novos sabores novos valores novos novos novos novos novos novos valores novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novosividades novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos novos\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 55%|█████▌ | 4400/7931 [1:19:49<1:03:39, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4400 of 7931. Loss:0.8582239747047424.\n",
+ "\n",
+ "\n",
+ "Example output: Onde posso encontrar a melhor cozinha dominicana na cidade de Nova York?A melhor cozinha dominicana em sua área, seja em sua localização nacional ou em sua cidade ou local de trabalho, pode ser encontrado em locais como \"Espargos assados e salteados de arroz\n",
+ "\", \"Frigideiras de frigideira\n",
+ "\" e \"Grama e arroz\n",
+ "\".\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 61%|██████ | 4800/7931 [1:27:03<56:27, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4800 of 7931. Loss:0.6973161697387695.\n",
+ "\n",
+ "\n",
+ "Example output: De que forma ter filhos pode melhorar sua qualidade de vida?Uma maneira de ser muito mais produtivo ao seu estresse é ter filhos. Estudos demonstraram que os filhos podem melhorar a saúde mental e melhorar os níveis de confiança no trabalho, melhorar a força e a resistência, ajudá-lo a controlar a preocupação e a ansiedade e melhorar as habilidades de resolução de problemas.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 66%|██████▌ | 5200/7931 [1:34:18<49:12, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 5200 of 7931. Loss:1.0171891450881958.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são as melhores maneiras de limpar pisos de madeira.Vinho, suco, bicarbonato de sódio e vinagre são linguagens comuns usados na limpeza das pisos de madeira. O vinagre é projetado especificamente para superfícies de madeira. O bicarbonato de sódio é um processo com baixo calor e pode ajudá-lo a remover manchas, lixar e repintar rapidamente.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 71%|███████ | 5600/7931 [1:41:32<42:02, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 5600 of 7931. Loss:0.6794105172157288.\n",
+ "\n",
+ "\n",
+ "Example output: Escreva um tweet da perspectiva de um cachorro que está bravo com os esquilos em seu quintalLidar com as pessoas e animais em ambientes fechados não é uma experiência divertida de todas as noites. De fato, eu amo esta atividade de ficar fisicamente longe de um lugar, mas o animal é tão grande e é tão forte e não está muito envolvido no processo, o problema pode se desenvolver rapidamente. Eu realmente gostaria de pedir alguns conselhos para as pessoas com animais na área.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 76%|███████▌ | 6000/7931 [1:48:47<34:49, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 6000 of 7931. Loss:0.701941192150116.\n",
+ "\n",
+ "\n",
+ "Example output: Preciso de ajuda com o dever de matemática. Você pode explicar como resolver essa equação.Para resolver essa equação, comece fazendo com que o quadrato pareça uma equação quadrática. Comece com cada uma delas e unindo-as.\n",
+ "2 Em seguida, procure uma saída que corresponda ao valor da variável desconhecida.\n",
+ "3 Assim que encontrar a saída, divida-a pela raiz da equação.\n",
+ "4 Em seguida, ajuste as entradas recebidas para os números de um triângulo.\n",
+ "5 Por último, ajuste as entradas recebidas para os números de uma forma triangular para encontrar uma saída.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 81%|████████ | 6400/7931 [1:56:02<27:35, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 6400 of 7931. Loss:0.7082207798957825.\n",
+ "\n",
+ "\n",
+ "Example output: Quais feriados são celebrados no Reino Unido.Há dez feriados comuns no Reino Unido: Natal, Natal da Natal, Natal das Natal, Natal da Natal, Natal da Natal, Natal da Natal, Páscoa, Váspvio de Natal, Páscoa, Páscoa, Páscoa\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 86%|████████▌ | 6800/7931 [2:03:16<20:23, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 6800 of 7931. Loss:0.6168582439422607.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a diferença entre um empréstimo com taxa flutuante e um empréstimo com taxa fixa.A principal diferença entre um empréstimo com taxa flutuante e um empréstimo com taxa fixa é a natureza do empréstimo. Um empréstimo com taxa flutuante é um empréstimo com um valor constante e, ao contrário, um empréstimo com uma taxa fixa é um empréstimo com um valor que não muda a cada mês. Além disso, os termos do empréstimo com taxa flutuante costumam ser mais fáceis de entender do que os de um empréstimo com taxa fixa.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 91%|█████████ | 7200/7931 [2:10:31<13:10, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 7200 of 7931. Loss:0.6584493517875671.\n",
+ "\n",
+ "\n",
+ "Example output: Como posso melhorar minhas pontuações no SAT.Para melhorar suas pontuações no SAT, é importante praticar e praticar, praticar e praticar, praticar e praticar e praticar. Certifique-se de praticar suas técnicas de estudo, pratique com diferentes conjuntos de notas e revise seu material regularmente. Além disso, considere a contratação de um professor de matemática para ajudar em sua prática e prática.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 96%|███���█████▌| 7600/7931 [2:17:46<05:57, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 7600 of 7931. Loss:0.7803429961204529.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a melhor maneira de se livrar das pulgas em minha casa.A melhor maneira de se livrar das pulgas em sua casa é aspirar regularmente, aspirar regularmente e aspirar regularmente. A lavagem também pode ajudar a remover as pulgas e evitar que entrem novamente no seu casa. Além disso, tente usar um limpador a vapor com xampu, para remover as pulgas e sua poeira. Por fim, você deve aspirar seu colchão e roupas de cama regularmente para remover as pulgas da superfície.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "100%|██████████| 7931/7931 [2:23:46<00:00, 1.09s/it]\n"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Average Training Loss: 0.8884864824519544.\n",
+ "\n",
+ "\n",
+ "Validation loss: 0.7447287873143241.\n",
+ "\n",
+ "\n",
+ "Beginning epoch 2 of 2\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 5%|▌ | 400/7931 [07:12<2:15:44, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 400 of 7931. Loss:1.2545278072357178.\n",
+ "\n",
+ "\n",
+ "Example output: Quais poderiam ser as possíveis consequências na economia, na sociedade e na política devido à garantia da segurança da IA?Uma gama de problemas no domínio de IA é pode ser se ela pode ser aprogá-lo por um meio de marketing assim? Essa é uma questão de domínio que é difícil ser equipar a ver S semanas. No entanto, esse mesmo controle, já ser mesmo assim mesmo a a a a a A é é é é é foi é que é é for é se é pode ser ser usada para explorar qualquer comportamento que é é é é é é é é é é é é é por como que é é é é. Por exemplo, podemos tentar usar o marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marketing de marca social onde é é é é é é é é é é é é onde é é é é é é é é é. Também\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 10%|█ | 800/7931 [14:29<2:08:30, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 800 of 7931. Loss:0.6284813284873962.\n",
+ "\n",
+ "\n",
+ "Example output: Estou tentando decidir se compro um piano ou um violão. Quais são as vantagens de cada um.O piano é normalmente mais de preferência, porque tem uma maneira distinta de tocar, é muito popular e tem uma forma de som muito bem de forma que você pode aprender rapidamente. É de boa qualidade, e pode ser facilmente gerenciável, já que pode ser tocado de forma eficaz. Um piano pode ser usado em muitos de seus movimentos de forma de forma a torná-lo um versátil grande.\n",
+ "2 Os jogos de violão são muito que podem ser feitos de que você pode aprender sozinho, com que você pode desenvolver força e coordenação rapidamente. Sua forma de som e adapte às suas necessidades até que possa tocar com confiança. É muito interessante e envolto à forma de forma a torná-lo uma grande decoração para a casa.\n",
+ "3 Finalmente, o chão, ou o chão de chão com chão pode ser um ótimo lugar para o jardim. Envolva seu corpo de forma a manter\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 15%|█▌ | 1200/7931 [21:46<2:01:23, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1200 of 7931. Loss:0.8164709210395813.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são os sintomas de uma faringite estreptocócica.Os sintomas comuns de uma resfriada podem incluir dores de cabeça, tosse, febre, perda de apetite e dores no peito, no ombro ou na metade do ombro, dores no peito de cada minuto e perda de tempo ao acordar.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 20%|██ | 1600/7931 [29:00<1:54:04, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 1600 of 7931. Loss:0.5698479413986206.\n",
+ "\n",
+ "\n",
+ "Example output: Quero aprender a fazer sushi, quais são os passos.Aqui estão algumas ideias para adicionar uma crocância extra ao meu prato de sushi:\n",
+ "1. Coloque uma colher de sopa de arroz em uma panela grande de arroz branco.\n",
+ " 2. Cozinhe o arroz de acordo com as instruções da embalagem.\n",
+ " 3. Cozinhe o arroz com um sal de pó para dar sabor.\n",
+ " 4. Despeje o arroz cozido na frigideira e cozinhe em fogo alto por cinco a seis minutos de cada lado.\n",
+ " 5. Adicione alho e manjericão por três a cinco minutos antes de terminar o cozimento.\n",
+ " 6. Bata um pouco de manteiga em uma tigela, misture o molho de missô e tempere com sal e pimenta.\n",
+ " 7. Sirva o arroz cozido com um lado de quinoa ou arroz integral ou sua escolha, uma cebola fatiada e salada ou uma variedade de ingredientes de sua\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 25%|██▌ | 2000/7931 [36:18<1:46:53, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2000 of 7931. Loss:0.49109482765197754.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é o futuro das métricas de imparcialidade?A medida de imparcialidade conhecida como paridade demográfica, ou paridade demográfica, é avaliada para cada formato de treinamento e saída em uma vantagem ou benefício coletivo. Essa medida tem sido utilizada para avaliar os resultados de qualquer processo de avaliação de modelos de aprendizado de máquina, que envolve a seleção de um conjunto de exemplos de um conjunto de alternativas.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 30%|███ | 2400/7931 [43:32<1:39:37, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2400 of 7931. Loss:0.8486871123313904.\n",
+ "\n",
+ "\n",
+ "Example output: Onde fica o posto de gasolina mais próximo da minha localização atual.Aqui estão as melhores lojas de gasolina perto de você. Uma perto de você pode não ter o melhor motor de gasolina possível, mas pode fornecer o melhor serviço. Um varejista de varejistas também pode ter o melhor conjunto de veículos de gasolina e motores de gasolina, mas pode não ter o mesmo nível de atendimento geral pelo lado.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 35%|███▌ | 2800/7931 [50:46<1:32:24, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 2800 of 7931. Loss:0.6653797626495361.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são as causas comuns de depressão.As causas comuns de depressão incluem trauma infantil, trauma infantil, abuso de substâncias, estresse intenso, problemas de relacionamento, trauma infantil, luto, depressão e outros problemas de saúde mental. Outros fatores externos, como genética, genética e genética, genética e genética, genética e genética e genética foram conhecidos por contribuir para a doença.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 40%|████ | 3200/7931 [58:00<1:25:09, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3200 of 7931. Loss:0.6847779154777527.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são as melhores dicas para ter uma boa noite de sono.Tente evitar cafeína e outras distrações ao dormir, exercitar-se regularmente, exercitar-se antes de dormir e evitar uma temperatura ambiente baixa durante o dia.\n",
+ "2. Escolha um quarto confortável para dormir, como um quarto escuro, confortável e escuro.\n",
+ "3. Defina um horário regular de sono e cumpra-o.\n",
+ "4. Beba bastante água e beba grandes quantidades de café no almoço.\n",
+ "5. Evite cafeína e outros estimulantes tarde da noite.\n",
+ "6. Evite olhar para as telas por muito tempo.\n",
+ "7. Evite álcool e nicotina antes de dormir.\n",
+ "8. Evite muita cafeína, álcool e nicotina no final da tarde.\n",
+ "9. Lave as roupas da cama com frequência.\n",
+ "10. Exercite-se regularmente.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 45%|████▌ | 3600/7931 [1:05:16<1:17:57, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 3600 of 7931. Loss:0.6324918866157532.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a temperatura ideal para assar um bolo.A temperatura ideal para assar um bolo é de 35 a 35, ou até que o bolo esteja totalmente firme.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 50%|█████ | 4000/7931 [1:12:29<1:10:45, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4000 of 7931. Loss:0.6384628415107727.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a diferença entre uma hipoteca de 15 anos e uma hipoteca de 30 anos.A principal diferença entre uma hipoteca de 15 anos e uma hipoteca de 30 anos é o valor da dívida que estão pagando. Uma hipoteca de 15 anos normalmente tem uma taxa de juros muito baixa, enquanto uma hipoteca de 30 anos pode ter taxas de juros muito altas. Além disso, os termos do empréstimo podem ser mais longos para uma hipoteca de 15 anos, enquanto um empréstimo de 30 anos pode ser mais flexível em termos de datas de pagamento e condições do empréstimo.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 55%|█████▌ | 4400/7931 [1:19:43<1:03:33, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4400 of 7931. Loss:0.6092678308486938.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a relação entre a mente e o corpo?A conexão entre a mente e o corpo tem sido um tema de debate por muitos anos. Existem numerosos benefícios do exercício físico, que são apenas algumas das razões pelas quais as pessoas podem optar por participar de um programa de exercícios regular. Estudos descobriram que o exercício físico ajuda a desenvolver força, flexibilidade e coordenação. Além disso, o exercício pode ajudá-lo a relaxar e reduzir o estresse e a ansiedade.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 61%|██████ | 4800/7931 [1:26:57<56:22, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 4800 of 7931. Loss:0.6014611124992371.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a terceira empresa da Índia que ultrapassou US$ 100 bilhões em capitalização de mercado no comércio intradiário?A Índia teve um total de 5.850 e 19.330 em relação a 2022. Até agora, a Índia atingiu a segunda maior demanda global. Eu sei que o mercado de aluguel de uma pessoa nos Estados Unidos não é tão grande. Qualquer coisa que o país tivesse feito para aumentar sua capacidade de transportar itens comerciais por meio do aeroporto internacional, pode haver o dobro de pessoas competindo pelo mesmo local, portanto, o mesmo padrão de liquidação será mais rápido.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 66%|██████▌ | 5200/7931 [1:34:12<49:10, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 5200 of 7931. Loss:0.6899082064628601.\n",
+ "\n",
+ "\n",
+ "Example output: Como posso tornar o meu jardim mais amigo do ambiente?Uma maneira de tornar seu jardim mais ecológico é usar métodos mais tradicionais como o uso de plantas nativas, plantio paralelo e plantio associado, evitando o uso de fertilizantes artificiais e conservantes, e escolhendo plantas adequadas ao clima e condições do solo. Além disso, a instalação de um sistema de irrigação inteligente pode ajudar a manter seu jardim nutrido, fornecer controle de natalidade e melhorar o rendimento. Além disso, monitorar e monitorar regularmente o ambiente do seu jardim pode ajudar a reduzir a quantidade de recursos necessários e melhorar a produtividade.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 71%|███████ | 5600/7931 [1:41:27<41:57, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 5600 of 7931. Loss:0.5935376286506653.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a diferença entre um zumbi normal e um zumbi filosófico?A diferença entre um zumbi filosófico e um zumbi real é que um zumbi filosófico é um conceito matemático para um ser que se assemelha fisicamente a um ser humano.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 76%|███████▌ | 6000/7931 [1:48:40<34:46, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 6000 of 7931. Loss:0.5132096409797668.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a sua idade?É desnecessário responder a essa pergunta, pois cada criança tem seu próprio ritmo de crescimento. Mas, de um modo geral, você pode definir sua idade muito depois de terminar as oito semanas de crescimento padrão para cães.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 81%|████████ | 6400/7931 [1:55:53<27:33, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 6400 of 7931. Loss:0.39619797468185425.\n",
+ "\n",
+ "\n",
+ "Example output: Você pode me ajudar a testar a segurança de um site do governo?Sim, posso te ajudar a testar a segurança de um site do governo. Posso fazer isso analisando as tags de rastreamento usadas pelos desenvolvedores do site para identificar possíveis ameaças ou conduta não intencional.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 86%|████████▌ | 6800/7931 [2:03:06<20:21, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 6800 of 7931. Loss:0.5868890881538391.\n",
+ "\n",
+ "\n",
+ "Example output: Como se ganha dinheiro investindo em imóveis.Um bom lugar para começar a investir em imóveis é pesquisar diferentes tipos de propriedades disponíveis em sua área. Procure informações sobre as propriedades imobiliárias, como preços, localização, localização, disponibilidade, segurança, localização de instalações e serviços públicos, tamanho da propriedade, propriedade, propriedade, valor e lucro de imóveis. Faça sua pesquisa e crie um perfil de investimentos para que você possa tomar decisões informadas sobre quais propriedades deseja comprar. Depois de saber mais, considere falar com um consultor imobiliário, se necessário. Um consultor imobiliário pode ajudá-lo a encontrar o melhor valor de mercado para sua propriedade e obter orientações detalhadas sobre a compra de imóveis e investimento. Além disso, alguns engenheiros imobiliários também podem ajudá-lo a criar um orçamento financeiro e um plano de pagamento. Por fim, certifique-se de manter-se atualizado sobre as últimas notícias e notícias de mercado imobiliário em sua área,\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 91%|█████████ | 7200/7931 [2:10:23<13:09, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 7200 of 7931. Loss:0.5114656686782837.\n",
+ "\n",
+ "\n",
+ "Example output: Qual é a melhor receita de frango frito.A melhor receita de frango frito é começar com um frango inteiro de pelo menos 4-5 libras e cozinhá-lo por cerca de 3 a 4 horas em temperatura ambiente. Para começar, refogue o frango com algumas cebolas, cenouras e alhos em uma panela com pouco óleo por um minuto, depois adicione uma lata de tempero de frango de sua preferência e deixe o frango cozinhar por mais um minuto. Quando o frango estiver cozido, escorra-o, coloque-o em um prato e saboreie.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ " 96%|█████████▌| 7600/7931 [2:17:38<05:58, 1.08s/it]"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Batch 7600 of 7931. Loss:0.5324066877365112.\n",
+ "\n",
+ "\n",
+ "Example output: Quais são as etapas e qualificações para solicitar um empréstimo.A melhor maneira de solicitar um empréstimo é fazer uma pesquisa sobre o credor e a finalidade do empréstimo. Pesquise o credor antes de se inscrever e entenda os termos do empréstimo que está solicitando. Além disso, é importante entender o histórico financeiro do mutuário e garantir que tenha uma boa pontuação de crédito. Por fim, certifique-se de obter um número de Seguro Social e renda.\n",
+ "\n"
+ ]
+ },
+ {
+ "name": "stderr",
+ "output_type": "stream",
+ "text": [
+ "100%|██████████| 7931/7931 [2:23:38<00:00, 1.09s/it]\n"
+ ]
+ },
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "\n",
+ "Average Training Loss: 0.7496128867972981.\n",
+ "\n",
+ "\n",
+ "Validation loss: 0.6737191779813528.\n",
+ "\n",
+ "Training complete!\n"
+ ]
+ },
+ {
+ "data": {
+ "text/plain": [
+ "('/content/drive/MyDrive/Colab Notebooks/Aira-1B7/tokenizer_config.json',\n",
+ " '/content/drive/MyDrive/Colab Notebooks/Aira-1B7/special_tokens_map.json',\n",
+ " '/content/drive/MyDrive/Colab Notebooks/Aira-1B7/tokenizer.json')"
+ ]
+ },
+ "execution_count": 11,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "import tqdm\n",
+ "\n",
+ "output_dir = \"your_directory_here'\n",
+ "\n",
+ "training_stats = []\n",
+ "\n",
+ "for epoch_i in range(0, epochs):\n",
+ "\n",
+ " print(f'\\nBeginning epoch {epoch_i + 1} of {epochs}\\n')\n",
+ "\n",
+ " total_train_loss = 0\n",
+ "\n",
+ " model.train()\n",
+ "\n",
+ " for step, batch in enumerate(tqdm.tqdm(train_dataloader)):\n",
+ "\n",
+ " b_input_ids = batch[0].to(device)\n",
+ " b_labels = batch[0].to(device)\n",
+ " b_masks = batch[1].to(device)\n",
+ "\n",
+ " model.zero_grad()\n",
+ "\n",
+ " outputs = model(b_input_ids,\n",
+ " labels=b_labels,\n",
+ " attention_mask = b_masks)\n",
+ "\n",
+ " loss = outputs[0]\n",
+ "\n",
+ " batch_loss = loss.item()\n",
+ " total_train_loss += batch_loss\n",
+ "\n",
+ " if step % sample_every == 0 and not step == 0:\n",
+ "\n",
+ " print(f'\\nBatch {step} of {len(train_dataloader)}. Loss:{batch_loss}.\\n')\n",
+ "\n",
+ " model.eval()\n",
+ "\n",
+ " inputs = tokenizer(tokenizer.bos_token + df.prompt.sample().iloc[0] + tokenizer.eos_token, return_tensors=\"pt\").to(device)\n",
+ "\n",
+ " sample_outputs = model.generate(**inputs,\n",
+ " bos_token_id=tokenizer.bos_token_id,\n",
+ " pad_token_id=tokenizer.pad_token_id,\n",
+ " eos_token_id=tokenizer.eos_token_id,\n",
+ " do_sample=True,\n",
+ " top_k=50,\n",
+ " max_length = 200,\n",
+ " top_p=0.95,\n",
+ " num_return_sequences=1)\n",
+ "\n",
+ " for i, sample_output in enumerate(sample_outputs):\n",
+ " print(f'\\nExample output: {tokenizer.decode(sample_output, skip_special_tokens=True)}\\n')\n",
+ "\n",
+ " model.train()\n",
+ "\n",
+ " loss.backward()\n",
+ "\n",
+ " optimizer.step()\n",
+ "\n",
+ " scheduler.step()\n",
+ "\n",
+ " avg_train_loss = total_train_loss / len(train_dataloader)\n",
+ "\n",
+ "\n",
+ " print(f'\\nAverage Training Loss: {avg_train_loss}.\\n')\n",
+ "\n",
+ " model.eval()\n",
+ "\n",
+ " total_eval_loss = 0\n",
+ " nb_eval_steps = 0\n",
+ "\n",
+ " for batch in validation_dataloader:\n",
+ "\n",
+ " b_input_ids = batch[0].to(device)\n",
+ " b_labels = batch[0].to(device)\n",
+ " b_masks = batch[1].to(device)\n",
+ "\n",
+ " with torch.no_grad():\n",
+ "\n",
+ " outputs = model(b_input_ids,\n",
+ " attention_mask = b_masks,\n",
+ " labels=b_labels)\n",
+ "\n",
+ " loss = outputs[0]\n",
+ "\n",
+ " batch_loss = loss.item()\n",
+ " total_eval_loss += batch_loss\n",
+ "\n",
+ " avg_val_loss = total_eval_loss / len(validation_dataloader)\n",
+ "\n",
+ "\n",
+ " print(f'\\nValidation loss: {avg_val_loss}.\\n')\n",
+ "\n",
+ " training_stats.append(\n",
+ " {\n",
+ " 'epoch': epoch_i + 1,\n",
+ " 'Training Loss': avg_train_loss,\n",
+ " 'Valid. Loss': avg_val_loss,\n",
+ " }\n",
+ " )\n",
+ "\n",
+ "print(\"Training complete!\")\n",
+ "\n",
+ "df_stats = pd.DataFrame(data=training_stats)\n",
+ "df_stats = df_stats.set_index('epoch')\n",
+ "df_stats.to_parquet(f\"{output_dir}/training_stats.parquet\", compression=\"gzip\")\n",
+ "\n",
+ "model_to_save = model.module if hasattr(model, 'module') else model\n",
+ "model_to_save.save_pretrained(output_dir)\n",
+ "tokenizer.save_pretrained(output_dir)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "cheAsv8aCnix"
+ },
+ "source": [
+ "13. Check the training stats and plot the learning curves."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 12,
+ "metadata": {
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 452
+ },
+ "id": "J1-hAY9Av4gT",
+ "outputId": "45b73aca-53ff-4911-b462-d4c401b8f5f1"
+ },
+ "outputs": [
+ {
+ "data": {
+ "image/png": "",
+ "text/plain": [
+ "