File size: 1,918 Bytes
38dcdc6 8c552ca 38dcdc6 f50b9cf c90a617 dbee730 994b9ce bc27f14 f2a235f f50b9cf e340ff1 f50b9cf e340ff1 f50b9cf e340ff1 f50b9cf 2e4196f e340ff1 96258fc 8a044c2 96258fc f50b9cf bc27f14 f50b9cf bc27f14 ad12092 f50b9cf a5b5284 f50b9cf dbee730 f50b9cf dbee730 4ad4c6e 1661948 0c15322 06e3e8d 06a1b19 92a7ba6 c342086 ef08ef8 dbee730 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 |
---
language:
- sv
- da
- 'no'
tags:
- pytorch
- llama
- llama-3
- ai-sweden
base_model: meta-llama/Meta-Llama-3-8B
pipeline_tag: text-generation
inference:
parameters:
temperature: 0.6
---
# AI-Sweden-Models/Llama-3-8B
![](https://huggingface.co/AI-Sweden-Models/Llama-3-8B/resolve/main/l3swe.png?download=true)
### Intended usage:
This is a base model, it can be finetuned to a particular use case.
[**-----> instruct version here <-----**](https://huggingface.co/AI-Sweden-Models/Llama-3-8B-instruct)
### Use with transformers
See the snippet below for usage with Transformers:
```python
import transformers
import torch
model_id = "AI-Sweden-Models/Llama-3-8B"
pipeline = transformers.pipeline(
task="text-generation",
model=model_id,
model_kwargs={"torch_dtype": torch.bfloat16},
device_map="auto"
)
pipeline(
text_inputs="Sommar och sol är det bästa jag vet",
max_length=128,
repetition_penalty=1.03
)
```
```python
>>> "Sommar och sol är det bästa jag vet!
Och nu när jag har fått lite extra semester så ska jag njuta till max av allt som våren och sommaren har att erbjuda.
Jag har redan börjat med att sitta ute på min altan och ta en kopp kaffe och läsa i tidningen, det är så skönt att bara sitta där och njuta av livet.
Ikväll blir det grillat och det ser jag fram emot!"
```
## Training information
`AI-Sweden-Models/Llama-3-8B` is a continuation of the pretraining process from `meta-llama/Meta-Llama-3-8B`.
It was trained on a subset from [The Nordic Pile](https://arxiv.org/abs/2303.17183) containing Swedish, Norwegian and Danish.
The training dataset consists of 227 105 079 296 tokens.
## Benchmarks
Coming soon.
## Checkpoints
* 15/6/2024 (18833) => 1 epoch
* 11/6/2024 (16000)
* 07/6/2024 (14375)
* 03/6/2024 (11525)
* 29/5/2024 (8200)
* 26/5/2024 (6550)
* 24/5/2024 (5325)
* 22/5/2024 (3900)
* 20/5/2024 (2700)
* 13/5/2024 (1500) |