psetialana
/

personalized_llama3-8b-cpt-sahabatai-v1-instruct

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

personalized_llama3-8b-cpt-sahabatai-v1-instruct / README.md

psetialana's picture

Update README.md

cd92dd6 verified about 2 months ago

|

history blame contribute delete

1.51 kB

	---
	base_model:
	- GoToCompany/llama3-8b-cpt-sahabatai-v1-instruct
	tags:
	- text-generation-inference
	- transformers
	- unsloth
	- llama
	- trl
	license: apache-2.0
	language:
	- id
	datasets:
	- psetialana/multi_session_chat-informal_indonesian-transformed
	---

	# Personalized Sahabat AI Llama 3.1 8 B

	- Developed by: [Pradana Setialana](https://www.linkedin.com/in/psetialana/)

	This model is a fine-tuned version of [GoToCompany/llama3-8b-cpt-sahabatai-v1-instruct](https://huggingface.co/GoToCompany/llama3-8b-cpt-sahabatai-v1-instruct) on [psetialana/multi_session_chat-informal_indonesian-transformed](https://huggingface.co/datasets/psetialana/multi_session_chat-informal_indonesian-transformed) dataset.

	## Model description

	This model can be used to personalize conversations and role-play based on the persona given with the prompt
	```
	Kamu adalah sahabat user. Kamu memiliki karakter PERSONA_ASSISTANT. User memiliki karakter PERSONA_USER. Kamu berperilaku sesuai PERSONA_ASSISTANT dan menyesuaikan responmu sesuai PERSONA_USER.

	PERSONA_ASSISTANT:
	{assistant_persona}

	PERSONA_USER:
	{user_persona}
	```

	## Training procedure

	### LoRA config

	The following lora config were used during training:
	- alpha: 16
	- r: 16
	- droput: 0
	- modules: "q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"

	### Training hyperparameters

	The following hyperparameters were used during training:
	- learning_rate: 2e-4
	- optimizer: adamw_8bit

	### Training results

	[TensorBoard](../../tensorboard)