--- language: - th - en license: cc-by-nc-3.0 datasets: - airesearch/concat_six_dataset_th_en --- # PolyLM-13b-WangchanX-sft-Demo Built with PolyLM-13b (Fine tuning with Qlora) This model is based on [WangchanX Fine-tuning Pipeline](https://github.com/vistec-AI/WangchanX). GitHub: [WangchanX Fine-tuning Pipeline](https://github.com/vistec-AI/WangchanX). License: cc-by-nc-3.0 ## Train Example Train WangchanX pipeline: [Colab](https://colab.research.google.com/github/vistec-AI/WangchanX/blob/main/notebooks/Train_WangchanX_pipeline.ipynb) ## Inference Example Run on [Colab](https://colab.research.google.com/drive/1PeUnv89Ao2uHRYYzZVOlUwoBUdYKFbLS?usp=sharing) ### Prepare your model and tokenizer: ```python import torch from transformers import AutoTokenizer, AutoModelForCausalLM # Model path path = "airesearch/PolyLM-13b-WangchanX-sft-Demo" # Device device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') # Load tokenizer and model tokenizer = AutoTokenizer.from_pretrained(path, use_fast=False) model = AutoModelForCausalLM.from_pretrained(path, device_map="auto") ``` ### Define chat messages: ```python messages = [ {"role": "user", "content": "รู้จักประเทศไทยไหม"}, ] ``` ### Tokenize chat messages: ```python tokenized_chat = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(device) print(tokenizer.decode(tokenized_chat[0])) ```
Output:
<|user|>
รู้จักประเทศไทยไหม
<|assistant|>
### Generate responses: ```python outputs = model.generate(tokenized_chat, max_length=2048) print(tokenizer.decode(outputs[0])) ```
Output:
<|user|>
รู้จักประเทศไทยไหม
<|assistant|>
ขอแนะนำให้ทราบว่า ประเทศไทยเป็นดินแดนที่มีความหลากหลายทางวัฒนธรรมและมีประเพณีที่งดงามมากมาย มีอารยะธรรมในอดีตที่มีมาตั้งแต่สมัยก่อนพุทธกาล เป็นศูนย์กลางของชาวเขาเผ่าต่างๆ ในเอเชีย และยังคงสภาพความรุ่งโรจน์ได้อย่างไม่น่าเชื่อด้วยการพัฒนาเศรษฐกิจที่เติบโตรวดเร็วที่สุดในภูมิภาคนี้ นอกจากนั้นแล้วก็ยังได้รับเลือกให้จัดการแข่งขันกีฬาซีเกมส์ครั้งล่าสุดเมื่อปี พ.ศ.2560 ซึ่งถือเป็นเหรียญเงินในการแข่งขันระดับอื่นอีกด้วย โดยปัจจุบันนี้มีการลงประชามติเพื่อรับรองการเข้าร่วมสหประชาชาติด้านมนุษยชน (ICCPR) เพื่อจะทำให้สามารถใช้สิทธิมนุษยชนตามอนุสัญญาสหประชาชาติเกี่ยวกับสิทธิมนุษยนชนหรือ ICCPR ได้เต็มอัตราส่วนเท่ากันกับนักศึกษาทั่วไป แต่เนื่องจากผู้คนจำนวนน้อยกว่า จึงไม่มีผลต่อการสมัครเรียน ครู หรือแม้กระทั้งคุณครูเองต้องยอมเหนื่อยกายใจทำงานเพิ่มขึ้นเพราะเด็กเล็กจำนวนหนึ่งเกิดใหม่ทุกวันโดยเฉพาะช่วงที่เปิดเทอมใหญ่ อยากฝึกงานทำวิทยาลัยที่สองเลยค่ะ ขอบพระคุณครับ