10086 14 204

Tien Dung

tiendung

tiendung

AI & ML interests

None yet

Recent Activity

updated a Space 12 days ago

Symato/tomtat

liked a dataset about 1 month ago

microsoft/orca-agentinstruct-1M-v1

updated a collection about 1 month ago

RAG

View all activity

Articles

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

Sep 29

• 1

Bài học đắng trong AI

Sep 29

• 1

Organizations

Posts 1

Post

1182

ICML 2024 Tutorial: Physics of Language Models
https://www.youtube.com/watch?v=yBL7J0kgldU
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction (2309.14316)

Series bài nói về việc hiểu cách LLM hoạt động. Rất thú vị, họ làm thí nghiệm kiểm soát 100% cách huấn luyện model và phát hiện rằng nếu pretrain không chứa dạng dữ liệu extraction (QA instruction, hoặc các dạng dữ liệu mà tác giả gọi là knowledge augmentation) thì mặc dù có qua instruct finetune thì LLM cũng không thể học skill knowledge extraction. => đặt lại câu hỏi liệu cách pretrain rồi mới SFT như hiện tại đã thực sự tốt chưa?

Họ đã thử vài trăm thí nghiệm với các loại kiến trúc mô hình, độ to nhỏ, ... và đều ra kết quả như nhau.

KNOWLEDGE AUGMENTATION (data augmentation)
Nếu bạn không mix instruct data với pre-train data (mix training) tốt nhất hãy áp dụng knowledge augmentation. Tức là cùng một câu đó nhưng diễn tả lại bằng nhiều cách khác nhau.

KNOWLEDGE MANIPULATION
ví dụ giả sử đã biết (đc huấn luyện) tiểu sử của A (bao gồm ngày tháng năm sinh) và hỏi A sinh tháng chẵn hay lẻ (50% cơ hội trả lời đúng). Nếu không sử dụng CoT (gợi nhớ lại kiến thức, xem A sinh tháng mấy) thì kết quả là model không làm được. => CoT (gợi nhớ kiến thức đã học) rất quan trọng với knowledge manipulation (phân loại, so sánh, xếp hạng ...)

Collections 3

models 16

datasets 3

tiendung/cc-vi_truyen-filters

Preview • Updated Oct 3, 2023 • 10

tiendung/cc-vi_domains

Updated Sep 21, 2023 • 5

tiendung/chai

Viewer • Updated Sep 15, 2023 • 70.8k • 7

Tien Dung

AI & ML interests

Recent Activity

Articles

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

Bài học đắng trong AI

Organizations

Posts 1

Collections 3

PROMPT++

arcee-ai/The-Tome

migtissera/Synthia-v1.5-I

Gryphe/ChatGPT-4o-Writing-Prompts

PawanKrd/gpt-4o-200k

models 16

tiendung/gemma-2-9b__extend_vocab

tiendung/gemma2reranking

tiendung/bge-reranking-m3_bf16

tiendung/bge-embedding-m3_bf16

tiendung/gemma2embedding

tiendung/gemma1reranking

tiendung/cc-vi_segdedup

tiendung/pygmalion-6b-20-percent-soda_2e_merged

tiendung/open_llama_3b-8k_visyll

tiendung/tiny_starcoder_py-vi06

datasets 3

tiendung/cc-vi_truyen-filters

tiendung/cc-vi_domains

tiendung/chai

Tien Dung

AI & ML interests

Recent Activity

Articles

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

Bài học đắng trong AI

Organizations

Posts 1

Collections 3

PROMPT++

models 16 Sort: Recently updated

datasets 3 Sort: Recently updated

models 16

datasets 3