6 26 12

Nikita Sushko

chameleon-lizard

http://chameleon-lizard.ru:81

chameleon-lizard

AI & ML interests

NLP, Multilingual Models, Multiagent Systems

Recent Activity

upvoted a paper 7 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

upvoted a paper 7 days ago

RuCCoD: Towards Automated ICD Coding in Russian

upvoted a collection 9 days ago

SynthDetoxM

View all activity

Organizations

chameleon-lizard's activity

upvoted 2 papers 7 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

Paper • 2503.05500 • Published 10 days ago • 72

RuCCoD: Towards Automated ICD Coding in Russian

Paper • 2502.21263 • Published 17 days ago • 122

upvoted a collection 9 days ago

SynthDetoxM

Collection

Data and models from NAACL 2025 paper "SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators" by Moskovskiy et al. • 4 items • Updated 11 days ago • 2

upvoted a paper 13 days ago

When an LLM is apprehensive about its answers -- and when its uncertainty is justified

Paper • 2503.01688 • Published 14 days ago • 19

updated a dataset 14 days ago

chameleon-lizard/judge_correlation

Viewer • Updated 14 days ago • 3.2k • 70

published a dataset 14 days ago

chameleon-lizard/judge_correlation

Viewer • Updated 14 days ago • 3.2k • 70

liked a dataset 15 days ago

OpenLeecher/lmsys_chat_1m_clean

Viewer • Updated Dec 31, 2024 • 273k • 381 • 75

upvoted a paper 18 days ago

GHOST 2.0: generative high-fidelity one shot transfer of heads

Paper • 2502.18417 • Published 20 days ago • 63

updated a dataset 21 days ago

chameleon-lizard/DTF-comments-DPO

Viewer • Updated 21 days ago • 2.39k • 90

upvoted a paper 21 days ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published 24 days ago • 163

upvoted a paper 24 days ago

How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Paper • 2502.14502 • Published 25 days ago • 85

published a dataset 24 days ago

chameleon-lizard/DTF-comments-DPO

Viewer • Updated 21 days ago • 2.39k • 90

upvoted a paper 26 days ago

Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

Paper • 2502.13063 • Published 27 days ago • 67

upvoted a paper about 1 month ago

LM2: Large Memory Models

Paper • 2502.06049 • Published Feb 9 • 30

authored a paper about 1 month ago

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Paper • 2502.06394 • Published Feb 10 • 86

upvoted a paper about 1 month ago

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Paper • 2502.06394 • Published Feb 10 • 86

updated a collection about 1 month ago

DTF

Collection

Finetune of Qwen-2.5-7B model on a dump of DTF posts and comments. • 3 items • Updated Feb 7

updated 2 models about 1 month ago

chameleon-lizard/Qwen-2.5-7B-DTF-SFT

Text Generation • Updated Feb 7 • 61

chameleon-lizard/Qwen-2.5-7B-DTF

Text Generation • Updated Feb 7 • 179 • 2

published a model about 1 month ago

chameleon-lizard/Qwen-2.5-7B-DTF-SFT

Text Generation • Updated Feb 7 • 61