Simeng Sun's picture

3 2

Simeng Sun

simsun131

·

https://people.cs.umass.edu/~simengsun/

AI & ML interests

Language Modeling, Machine Translation

Organizations

simsun131's activity

upvoted 2 papers 3 months ago

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 42

Star Attention: Efficient LLM Inference over Long Sequences

Paper • 2411.17116 • Published Nov 26, 2024 • 52

upvoted a paper 11 months ago

RULER: What's the Real Context Size of Your Long-Context Language Models?

Paper • 2404.06654 • Published Apr 9, 2024 • 35