9 21 16

Huiqiang Jiang PRO

iofu728

https://www.microsoft.com/en-us/research/people/hjiang/

AI & ML interests

None yet

Recent Activity

liked a model 19 days ago

moonshotai/Moonlight-16B-A3B

upvoted a paper about 1 month ago

Optimizing Large Language Model Training Using FP4 Quantization

liked a model about 2 months ago

Qwen/Qwen2.5-14B-Instruct-1M

View all activity

Organizations

iofu728's activity

liked a model 19 days ago

moonshotai/Moonlight-16B-A3B

Text Generation • Updated 16 days ago • 2.17k • 73

upvoted a paper about 1 month ago

Optimizing Large Language Model Training Using FP4 Quantization

Paper • 2501.17116 • Published Jan 28 • 36

liked a model about 2 months ago

Qwen/Qwen2.5-14B-Instruct-1M

Text Generation • Updated Jan 29 • 58k • 279

upvoted a paper about 2 months ago

Sigma: Differential Rescaling of Query, Key and Value for Efficient Language Models

Paper • 2501.13629 • Published Jan 23 • 44

liked 2 models about 2 months ago

deepseek-ai/DeepSeek-R1-Distill-Qwen-32B

Text Generation • Updated 18 days ago • 1.59M • • 1.26k

deepseek-ai/DeepSeek-R1

Text Generation • Updated 18 days ago • 2.75M • • 11.3k

upvoted a paper 2 months ago

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published Jan 8 • 263

updated a dataset 3 months ago

microsoft/SCBench

Viewer • Updated Dec 24, 2024 • 922 • 1.66k • 6

upvoted a paper 3 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 352

authored a paper 3 months ago

SCBench: A KV Cache-Centric Analysis of Long-Context Methods

Paper • 2412.10319 • Published Dec 13, 2024 • 10

upvoted a paper 3 months ago

SCBench: A KV Cache-Centric Analysis of Long-Context Methods

Paper • 2412.10319 • Published Dec 13, 2024 • 10

commented a paper 3 months ago

SCBench: A KV Cache-Centric Analysis of Long-Context Methods

Paper • 2412.10319 • Published Dec 13, 2024 • 10 •

New activity in microsoft/SCBench 3 months ago

rename

#2 opened 3 months ago by

liyucheng

updated a dataset 3 months ago

MInference/SCBench

Viewer • Updated Dec 13, 2024 • 922 • 256

upvoted a paper 3 months ago

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published Dec 11, 2024 • 44

updated a Space 5 months ago

MInference

🌍

Generate text responses to user queries

upvoted a paper 5 months ago

Differential Transformer

Paper • 2410.05258 • Published Oct 7, 2024 • 171

upvoted an article 6 months ago

Article

Fine-tuning LLMs to 1.58bit: extreme quantization made easy

Sep 18, 2024

• 225

authored a paper 6 months ago

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

Paper • 2409.10516 • Published Sep 16, 2024 • 41

upvoted a paper 6 months ago

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

Paper • 2409.10516 • Published Sep 16, 2024 • 41