Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2412.15115

Qwen2.5 language models, including pretrained and instruction-tuned models of 7 sizes, including 0.5B, 1.5B, 3B, 7B, 14B, 32B, and 72B.

Running

656

656

Qwen2.5

🚀

Chat with Qwen, a helpful assistant
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 362
Qwen/Qwen2.5-0.5B

Text Generation • Updated Sep 25, 2024 • 675k • • 239
Qwen/Qwen2.5-0.5B-Instruct

Text Generation • Updated Sep 25, 2024 • 962k • • 280

A Picture is Worth More Than 77 Text Tokens: Evaluating CLIP-Style Models on Dense Captions

Paper • 2312.08578 • Published Dec 14, 2023 • 20
ZeroQuant(4+2): Redefining LLMs Quantization with a New FP6-Centric Strategy for Diverse Generative Tasks

Paper • 2312.08583 • Published Dec 14, 2023 • 12
Vision-Language Models as a Source of Rewards

Paper • 2312.09187 • Published Dec 14, 2023 • 14
StemGen: A music generation model that listens

Paper • 2312.08723 • Published Dec 14, 2023 • 49

Wan-AI/Wan2.1-I2V-14B-720P

Image-to-Video • Updated 28 days ago • 84.6k • 395
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 362

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 362
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 147
Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 67

Papers Storm 🌪️

A curated collection of research papers referenced in Panoram'IA program, offering a comprehensive resource for further exploration.

GenEx: Generating an Explorable World

Paper • 2412.09624 • Published Dec 12, 2024 • 95
Generative World Explorer

Paper • 2411.11844 • Published Nov 18, 2024 • 77
Video Depth without Video Models

Paper • 2411.19189 • Published Nov 28, 2024 • 38
Mobile Video Diffusion

Paper • 2412.07583 • Published Dec 10, 2024 • 20

Source papers of LLM Giants

Qwen Technical Report

Paper • 2309.16609 • Published Sep 28, 2023 • 35
Qwen-Audio: Advancing Universal Audio Understanding via Unified Large-Scale Audio-Language Models

Paper • 2311.07919 • Published Nov 14, 2023 • 10
Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 162
Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15, 2024 • 59

Qwen Technical Report

Paper • 2309.16609 • Published Sep 28, 2023 • 35
Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 67
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 362
Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 147

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 362

test-collection

never mind, just for testing

deepseek-ai/DeepSeek-V3

Text Generation • Updated about 1 month ago • 1.74M • • 3.73k
HuggingFaceTB/finemath

Viewer • Updated Feb 6 • 48.3M • 10.3k • 296
Running on CPU Upgrade

8.07k

8.07k

Kolors Virtual Try-On

👕

Try on virtual garments on your uploaded images
Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 362

about 1 month ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 281
rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published Jan 8 • 270
Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 139
Apollo: An Exploration of Video Understanding in Large Multimodal Models

Paper • 2412.10360 • Published Dec 13, 2024 • 146

Previous
1
2
3
...
6
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs