12 55 1266

Zhipeng Yang

svjack

https://github.com/svjack

svjack

AI & ML interests

NLP,Search Engine ,Dialogue System,Question Answer System, Knowledge Base,Stable Diffusion,CV

Recent Activity

liked a dataset about 9 hours ago

allenai/pixmo-docs

updated a Space about 10 hours ago

svjack/MotionClone-Image-to-Video

published a Space about 10 hours ago

svjack/MotionClone-Image-to-Video

View all activity

Organizations

svjack's activity

liked a dataset about 9 hours ago

allenai/pixmo-docs

Viewer • Updated Dec 5, 2024 • 255k • 4.25k • 24

updated a Space about 10 hours ago

MotionClone-Image-to-Video

📷

Motion cloning for controllable video generation

published a Space about 10 hours ago

MotionClone-Image-to-Video

📷

Motion cloning for controllable video generation

upvoted a paper about 11 hours ago

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Paper • 2502.14846 • Published about 21 hours ago • 8

liked a model about 13 hours ago

unsloth/DeepSeek-R1-GGUF

Text Generation • Updated 8 days ago • 2.47M • 879

updated a Space 1 day ago

Light A Video

🌖

Training-free Video Relighting via Progressive Light Fusion

upvoted 8 papers 1 day ago

SAFE-SQL: Self-Augmented In-Context Learning with Fine-grained Example Selection for Text-to-SQL

Paper • 2502.11438 • Published 4 days ago • 7

video-SALMONN-o1: Reasoning-enhanced Audio-visual Large Language Model

Paper • 2502.11775 • Published 4 days ago • 8

System Message Generation for User Preferences using Open-Source Models

Paper • 2502.11330 • Published 5 days ago • 15

SURGE: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors

Paper • 2502.11167 • Published 5 days ago • 11

I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models

Paper • 2502.10458 • Published 9 days ago • 27

Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options

Paper • 2502.12929 • Published 3 days ago • 6

Text2World: Benchmarking Large Language Models for Symbolic World Model Generation

Paper • 2502.13092 • Published 3 days ago • 12

Phantom: Subject-consistent video generation via cross-modal alignment

Paper • 2502.11079 • Published 5 days ago • 48

liked a model 1 day ago

perplexity-ai/r1-1776

Updated 2 days ago • 6.44k • 1.3k

liked 3 Spaces 1 day ago

Light A Video

🌖

Training-free Video Relighting via Progressive Light Fusion

Step Audio

👀

Generate audio responses from text or audio

Paligemma2 Mix

🌖

Generate text or segment objects from an image

liked a model 1 day ago

microsoft/wham

Updated about 14 hours ago • 148

liked a Space 1 day ago

GenCity

🏘

Type some text to generate assets, click to position them