Multimodal Art Projection

community

https://m-a-p.ai

multimodal-art-projection

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

chenghualin authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

emmanouilb authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

wenhu authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

View all activity

m-a-p's activity

chenghualin

authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 4 days ago • 56

emmanouilb

authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 4 days ago • 56

wenhu

authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 4 days ago • 56

CheeryLJH

authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 4 days ago • 56

nicolaus625

authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 4 days ago • 56

agent404

authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 4 days ago • 56

wanng

authored a paper 3 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 4 days ago • 56

a43992899

updated a collection 3 days ago

YuE

YuE: Open Full-song Generation Foundation Model • 10 items • Updated 3 days ago • 23

lmxue

authored a paper 3 days ago

Spark-TTS: An Efficient LLM-Based Text-to-Speech Model with Single-Stream Decoupled Speech Tokens

Paper • 2503.01710 • Published 12 days ago • 3

a43992899

authored 11 papers 4 days ago

Chinese Open Instruction Generalist: A Preliminary Release

Paper • 2304.07987 • Published Apr 17, 2023 • 2

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

Paper • 2311.16502 • Published Nov 27, 2023 • 35

LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT

Paper • 2306.17103 • Published Jun 29, 2023 • 1

CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language Models

Paper • 2402.13109 • Published Feb 20, 2024

COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning

Paper • 2403.18058 • Published Mar 26, 2024 • 4

The Fine Line: Navigating Large Language Model Pretraining with Down-streaming Capability Analysis

Paper • 2404.01204 • Published Apr 1, 2024

Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model

Paper • 2404.04167 • Published Apr 5, 2024 • 14

MuPT: A Generative Symbolic Music Pretrained Transformer

Paper • 2404.06393 • Published Apr 9, 2024 • 16

ComposerX: Multi-Agent Symbolic Music Composition with LLMs

Paper • 2404.18081 • Published Apr 28, 2024 • 2

MMTrail: A Multimodal Trailer Video Dataset with Language and Music Descriptions

Paper • 2407.20962 • Published Jul 30, 2024

RQ-RAG: Learning to Refine Queries for Retrieval Augmented Generation

Paper • 2404.00610 • Published Mar 31, 2024