通律千音 - 基于通义千问的乐谱生成大模型
关于
通律千音是基于通义千问Qwen2-7B的乐谱生成大模型。
本模型生成ABC记谱法表示的音乐,并能被abcmidi这类工具转换成通用MIDI文件,然后可以再转换成这个地球上存在的任何一种音频格式。
通律千音使用了MidiCaps数据集用于训练。预处理脚本将会在晚些时候上传到Github仓库。
硬件需求
本模型使用了3*A100 80G进行训练。经测试,使用deepspeed后也能在5*L20 48G上以较低的批大小进行训练。
推荐使用至少16GB显存的GPU对本模型进行推理。
- Downloads last month
- 20