模型详细情况和参数
MusicGen是一个自回归tansformer模型,通过32kHz EnCodec Tokenizer训练,4个codebooks在50Hz采样。与现有的方法不同,如MusicGen MusicGen不需要自我监督的语义表示,它在一次传递中生成所有4个码本。
MusicGen代码开源协议MIT协议,可商用。但是预训练结果的开源协议是CC-BY-NC 4.0,不可商用!
多模态学习
Multimodal Learning
35个资源
音乐生成
Music Generation