SVD-XT（Stable Video Diffusion - XT）详细信息 | 名称、简介、使用方法，开源情况，商用授权信息

SVD-XT - Stable Video Diffusion - XT

模型详细情况和参数

模型全称: Stable Video Diffusion - XT
模型简称: SVD-XT
模型类型: 视觉大模型
发布日期: 2023-11-21
预训练文件大小: 9.56GB
是否支持中文（中文优化）: 否
最高支持的上下文长度: 2K
模型参数数量（亿）: 10.0
模型代码开源协议: MIT License
预训练结果开源商用情况: 开源不可商用 - 不可以商用
模型GitHub链接: https://github.com/Stability-AI/generative-models
模型HuggingFace链接: https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
在线演示地址: 暂无
DataLearnerAI的模型介绍
官方博客论文: Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets
基础模型: 无基础模型
发布机构: Stability AI

SVD全称Stable Video Diffusion，是StabilityAI最新的开源文本生成视频大模型。这个模型是基于Stable Diffusion 2.1进行初始化，然后通过在图像模型中插入时空卷积和注意力层来构建这个视频生成模型的架构，最终在1.52以视频数据集上训练得到。

SVD-XT可以生成20帧的576x1024分辨率的视频，而SVD只能生成14帧。

下图是样例结果：