SVD-XT - Stable Video Diffusion - XT

模型详细情况和参数

SVD-XT

模型全称
Stable Video Diffusion - XT
模型简称
SVD-XT
模型类型
视觉大模型
发布日期
2023-11-21
预训练文件大小
9.56GB
是否支持中文(中文优化)
最高支持的上下文长度
2K
模型参数数量(亿)
10.0
模型代码开源协议
MIT License
预训练结果开源商用情况
开源不可商用 - 不可以商用
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构

Stable Video Diffusion - XT 简介

更多介绍参考: https://www.datalearner.com/blog/1051700786899649 

SVD模型简介

SVD全称Stable Video Diffusion,是StabilityAI最新的开源文本生成视频大模型。这个模型是基于Stable Diffusion 2.1进行初始化,然后通过在图像模型中插入时空卷积和注意力层来构建这个视频生成模型的架构,最终在1.52以视频数据集上训练得到。


SVD-XT可以生成20帧的576x1024分辨率的视频,而SVD只能生成14帧。


SVD模型的详细信息: https://www.datalearner.com/ai-models/pretrained-models/SVD 


下图是样例结果:


欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

SVD-XT所属的领域
多模态学习

多模态学习

Multimodal Learning

35个资源

SVD-XT相关的任务
文本生成视频

文本生成视频

Text to Video

35个资源