Co

ControlNet

基础大模型

ControlNet

发布时间: 2023-02-10

模型参数(Parameters)
未披露
最高上下文长度(Context Length)
2K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

最高上下文输入长度

2K tokens

最长输出结果
未披露
模型类型

基础大模型

发布时间

2023-02-10

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
预训练权重开源
-
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
暂无数据
接口价格
输入价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据
输出价格:
  • 文本: 暂无数据
  • 图片: 暂无数据
  • 音频: 暂无数据
  • 视频: 暂无数据
  • Embedding: 暂无数据

输入支持的模态

文本

输入不支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出不支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

ControlNet模型在各大评测榜单的评分

发布机构

模型介绍

ControlNet是一个系列模型。模型相关论文内容参考: 大模型预训练模型微调新模式——ControlNet:提高大模型在特定任务微调的效果 


ControlNet是一种新的神将网络结构,由斯坦福大学的Lvmin Zhang和Maneesh Agrawala提出的可以用来增强扩散模型的方法。主要是基于已有的Text-to-Image预训练模型对特定数据进行微调以更加适合使用者的目的。这个结构最大的特点是可以在比较资源少的设备如个人PC上对大模型进行调整以获得更好的效果。

这个结构可以帮助大家去训练模型,提高模型在一些特定任务上的效果。大模型一般可能是文本-图像对应关系训练的。但是这种模型在边缘检测、关键点识别等任务上需要做微调。微调的代价比较高,效果也不确定,而ControlNets的作用就是和原来的大模型一起对特定任务重训练的方法。

微软最新的Visual ChatGPT的也用到了这个能力。


模型名称类型地址
Controlnet - Canny VersionCanny边缘检测https://huggingface.co/lllyasviel/sd-controlnet-canny
Controlnet - Image Segmentation Version图像分割https://huggingface.co/lllyasviel/sd-controlnet-seg
Controlnet - Scribble Version图片涂鸦https://huggingface.co/lllyasviel/sd-controlnet-scribble
Controlnet - Normal Map Version法线估计https://huggingface.co/lllyasviel/sd-controlnet-normal
Controlnet - M-LSD Straight Line Version直线提取https://huggingface.co/lllyasviel/sd-controlnet-mlsd
Controlnet - Depth Version图片深度估计https://huggingface.co/lllyasviel/sd-controlnet-depth
Controlnet - HED Boundary VersionHED 网络的图像边缘检测https://huggingface.co/lllyasviel/sd-controlnet-hed
Controlnet - Human Pose Version人类姿态估计https://huggingface.co/lllyasviel/sd-controlnet-openpose


这些模型都是作者实现的,将ControlNet与知名的算法结合的预训练结果,效果很好,可以直接使用!

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat