OpenAI第二代DALL·E发布,可以使用自然语言创造和编辑图片的模型
2021年1月份,OpenAI发布了他们的DALL·E模型,它能从文字说明中创建图像,用于表达各种可由自然语言表达的概念。
今天,时隔一年后,OpenAI发布了第二代的DALL·E模型。相比较第一代的模型,DALL·E 2,以4倍的分辨率生成更真实和准确的图像。下图是二者的对比,可以看到第二代明显更加优秀。简直是不可思议,虽然都是莫奈的画风,但是第二个更加惊艳。

第一代的DALL·E是GPT-3的120亿个参数版本,通过使用文本-图像对的数据集,训练它从文本描述中生成图像。它有一系列不同的能力,包括创建动物和物体的拟人化版本,以合理的方式组合不相关的概念,渲染文本,以及对现有图像进行转换。
在基于文本创作图像的能力上,DALL·E 2的逼真度和与文本的匹配度更加优秀,根据实际的数据,标题匹配和逼真度的比例分别是71.7%和88.8%。
我们可以看几个DALL·E2的实际例子:
与DALL·E的对比:

还有一个,用逼真的风格画一个骑马的宇航员,这效果,惊呆了,那是不是以后我们写文章配图都直接可以跟模型说,来给各位网友在这个地方画一个我惊呆了的表情包。

哈哈哈,该说不说,OpenAI的发布的很多模型简直是太好了,可惜的是国内用不了它的API,我尝试注册,还需要非VoIP的手机号,就此作罢~~
官方地址:https://openai.com/dall-e-2
论文地址:https://cdn.openai.com/papers/dall-e-2.pdf
欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
