什么是Stable Diffusion
2022年发布的深度学习文本到图像生成模型Stable Diffusion备受瞩目。这个模型主要用于根据文本描述生成详细图像,同时也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词指导下产生图像的翻译。
Stable Diffusion是一种潜在变量模型的扩散模型,由慕尼黑大学的CompVis研究团体开发的各种生成性人工神经网络。该模型是由初创公司StabilityAI、CompVis与Runway合作开发,并得到EleutherAI和LAION的支持。截至2022年10月,StabilityAI已筹集了1.01亿美元的资金。
与以往的专有文本到图像生成模型不同,Stable Diffusion的代码和模型权重已经公开发布,可以在配备适度GPU的电脑硬件上运行。这使得普通用户也能够使用这个模型,而不需要依赖云端运算服务。
Stable Diffusion是一种扩散模型的变体,被称为”潜在扩散模型”(latent diffusion model; LDM)。扩散模型最早于2015年推出,其目的是通过去噪自编码器的连续应用来消除训练图像中的高斯噪声。Stable Diffusion由三个部分组成:变分自编码器(VAE)、U-Net和一个文本编码器。与传统的去噪图像数据不同,Stable Diffusion通过训练VAE将图像转换为低维潜在空间进行去噪操作。在前向扩散过程中,高斯噪声被迭代地应用于压缩的潜在表征。每个去噪步骤由一个包含残差神经网络(ResNet)的U-Net架构完成,通过从前向扩散往反方向去噪来获得潜在表征。最后,VAE解码器将表征转换回像素空间,生成最终的输出图像。研究人员指出,LDM的一个优势是降低了训练和生成的计算要求。
在Stable Diffusion中,去噪步骤可以以文本串、图像或其他数据为条件。通过交叉注意机制,数据的编码可以被调节并暴露给去噪U-Net的架构。为了对文本进行调节,Stable Diffusion使用了一个预训练的固定CLIP ViT-L/14文本编码器,将提示词转化为嵌入空间。
总的来说,Stable Diffusion是一种创新的深度学习文本到图像生成模型。
最新推荐
-
win10商店下载位置更改后还是下载在c盘解决教程
win10商店下载位置更改后还是下载在c盘怎么解决?在win10系统默认的使用中,用户通过应用商店下载的位 […]
-
word奇偶页页码左右不同怎么弄 如何设置奇偶页码左右
word奇偶页页码左右不同怎么弄?在编辑word文档时,用户可以通过word提供的功能进行文档的页码编排, […]
-
win10提示音响个不停怎么回事 win10一直提示音
win10提示音响个不停怎么回事?在使用win10系统的时候有时候会遇到提示音一直响,这可能是用户作出一些 […]
-
逍遥模拟器root权限怎么开启 逍遥模拟器root权限获取方法
逍遥模拟器可以在电脑中运行各种安卓软件和游戏,但是一些程序是需要开启root模式,可是有很多用户都不知道逍遥模拟器怎么开启root模式,我们需要通过应用的设置来开启使用,那么今日的软件教程小编就来和广大用户们分享完整的设置步骤,有需要的用户欢迎来纯净之家获取查看吧。 逍遥模拟器 V8.1.2 官方最新版 [电脑软件] 大小:499.13 MB 类别:游戏娱乐 立即下载
-
win10怎么删除wps网盘图标 wps云盘取消在此电脑上显示
win10怎么删除wps网盘图标?wps是一款免费的办公软件,但是在用户使用中,会在电脑中生成wps的网盘 […]
-
腾讯手游助手更流畅怎么设置 腾讯手游助手流畅设置方法
腾讯手游助手是一款好用的安卓模拟器应用,可以在电脑上畅玩各种手机游戏,享受大屏显示,最近有用户发现运行游戏时总是卡卡的,有没有方法可以设置最流畅呢?就此,本篇带来了详细的设置教程,分享给大家,一起看看吧,希望对你有帮助。 腾讯手游助手 V5.0.361.80 最新版 [电脑软件] 大小:1.69 MB 类别:游戏娱乐 立即下载