当前位置: 首页>编程语言>正文

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD

Hyper-SD 使用了当前最先进的 Stable Diffusion 模型加速,可以在1、2、4、8个采样步骤下生成高质量的大尺寸图片,它通过Lora模型的方式发布,兼容 SDXL 和 SD1.5 的各类模型。

先看官方发布的这个效果对比:Hyper-SDXL出图的质量确实很优秀!

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD_AIGC,第1张

Hyper-SD 介绍

Hyper-SD 由字节跳动开源,使用了神经网络的模型蒸馏技术从 SDXL Base 1.0 和 Stable-Diffusion v1-5 模型中提取出了高质量的图像特征信息。

具体来说,字节团队提出了一种新颖的框架,协同整合了ODE轨迹保持和ODE轨迹重构的优势,既保证了新模型的性能,又提升提升了新模型的效率。 首先,它引入了轨迹分段一致性蒸馏,在预先定义的时间步长段内逐步进行一致性蒸馏,从而从更高层次上促进了原始ODE轨迹的保留。 其次,它将人类反馈学习融入模型,以提升低步长条件下的性能,并减轻蒸馏过程中产生的性能损失。第三,它将评分提炼技术融入其中,进一步提升模型在低步骤生成方面的能力,并首次尝试利用统一的LoRA支持所有步骤的推理过程。

ODE轨迹指的是扩散模型在训练时添加噪声和去燥的过程。ODE轨迹保持指的是训练时尽量复现原模型的ODE轨迹,这样可以尽量保持原模型的性能。ODE轨迹重构指的是训练时在保障新模型输出与原模型相近的前提下,优化ODE轨迹。

Hyper-SD 在 SDXL 和 SD1.5 的1至8步推理过程中均实现了良好性能。例如,在1步推理中,Hyper-SDXL 在CLIP评分上比 SDXL-Lightning 高出0.68,在Aes评分上高出0.51。

安装 Hyper-SD

手动安装

Hyper-SD的安装比较简单,我们只需要在ComfyUI的基础能力上增加一个新的采样调度器,然后再下载相关的模型,就可以了。

  • TCD采样调度器:你可以手动安装,也可以通过安装工作流缺失节点来完成。插件地址:github.com/JettHu/Comf…。
  • Hyper-SD模型:Hyper-SD模型都是Lora模型,目前官方只发布了ComfyUI的使用方法,下载后放到 ComfyUI 的LoRA模型目录既可以了。

全都安装完了,不要忘了重启。对安装方法还不熟悉的同学,请看这篇文章:ComfyUI 完全入门:必备插件

模型和工作流下载地址见文末。

使用镜像

在 AutoDL 上发布了一个 ComfyUI 的镜像,已经内置了 Hyper-SD 的模型和工作流,填了很多坑,可以一键开启使用,无需自己费力部署。

AutoDL是一个云计算平台,提供显卡服务器租用服务,可按小时付(1-2元左右),显卡价格相比阿里云、腾讯云有明显的优势,我一直在用,推荐本地硬件性能不足的同学试试。

镜像地址:www.codewithgpu.com/i/comfyanon…

在镜像地址页面,点击右下角的“AutoDL创建实例”:

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_02,第2张

也可以在实例创建页面选择社区镜像:yinghuoai-ComfyUI

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_03,第3张

GPU型号建议选择RTX 3090、4090等,性能比较强。

镜像实例创建后,里边有一个启动器,按照提示即可一键启动。

使用Hyper-SD

Hyper-SD 的推理加速是通过 LoRA 模型实现的,官方发布了多个 LoRA 模型供我们使用。这里我介绍其中最新的两种 LoRA 模型:Unified LoRA 和 CFG LoRA。

Unified LoRA

先来看 Unified LoRA(统一LoRA),所谓 统一LoRA 就是我们可以只使用一个模型,就能执行 1-8步的推理,在最低的1步推理下图片质量也是有所保证的,而且随着推理步数的增加,图像中的元素越来越丰富,事物的个性特征也会更加明显。

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_04,第4张

这个工作流中的节点不多,我这里做了一个简单的标注,如下图所示。文末提供工作流的下载方式。

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_05,第5张

这里有几点注意下:

  • TCD采样调度:TCD采样调度器是搭配 Hyper-SD 统一LoRA 模型必备的,它的时间调度是专门调整过的;
  • 负向提示词不需要填写;
  • CFG引导设置为1;
  • 图片尺寸根据所选择的SD模型进行设置,SDXL的图片像素不要低于 1024*1024。

这个模型有什么用?一个字快,比如根据涂鸦实时或准实时生成图片:

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD_公众号_06,第6张

CFG LoRA

CFG LoRA 可以让我们使用更强的提示词引导,包括负向提示词。官方训练的模型可以支持5-8的CFG系数。

工作流标注如下:

1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图,字节开源Stable Diffusion加速模型 Hyper-SD_推理过程_07,第7张

这里有几点注意下:

1、LoRA模型:选择的是Hyper-SD CFG LoRA,这里使用的是8步模型,采样步数也要设置为8。最新的有12步模型,图片质量更高一些,但是生成时间也更长。

2、支持反向提示词:比如我们这里的 black hair,就是不要黑色的毛发。

3、采样低矮度还是使用 TCD采样调度器。

4、CFG需要设置为 5-8,具体值需要自己测试,选择适合自己模型和提示词的。

5、图片尺寸根据所选择的SD模型进行设置,SDXL的图片像素不要低于 1024*1024。

资源下载

模型

模型官方下载地址:huggingface.co/ByteDance/H…

如果你访问 Huggingface 不太方便,可以给公众号“萤火遛AI”发消息:Hyper-SD,即可获取。

工作流

工作流也发布在“萤火遛AI”公众号,发消息:Hyper-SD,可以同时获取工作流和模型。


以上就是本文的主要内容,如有问题,欢迎留言交流。


https://www.xamrdz.com/lan/53q1960763.html

相关文章: