1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD

编程语言2024-05-20 13:27:15

Hyper-SD 使用了当前最先进的 Stable Diffusion 模型加速，可以在1、2、4、8个采样步骤下生成高质量的大尺寸图片，它通过Lora模型的方式发布，兼容 SDXL 和 SD1.5 的各类模型。

先看官方发布的这个效果对比：Hyper-SDXL出图的质量确实很优秀！

1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD_AIGC,第1张

Hyper-SD 介绍

Hyper-SD 由字节跳动开源，使用了神经网络的模型蒸馏技术从 SDXL Base 1.0 和 Stable-Diffusion v1-5 模型中提取出了高质量的图像特征信息。

具体来说，字节团队提出了一种新颖的框架，协同整合了ODE轨迹保持和ODE轨迹重构的优势，既保证了新模型的性能，又提升提升了新模型的效率。首先，它引入了轨迹分段一致性蒸馏，在预先定义的时间步长段内逐步进行一致性蒸馏，从而从更高层次上促进了原始ODE轨迹的保留。其次，它将人类反馈学习融入模型，以提升低步长条件下的性能，并减轻蒸馏过程中产生的性能损失。第三，它将评分提炼技术融入其中，进一步提升模型在低步骤生成方面的能力，并首次尝试利用统一的LoRA支持所有步骤的推理过程。

ODE轨迹指的是扩散模型在训练时添加噪声和去燥的过程。ODE轨迹保持指的是训练时尽量复现原模型的ODE轨迹，这样可以尽量保持原模型的性能。ODE轨迹重构指的是训练时在保障新模型输出与原模型相近的前提下，优化ODE轨迹。

Hyper-SD 在 SDXL 和 SD1.5 的1至8步推理过程中均实现了良好性能。例如，在1步推理中，Hyper-SDXL 在CLIP评分上比 SDXL-Lightning 高出0.68，在Aes评分上高出0.51。

安装 Hyper-SD

手动安装

Hyper-SD的安装比较简单，我们只需要在ComfyUI的基础能力上增加一个新的采样调度器，然后再下载相关的模型，就可以了。

TCD采样调度器：你可以手动安装，也可以通过安装工作流缺失节点来完成。插件地址：github.com/JettHu/Comf…。
Hyper-SD模型：Hyper-SD模型都是Lora模型，目前官方只发布了ComfyUI的使用方法，下载后放到 ComfyUI 的LoRA模型目录既可以了。

全都安装完了，不要忘了重启。对安装方法还不熟悉的同学，请看这篇文章：ComfyUI 完全入门：必备插件

模型和工作流下载地址见文末。

使用镜像

在 AutoDL 上发布了一个 ComfyUI 的镜像，已经内置了 Hyper-SD 的模型和工作流，填了很多坑，可以一键开启使用，无需自己费力部署。

AutoDL是一个云计算平台，提供显卡服务器租用服务，可按小时付（1-2元左右），显卡价格相比阿里云、腾讯云有明显的优势，我一直在用，推荐本地硬件性能不足的同学试试。

镜像地址：www.codewithgpu.com/i/comfyanon…

在镜像地址页面，点击右下角的“AutoDL创建实例”：

1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_02,第2张

也可以在实例创建页面选择社区镜像：yinghuoai-ComfyUI

1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_03,第3张

GPU型号建议选择RTX 3090、4090等，性能比较强。

镜像实例创建后，里边有一个启动器，按照提示即可一键启动。

使用Hyper-SD

Hyper-SD 的推理加速是通过 LoRA 模型实现的，官方发布了多个 LoRA 模型供我们使用。这里我介绍其中最新的两种 LoRA 模型：Unified LoRA 和 CFG LoRA。

Unified LoRA

先来看 Unified LoRA（统一LoRA），所谓统一LoRA 就是我们可以只使用一个模型，就能执行 1-8步的推理，在最低的1步推理下图片质量也是有所保证的，而且随着推理步数的增加，图像中的元素越来越丰富，事物的个性特征也会更加明显。

1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_04,第4张

这个工作流中的节点不多，我这里做了一个简单的标注，如下图所示。文末提供工作流的下载方式。

1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD_AIGC_05,第5张

这里有几点注意下：

TCD采样调度：TCD采样调度器是搭配 Hyper-SD 统一LoRA 模型必备的，它的时间调度是专门调整过的；
负向提示词不需要填写；
CFG引导设置为1；
图片尺寸根据所选择的SD模型进行设置，SDXL的图片像素不要低于 1024*1024。

这个模型有什么用？一个字快，比如根据涂鸦实时或准实时生成图片：

1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD_公众号_06,第6张

CFG LoRA

CFG LoRA 可以让我们使用更强的提示词引导，包括负向提示词。官方训练的模型可以支持5-8的CFG系数。

工作流标注如下：

1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD,1步高清出图，字节开源Stable Diffusion加速模型 Hyper-SD_推理过程_07,第7张

这里有几点注意下：

1、LoRA模型：选择的是Hyper-SD CFG LoRA，这里使用的是8步模型，采样步数也要设置为8。最新的有12步模型，图片质量更高一些，但是生成时间也更长。

2、支持反向提示词：比如我们这里的 black hair，就是不要黑色的毛发。

3、采样低矮度还是使用 TCD采样调度器。

4、CFG需要设置为 5-8，具体值需要自己测试，选择适合自己模型和提示词的。

5、图片尺寸根据所选择的SD模型进行设置，SDXL的图片像素不要低于 1024*1024。

资源下载

模型

模型官方下载地址：huggingface.co/ByteDance/H…

如果你访问 Huggingface 不太方便，可以给公众号“萤火遛AI”发消息：Hyper-SD，即可获取。

工作流

工作流也发布在“萤火遛AI”公众号，发消息：Hyper-SD，可以同时获取工作流和模型。

以上就是本文的主要内容，如有问题，欢迎留言交流。

查看全文

https://www.xamrdz.com/lan/53q1960763.html