推广 热搜： 金中国公司服务企业未来政策设备行业基金

Stable Diffusion本地化部署超详细教程（手动+自动+整合包三种方式）

日期：2024-11-05 作者：caijiyuan caijiyuan 评论：0 移动：http://lanlanwork.gawce.com/mobile/news/9390.html

核心提示：一、 Stable Diffusion简介2022年作为AIGC（Artificial Intelligence Generated Content）时代的元年，各个领

一、 Stable Diffusion简介

2022年作为AIGC（Artificial Intelligence Generated Content）时代的元年，各个领域的AIGC技术都有一个迅猛的发展，给工业界、学术界、投资界甚至竞赛界都注入了新的“AI活力”与“AI势能”。

Stable Diffusion本地化部署超详细教程（手动+自动+整合包三种方式）

其中在AI绘画领域，Stable Diffusion当仁不让地成为了开源社区中持续繁荣的AI绘画核心模型，并且快速破圈，让AIGC的ToC可能性比肩移动互联网时代的产品，每个人都能感受到AI带来的力量与影响。Stable Diffusion由CompVis研究人员创建的主要用于文本生成图像的深度学习模型，与初创公司StabilityAI、Runway合作开发，并得到EleutherAI和LAION的支持，它主要用于根据文本的描述产生详细图像，也就是常说的txt2img的应用场景中：通过给定文本提示词（text prompt），该模型会输出一张匹配提示词的图片。例如输入文本提示词：A cute cat，Stable Diffusion会输出一张带有可爱猫咪的图片（如下图）。

Stable Diffusion（简称SD）是AI绘画领域的一个核心模型，与Midjourney不同的是，Stable Diffusion是一个完全开源的项目（模型、代码、训练数据、论文、生态等全部开源），可拓展性强、出图效率高、数据安全保障，这使得其能快速构建强大繁荣的上下游生态，并且吸引了越来越多的AI绘画爱好者加入其中，与AI行业从业者一起推动AIGC领域的发展与普惠。可以说，AI绘画的ToC普惠在AIGC时代的早期就已经显现，这是之前的传统深度学习时代从未有过的。

Stable Diffusion模型基于一个扩散过程，逐步从噪声中恢复出图像信息。在训练阶段，模型会学习如何逐步将噪声转化为真实的图像数据；而在生成阶段，模型则可以从随机噪声出发，通过反向的扩散过程，生成出与训练数据分布相似的图像。Stable Diffusion主要由变分自编码器（VAE）、U-Net和一个文本编码器三个部分组成。在前向扩散过程中，高斯噪声被迭代地应用于压缩的潜在表征。每个去噪步骤都由一个包含残差神经网络（ResNet）的U-Net架构完成，通过从前向扩散往反方向去噪而获得潜在表征。最后，VAE解码器通过将表征转换回像素空间来生成输出图像。

我们可以通过官方网站 Stability AI，以及Dream Studio、Replicate、Playground AI、baseten等网站在线体验Stable Diffusion的巨大威力。但是，一方面国外的网站访问毕竟还是不方便（经常需要科学上网，你懂的），另一方面也不想让自己的一些“幼稚”想法被他们“窃取”。相比于集成在网络平台的SD或者其他AI绘画平台来说，自部署平台没有生成数量的限制，不用花钱，不用被NSFW约束，生成时间快，不用排队，自由度高，而且功能完整，插件丰富，可以调试和个性化的地方也更多；更稳定，也更容易让SD变成生产力或者商业化使用。既然这样，那就自力更生，在本机上自己部署一个，可以随心所欲地玩图、玩图…。

二、Stable Diffusion v2安装

1. 安装前的准备

现有深度学习训练和部署环境在硬件上一般基于Nvidia GPU，在底层需要显卡驱动和CUDA工具包（需要包含配套版本的cuDNN），在应用软件层面需要Python编译和解释器，以及基于Python的深度学习框架（如Pytorch、TensorFlow等）。同时，为了方便代码自动下载和程序模块化管理，通常还需要安装git和conda软件。笔者（Sheex2012）主机配备了RTX 4070Ti 12G显卡，并事先安装了CUDA 12.1，Python 3.11.6，git 2.44，Pytorch 2.1.2，能够满足Stable Diffusion环境要求。本文重点聚焦Stable Diffusion推理程序的部署，硬件需求确认和基础软件的安装这里不再赘述。

2. 下载和部署Stable Diffusion

我们从Stability.AI的github官方开源Stability.AI Stablediffusion下载源码：

当然，也可以从网页上以下载源码ZIP包，解压缩到本地。

源码下载完成后，接下来需要安装项目的依赖项：

然后从huggingface下载预训练模型v2-1_768-ema-pruned.ckpt，并存放到checkpoints文件夹中。

3. 运行Stable Diffusion

部署完成后，运行下述脚本，生成图片：

可是，报错了：

这个应该是目录结构的问题，将ldm拷贝/移动到script文件夹，再来一次，不出意外，还是有点小意外，内存不够了：

那就把图像的尺寸调整成512x512，问题解决了。

这是生成的图片（存放在outputs xt2img-samples文件夹中）：

三、 Stable Diffusion WebUI 安装

Stable Diffusion只是提供一个模型，提供基础的文本分析、特征提取、图片生成这些核心功能，但自身是没有可视化UI的，用起来就是各种文件加命令行。原始的Stable Diffusion程序（脚本）只能以命令行的方式进行，参数设置很不方便，而且每次调用时，需要事先加载预训练模型，图像生成完成后会释放内存中的模型并结束进程，运行效率低，交互操作极其麻烦。

开源的 Stable Diffusion 社区受到了广泛民间开发者大力支持，众多为爱发电的程序员自告奋勇的为其制作方便操控的 GUI 图形化界面。其中流传最广、功能最强也是被公认最为方便的，就是由越南超人 AUTOMATIC1111 开发的 WebUI，即大名鼎鼎的Stable Diffusion WebUI。可以看到github上的start已经超过130k了，真是神一样的存在。

PS，大神的头像直接使用了越南盾中胡志明头像。

Stable Diffusion WebUI集成了大量代码层面的繁琐应用，将 Stable Diffusion 的各项绘图参数转化成可视化的选项数值和操控按钮，用户可以直接通过 Web 页面使用 Stable Diffusion。如今各类开源社区里 90%以上的拓展应用都是基于它而研发的。

Stable Diffusion WebUI是一个最流行的开源 Stable Diffusion 整合程序，其核心功能是文生图和图生图，这也是 Stable Diffusion 的核心能力。Stable Diffusion WebUI 的其它功能，比如ControlNet、高清放大、模型训练等等都是其它第三方开发的，有的已经内置到 WebUI 中，随着 WebUI 的发布而发布，有的还需要用户手动安装。

当然，除了 WebUI 还有一些其他的 GUI 应用，比如 ComfyUI 和 Vlad Diffusion 等，不过它们的应用场景更为专业和小众，感兴趣的可以点击下面的 GitHub 链接了解，这里就不再赘述了。

1. 手动安装

我们先手动方式一步一步安装，从中体验一下其中的繁琐（其实，这对于从事深度学习的相关技术人员来说是常规操作）。

首先，从github上下载源码：

其次，下载安装Stable Diffusion WebUI的依赖项：

好了，开始魔法吧。

进入 http://127.0.0.1:7860网站，输入提示词：

反向提示词：

点击，Generate按钮，3.9秒后，生成一幅女孩肖像画。GPU占用3.8G左右。

如果觉得全是英文的界面操作起来不够方便，可以：

1）从Stable-diffusion-webui 的汉化扩展下载汉化语言包，把"localizations"文件夹内的"Chinese-All.json"和"Chinese-English.json"复制到"stable-diffusion-webuilocalizations"目录中；

2）点击"Settings"，左侧点击"User interface"界面，在界面里最下方的"Localization (requires restart)“，选择"Chinese-All"或者"Chinese-English”；

3）点击界面最上方的黄色按钮"Apply settings"，再点击右侧的"Reload UI"即可完成汉化。

不过，个人觉得汉化后的文字有点拥挤。

2. 自动安装

事实上，Stable Diffusion WebUI官方网站中不再有手动安装的步骤，我的理解是作者鼓励大家采用自动安装方式，而自动安装的确非常方便的。当我们下载完成Stable Diffusion WebUI源码后，在确保已经安装了Python 3.10.6和git后，双击批处理文件webui-user.bat即可。

从命令行窗口输出，我们看到，批处理命令自动下载安装了Pytorch等依赖项：

从github clone 并安装Clip Open_Clip等依赖程序，而且，由于众所周知的原因，从github clone 源码会经常报错：

没关系，接着多运行几遍即可。然后，再从从huggingface下载预训练模型v1-5-pruned-emaonly.safetensors（当然，还是会报错）：

自动安装和手动安装在结果上是没有区别的，都是下载源码、下载安装依赖项（包括二进制和github源码）、下载预训练模型，然后按照配置参数运行程序。自动安装过程把上述过程全部放到批处理文件中webui-user.bat，让我们来看看它到底做了啥。

webui-user.bat只有短短几行，首先将四个环境变量置空，然后调用webui.bat，所以webui.bat默默承担了所有。

2) webui.bat 简要分析

首先，webui.bat在7-9行设置了PYTHON、GIT、VENV_DIR 三个环境变量，其中VENV_DIR 在当前目录中新建venv文件夹；其次，在16行测试调用Python程序；然后在第22行测试pip命令可用性。

接下来的37-40行是创建虚拟环境的关键，37行获得当前系统的缺省Python路径，39行利用 -m venv参数，运行此命令将创建目标目录venv，并使用键将文件放置在其中，该文件指向运行该命令的 Python 安装(目标目录的通用名称为)。

基于venv的虚拟环境创建完成后，先激活该虚拟环境，再调用launch.py。至此，批处理文件的任务基本完成，并将控制权交给launch.py脚本。

3) launch.py 脚本简要分析

可以看到，有个prepare_environment函数，显然是它在负责环境初始化工作。

4) prepare_environment函数分析

prepare_environment函数（上述代码是简化后的核心代码），基本上就是利用pip和git下载和安装依赖项（作者一直强调事先需要部署好git的原因就在这儿），和手动安装过程对应了起来。

四、秋叶整合包安装

Stable Diffusion秋叶整合包是中国大神秋叶（bilibili@秋葉aaaki）基于Stable Diffusion WebUI内核开发的整合包，内置了与电脑本身系统隔离的Python环境和Git（包含了第三部分需要下载和安装的依赖项、github依赖包、预训练模型以及相当多的插件）。可以忽略网络需求和Python环境的门槛，让更多人轻松地使用Stable Diffusion WebUI。超简单一键安装，无任何使用门槛，完全免费使用，支持Nvdia全系列显卡，近期发布了Stable Diffusion整合包v4.8版本（整合包v4.8）。

1）确认配置：
系统：Windows 10及以上系统
显卡：建议在本机安装Nvidia独立显卡，并且显存要达到6G以上，6G只能出图，如果要做训练建议12G以上。
2）下载文件
下载到本地，最好不要有中文目录，最新版下载链接： https://pan.quark.cn/s/2c832199b09b

3）点击“A绘世启动器”

4）点击“一键启动”

5）进入网站

这个界面比原始的炫多了。我们看到了类似的命令行输出：

五、推理程序安装方式讨论

1. 整合包需要做什么

因此，要完整地安装一套基于深度学习的应用程序，通常来讲有虚拟环境创建、程序及依赖项下载安装、预训练模型等运行数据下载等重要步骤。对于一个从事深度学习的研究者来说，这些步骤不难，缺什么就补充安装什么。但对于普通的爱好者来说，这个过程就太过于复杂了，因此自动安装要把上述步骤全部在后台一步步下载安装和验证，建立起一个独立的虚拟运行环境；而整合包则更进一步，直接就是一个“绿色版”。

2. 为什么是Python3.10 ?

WebUI的作者AUTOMATIC1111在页面中，强调了Python的版本，需采用3.10.6版本，给出的理由是担心新版本的Python不支持Pytorch。

笔者的主机先前已经成功安装了Python 3.11.6和Pytorch 2.1.2，觉得作者的担心有点多余，就在主机环境中继续安装部署。

而且运行时，反正警告我们Python版本不兼容：

经过仔细比对，我们发现即便已经成功安装了xformers包，系统还是提示no module ‘xformers’，让我们颇感意外。

经分析，xformers依赖一个’triton’包：

而’triton’包没有编译好的适合于Windows的wheel，自然也就无法安装。而有人针对Python 3.10编译好好了一个版本，而这个包在Python 3.11版本下安装时失败的。我猜测，这可能是作者反复强调使用Python 3.10的原因。

六、小结

近年来，随着AIGC技术的飞速发展，深度学习模型的本地化部署和应用技术也得到了充分重视，各种一键式安装程序层出不穷，大大降低了模型的部署复杂性，进一步促进了AIGC的普惠应用。将虚拟环境创建、程序下载部署、数据下载部署等复杂过程一步步地串联起来，并将常用运行环节和数据整合成一体，实现一键直达，方便“小白”使用，成为一种流行而有效的方法。

本文仅仅安装部署了Stable Diffusion WebUI的主要成分，SDXL，以及其丰富的插件尚未涉及，后续一要将各个插件系统用起来，二要深入Stable Diffusion原理，并与Stable Diffusion使用结合，探索出更加有意思的东东。而对于具备极客精神的 AI 绘画爱好者来说，使用 Stable Diffusion 过程中可以学到很多关于模型技术的知识，理解了 Stable Diffusion 等于就掌握了 AI 绘画的精髓，可以更好的向下兼容其他任意一款低门槛的绘画工具。

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

👉[[CSDN大礼包：《StableDiffusion安装包&AI绘画入门学习资料》免费分享]]（安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括：stable diffusion安装包、stable diffusion0基础入门全套PDF，视频学习教程。带你从零基础系统性的学好AI绘画！

👉stable diffusion新手0基础入门PDF👈

👉AI绘画必备工具👈

👉AI绘画基础+速成+进阶使用教程👈

👉大厂AIGC实战案例👈

本文地址：http://lanlanwork.gawce.com/news/9390.html 阁恬下 http://lanlanwork.gawce.com/ , 查看更多

更多>同类行业资讯

0 条相关评论

新闻列表

企业新闻

推荐企业新闻

推荐图文

推荐行业资讯

点击排行

• 健康消费加速向“新” 市场前景广阔	• scratch编程少儿版电脑版 1.5.8官方版scratch
• 【慎入女性手机「【慎入」	• 从脚步声到“吱吱盒”，拟音师的孤独与热爱｜影
• 波杰抢戏詹库对决：28+8+8三分连创新高末节决	• 上市险企推动业务结构转型：分红险占比提升助力
• 笔记本热点手机连不上一直正在连接-笔记本开热	• 华为手机有电自动关机是怎么回事华为手机自动关
• 如何免费获取Windows10激活密钥？Win10统用激活	• 计算机硬盘内存不足,电脑提示磁盘空间不足怎么

Stable Diffusion本地化部署超详细教程（手动+自动+整合包三种方式）

一、 Stable Diffusion简介

二、Stable Diffusion v2安装

1. 安装前的准备

2. 下载和部署Stable Diffusion

3. 运行Stable Diffusion

三、 Stable Diffusion WebUI 安装

1. 手动安装

2. 自动安装

四、 秋叶整合包安装

五、推理程序安装方式讨论

1. 整合包需要做什么

2. 为什么是Python3.10 ?

六、小结

关于AI绘画技术储备

👉stable diffusion新手0基础入门PDF👈

👉AI绘画必备工具👈

👉AI绘画基础+速成+进阶使用教程👈

👉大厂AIGC实战案例👈

四、秋叶整合包安装