适配Diffusers框架的全套教程来了!从T2I-Adapter到大热ControlNet

在 ChatGPT 出圈不久,ControlNet 的横空出世很快在英文和中文互联网收获了众多开发者和普通用户,甚至有用户宣传 ControlNet 的出现将 AI 创作带入了直立行走的时代。不夸张地说,包括 ControlNet 在内,同期的 T2I-Adapter、Composer, 以及 LoRA 训练技巧,可控生成作为 AI 创作最后一道高墙,极有可能在可预见的时间内有进一步突破,从而极大地降低用户的创作成本,提高创作的可玩性。距离 ControlNet 开源仅仅过去两周,其官方 Star 就已经超过 1 万,这种热度无疑是空前的。

与此同时,开源社区也极大地降低了用户的使用门槛,如 Hugging Face 平台提供了基础模型权重以及通用的模型训练框架 diffusers,stable-diffusion-webui 开发了完善的一套 Demo 平台,Civitai 贡献了海量风格化 LoRA 权重。

Typewise.app Typewise.app

面向客户服务和销售团队的AI写作解决方案。

Typewise.app 39 查看详情 Typewise.app

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

图片

尽管 webui 作为目前最受欢迎的可视化工具,已经快速地支持了近期推出的各种生成模型,并且支持众多选项供用户设置。由于其重点考虑了前端界面的易用性,背后代码结构其实十分复杂,对于开发者而言不够友好。比如 webui 尽管支持了多种类型的加载和推理,但却无法支持不同框架下的转换,也无法支持模型的灵活训练。我们在社区讨论中发现了许多现有开源代码暂未解决的痛点。

首先,代码框架不兼容,目前热门的模型,如 ControlNet、T2I-Adapter,与主流的 Stable Diffusion 训练库 diffusers 不兼容,ControlNet 预训练的模型无法直接在 diffusers 框架中被使用。

其次,模型加载受限,目前模型保存格式多样,如.bin、.ckpt、.pth、.satetensors 等,除了 webui 外,目前 diffusers 框架对于这些模型格式的支持还有限,考虑到 LoRA 大部分模型以 safetensors 保存为主,用户很难直接将 LoRA 的模型加载到已有的基于 diffusers 框架训练的模型中。

第三,基础模型受限,目前 ControlNet、T2I-Adapter 均基于 Stable-Diffusion-1.5 进行训练,且仅开源了 SD1.5 下的模型权重,考虑到特定场景,已经存在诸如 anything-v4、ChilloutMix 等优质动漫模型,即使引入了可控信息,最终生成结果仍然受限于 SD1.5 中 UNet 的能力。

最后,模型训练受限,目前 LoRA 已经被广泛验证是风格迁移、保持特定形象 IP 最有效的方法之一,但 diffusers 框架目前仅支持 UNet 的 LoRA 嵌入,无法支持 text encoder 的嵌入,会限制 LoRA 的训练。

我们和开源社区讨论后,了解到 diffusers 框架作为通用代码库,正计划同时适配近期不断推出的生成模型;由于涉及较多底层接口重写,仍然需要一段时间更新。为此,我们从以上实际存在的问题出发,率先提出了对于每一个问题的自研解决方案,快速帮助开发者更容易地开发。

LoRA、ControlNet、T2I-Adapter 到 diffusers 的全适配方案

LoRA for diffusers

本方案是为了在 diffusers 框架,即基于 diffusers 训练保存的模型中,灵活嵌入各种格式的 LoRA 权重。由于 LoRA 的训练通常冻结 base model,因此可以作为可插拔模块轻松嵌入已有模型,作为风格或 IP 条件约束。LoRA 本身是一种通用的训练技巧,它的基本原理是,通过低秩分解,可以极大地减少模块的参数量,目前在图像生成中,一般用于训练独立于 base model 外的可插拔模块,实际使用是以残差形式与 base model 的输出合并。

首先是 LoRA 权重的嵌入,目前 Civitai 平台上提供的权重主要以 ckpt 或 safetensors 格式存储,分以下两种情况。

(1)Full model(base model + LoRA 模块)

如果 full model 是 safetensors 格式,可以通过以下 diffusers 脚本转换

python ./scripts/convert_original_stable_diffusion_to_diffusers.py --checkpoint_path xxx.safetensors--dump_path save_dir --from_safetensors

如果 full model 是 ckpt 格式,可以通过以下 diffusers 脚本转换

python ./scripts/convert_original_stable_diffusion_to_diffusers.py --checkpoint_path xxx.ckpt--dump_path save_dir

转换完成后,可直接利用 diffusers 的 API 进行模型加载

from diffusers import StableDiffusionPipelinepipeline = StableDiffusionPipeline.from_pretrained (save_dir,torch_dtype=torch.float32)

(2)LoRA only (仅包含 LoRA 模块)

目前 diffusers 官方无法支持仅加载 LoRA 权重,而开源平台上的 LoRA 权重基本以这种形式存储。本质上是完成 LoRA 权重中 key-value 的重新映射,使其适配到 diffusers 模型中。为此,我们自行支持这个功能,提供了转换脚本。

pipeline = StableDiffusionPipeline.from_pretrained (model_id,torch_dtype=torch.float32)model_path = "onePieceWanoSagaStyle_v2Offset.safetensors"state_dict = load_file (model_path)

只需要指定 diffusers 格式的模型,以及存储为 safetensors 格式的 LoRA 权重。我们提供了一个转换示例。

# the default mergering ratio is 0.75, you can manually set it python convert_lora_safetensor_to_diffusers.py

此外,LoRA 本身由于其轻量化,可以在小数据情况下快速完成训练,并能够嵌入到其他网络中。为了不局限于已有 LoRA 权重,我们在 diffusers 框架中支持了 LoRA 的多模块(UNet+text encoder)训练,并已经在官方代码库提交 PR(https://github.com/huggingface/diffusers/pull/2479),并支持了 ColossalAI 中训练 LoRA。

代码开源在:https://github.com/haofanwang/Lora-for-Diffusers

ControlNet for diffusers

图片

本方案是为了支持在 diffusers 框架中,使用 ControlNet。基于开源社区的部分尝试,我们提供了完整的 ControlNet+Anything-V3 使用用例,支持将 base model 从原本 SD1.5 的替换到 anything-v3 模型,使 ControlNet 具备较好动漫生成的能力。

此外,我们也支持 ControlNet+Inpainting,并提供了适配 diffusers 的 pipeline,

图片

图片

以及多条件控制的 Multi-ControlNet。

图片

代码开源在:https://github.com/haofanwang/ControlNet-for-Diffusers

T2I-Adapter for diffusers

图片

与 ControlNet 相似,我们也同时支持了同期开源的 T2I-Adapter 到 diffusers 的适配。

代码开源在:https://github.com/haofanwang/T2I-Adapter-for-Diffusers

目前以上三种适配方案均已经向社区开源,并在 ControlNet、T2I-Adapter 中被官方分别致谢,也收到了来自 stable-diffusion-webui-colab 作者的感谢。我们正在与 diffusers 官方保持讨论,会在近期完成以上方案向官方代码库的集成工作。也欢迎大家提前尝试我们的工作,有任何问题均可以直接提 issue,我们会尽快回复。

以上就是适配Diffusers框架的全套教程来了!从T2I-Adapter到大热ControlNet的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/839597.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月27日 11:58:35
下一篇 2025年11月27日 11:58:57

相关推荐

  • 分析师Jordi Visser分析:预计比特币(BTC)表现将如英伟达一样,在创新高前出现重大

    市场分析师Jordi Visser指出,比特币未来的表现或将复刻英伟达的走势,在冲击新高过程中经历数次幅度达20%甚至更大的回调。 Visser认为,尽管第四季度通常是加密资产表现强劲的时期,但比特币迈向历史新高的途中仍不可避免地会出现显著调整,其中部分回调可能超过20%。 他强调,比特币正日益融入…

    好文分享 2025年12月9日
    000
  • ARK Invest创始人木头姐:以太坊(ETH)将成机构首选 ARK首次建立稳固仓位

    目录 以下为对话内容摘选,由白话区块链编译。Q1:你最早对市场、金融系统和创新产生兴趣的记忆是什么?Q2:今天美联储决定维持利率不变。你对利率走向的看法是什么?Q3:加密货币在你对未来更强劲的愿景中扮演什么角色?Q4:ARK对Tom Lee的BitMine下了注,也是目前最大的以太坊持有者之一,能否…

    2025年12月9日
    000
  • 一百万TOKENs大概多少字?

    一百万Tokens约等于75万英文单词或55万-100万汉字,具体因语言、模型分词规则和文本复杂度而异,可处理2,500页文档或7.5万行代码,适用于代码分析、学术研究和法律文书等场景。 一百万Tokens相当于多少文字? 一百万Tokens大约对应750,000个英文单词或50万-100万个汉字,…

    2025年12月9日
    000
  • 什么是山寨币拉盘?如何使用ChatGPT预测山寨币上涨?

    关键要点 利用基本面、社交情绪和历史走势分析,ChatGPT可在山寨币启动前识别潜在上涨机会。精心设计的提示词能让ChatGPT扮演加密分析师角色,生成观察列表、监测社区热度,并筛选具备真实增长潜力的代币。结合CoinGecko、LunarCrush或DEXTools等平台使用,可验证ChatGPT…

    2025年12月9日 好文分享
    000
  • 数字货币复盘软件及技巧介绍

    使用专业复盘工具的交易者平均收益率提升37%以上,通过OKX盈亏分析、Ch%ignore_a_2%n.info链上追踪、3EX CryptoGPT策略优化、AICoin模拟训练与CoinAnk数据仪表盘等工具,结合K线形态识别、技术指标组合、链上数据应用与风险管理技巧,构建“数据→认知→迭代”闭环系…

    2025年12月8日
    000
  • 如何判断自己是不是韭菜?韭菜是被交易成本割的,而不是被庄家割的

    如何判断自己是不是韭菜?韭菜是被交易成本割的 ,而不是被庄家割的 韭菜是币圈非常欢乐的一个词,好像几乎所有的朋友都自称韭菜。抛开玩笑成分,我们真应该避免做个韭菜,不然的话,真被割了。 人贵自知,到底要怎么判断自己是不是韭菜呢?这可能是一个好问题。我觉得有一个指标可以回答,就是自己的交易成本。 你使用…

    2025年12月8日
    000
  • Alethea AI(ALI币)是什么?值得投资吗?ALI币主要特点及未来展望

    目录 什么是Alethea AI?什么是ALI代币?Alethea AI的历史Alethea AI的特点无需许可的协议质押iNFTs是什么让Alethea AI与众不同?Alethea AI 值得投资吗?Alethea AI的未来展望结语 随着chatgpt等人工智能技术的出现,人类正在进入一个新的…

    2025年12月8日
    000
  • ChatGPT怎么用?ChatGPT AI 在加密交易中的5 个实际应用案例

    目录 使用案例1:新闻摘要与情绪检测如何使用ChatGPT进行新闻摘要和情绪分析真实世界示例用例2:从新闻和图表构建交易设置如何使用ChatGPT 构建交易设置真实世界范例使用案例3: 历史情境回测如何使用ChatGPT 进行历史情境回测现实世界范例使用案例4: 交易日志与回顾如何使用ChatGPT…

    2025年12月8日 好文分享
    000
  • XRP币价格预测与未来前景分析:突破$3.6后XRP走势会如何?

    目录 短期技术分析:回调中的关键防御位基本面催化剂:三大引擎推动长期价值重估2025 长期预测:机构与 AI 模型的分歧目标交易策略与风险警示结语:技术与基本面的共振节点 截至 2025 年 7 月 25 日,xrp/usdt 报价 $3.14,较本周触及的历史高点 $3.66 回调逾 10%。尽管…

    2025年12月8日
    000
  • 如何使用ChatGPT代理进行加密货币交易?使用ChatGPT代理进行加密交易的具体教程

    目录 关键要点什么是ChatGPT Agent?人们为什么使用ChatGPT Agent进行交易?如何使用ChatGPT Agent进行加密交易:AI交易机器人教程1. 启用代理模式2. 定义您的提示3. 代理执行与监督4. 导出使用ChatGPT进行加密分析的用例使用ChatGPT代理进行加密交易…

    2025年12月8日 好文分享
    000
  • 如何使用ChatGPT 将热门新闻转换为加密交易信号?初学者指南

    目录 为何情绪分析对加密货币交易至关重要AI 交易助手:ChatGPT 能做与不能做的事它能做的事:它无法做的事情:如何使用ChatGPT 分析新闻和市场趋势如何使用ChatGPT 构建交易情境使用ChatGPT洞察生成技术分析交易信号逐步示例:从新闻到交易设置ChatGPT:简单的5步骤信号生成工…

    2025年12月8日 好文分享
    000
  • 以太坊、稳定币与加密股票:一个新时代?

    探索以太坊的主导地位、稳定币监管和加密股票的崛起。以太坊是新金融格局的基石吗? 以太坊、稳定币与加密股票:一个新时代? 数字金融世界正在快速重塑,以太坊、稳定币和加密股票逐渐成为关注的中心。接下来,我们将深入探讨这些领域的重要进展,以及它们对投资者和未来金融体系带来的影响。 以太坊:稳定币革命的基石…

    2025年12月8日
    000
  • Grok 是什么?如何运作?如何使用Grok AI 实时识别加密货币信号

    以下是你提供内容的伪原创版本,已确保不改变文章大意,同时保留了原始图片位置,未添加任何解释或说明: 目录 什么是Grok? 为什么情绪在加密货币中如此重要? 案例:马斯克推文后PEPE 币的价格暴涨(2024 年3 月) Grok 如何检测加密货币交易信号 代币提及激增 2.情绪分析 交易者如何利用…

    2025年12月8日 好文分享
    000
  • 十大最佳 AI 加密交易机器人

    人工智能加密交易机器人通过自动化执行交易策略提升效率,其核心在于使用机器学习算法、量化策略及预测分析消除情绪化决策,并实现全天候交易。1)它们依赖机器学习模型分析历史价格趋势;2)结合市场情绪分析社交媒体与新闻数据;3)通过回测优化策略后再执行;4)支持24/7自动化交易,比人类更快做出决策。安全性…

    2025年12月8日
    000
  • Palio AI(PAL币)是什么?是一个好投资吗?PAL代币经济与路线图介绍

    目录 1.项目定位:AI × Web3 数字宠物的新范式2.核心功能与技术亮点2.1 智能人格系统(Palio Core)2.2 游戏化机制 + 经济系统3.链上资产与经济体系4.路线图与发展阶段4.1 Phase 1:原型测试与社区共创4.2 Phase 2:AI 能力增强与游戏上线4.3 Pha…

    2025年12月8日
    000
  • 合成达尔文、人工智能系统与效用代币:未来正在进化

    深入了解 synthetic darwin、ai 系统与效用代币的未来图景。探索这一前沿技术如何重塑人工智能及其相关产业的发展格局。 围绕“Synthetic Darwin、AI 系统、效用代币”的话题正日益升温,这并不令人意外。这种融合人工智能与区块链的新颖方法正在酝酿一场变革,彻底改变我们对 A…

    2025年12月8日
    000
  • 加密市场周度赢家:XLM的卓越突破与AI预测

    stellar (xlm) 成为加密货币市场周度赢家!受 paypal 消息和火热市场的推动,xlm 能否突破 0.50 美元?ai 模型给出分析! 加密货币市场周度赢家:XLM 的强势崛起与 AI 预测 近期加密市场波动剧烈,而 XLM(Stellar)却展现出强劲的上涨动能!在过去七天内涨幅高达…

    2025年12月8日
    000
  • AI预测XLM价格飙升:Stellar能否再创新高?

    ai能否精准预判xlm价格走势?全面解析预测模型、市场动态与推动stellar升值的核心动力 AI预测XLM价格上扬:Stellar是否有望再攀高峰? Stellar(XLM)正逐渐成为市场的焦点,人工智能也参与到对其未来潜力的探讨之中。伴随着近期币价上涨及生态系统的持续优化,XLM是否具备进一步上…

    2025年12月8日
    000
  • 佩佩、预售和柴犬币:用小佩佩解读迷因币狂热

    小佩佩(lilpepe)正以迅猛的势头崭露头角,其发展蓝图融合了nft与专注模因币的启动平台。它会成为下一个柴犬币(shiba inu)吗? 佩佩、预售与柴犬币:揭开小佩佩背后的模因币热潮 模因币的世界总是充满戏剧性,不是吗?还记得2021年柴犬币(Shiba Inu)疯狂上涨的那段时期吗?如今,又…

    2025年12月8日
    000
  • ChatGPT、LilPepe与加密货币:乘着模因浪潮走向财富?

    探索 chatgpt 青睐的另类加密货币、lilpepe 等模因币的崛起之路,以及加密领域中潜藏的巨大收益机会。 加密世界的追随者们,准备好迎接风暴了吗!ChatGPT、LilPepe 等模因币与整个加密市场的融合正变得越来越引人注目。让我们一起揭开最新趋势的面纱,看看数字货币世界正在发生哪些变化。…

    2025年12月8日
    000

发表回复

登录后才能评论
关注微信