Stable Diffusion-XL开启公测,让你摆脱繁琐的长prompt!

自从Midjourney发布v5之后,在生成图像的人物真实程度、手指细节等方面都有了显著改善,并且在prompt理解的准确性、审美多样性和语言理解方面也都取得了进步。

相比之下,Stable Diffusion虽然免费、开源,但每次都要写一大长串的prompt,想生成高质量的图像全靠多次抽卡。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

最近Stability AI的官宣,正在研发的Stable Diffusion XL开始面向公众测试,目前可以在Clipdrop平台免费试用。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

试用链接:​https://clipdrop.co/stable-diffusion​

Stability AI的创始人兼首席执行官Emad Mostaque表示,目前该模型仍然处于训练阶段,等参数稳定后将会开源;SD-XL在「握手」等图像细节方面会表现更好,几乎完全可控。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Stable Diffusion XL也并不是最终发布版的名字,并且也并非是v3,因为SD-XL的架构和SD-v2系列的模型架构非常相似。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Minimalistic home gym with rubber flooring, wall-mounted TV, weight bench, medicine ball, dumbbells, yoga mats, high-tech equipment, high detail, organized and efficient.

简约的家庭健身房,橡胶地板,壁挂式电视,举重凳,药球,哑铃,瑜伽垫,高科技设备,高细节,组织和效率

下面几张SD-XL官方发布的例图,可以看出图像的质量已经非常能打了。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

不过有时候less并不代表more,有网友认为SD-XL为了摆脱「糟糕的品味」,设定了太多的规则,定制化空间越来越小,不符合大多数人的喜好。目前v1.5的Stable Diffusion仍然是社区内最流行的基座模型。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

网友表示希望新版SD能够和SD 2.1版本的嵌入、hypernetworkds和Lora模型保持兼容,再从零开始重训的话就太难受了。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Stable Diffusion Online Stable Diffusion Online

基于Stable Diffusion搭建的AI绘图工具

Stable Diffusion Online 20 查看详情 Stable Diffusion Online

也有网友认为,SD-XL的表现和civit网站上网友分享的模型差不多,新模型的效果也并不是特别惊艳,也就是平均水平。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

SD-XL:开源版Midjourney

关于Stable Diffusion XL模型的具体信息,官方并没有透露太多,目前只知道是一个与v2模型架构相似、但规模和参数量更大的模型。

SD-v2.1包括9亿参数,SD-XL大约有23亿参数,Emad表示正式版可能会额外发布一个更小的蒸馏版本。

SD-XL相比之前版本的改进如下:

使用较短的描述性prompt即可生成高质量图像可以生成更贴合prompt的图像图像中的人体结构更合理与 v2.1和 v1.5版本(程度较轻)相比,SD-XL生成的图片更符合大众审美负面提示词(negative prompt)是可选项生成的肖像图更逼真图像中的文本更清晰

需要注意的是,SD-XL可能与之前版本的插件不兼容。

清晰可读的文字

在v1系列和v2.1版本的Stable Diffusion模型中,并不具备在图片中生成可读文本的能力。

虽然SD-XL生成的文本信息并不总是准确,但确实得到了巨大的提升。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Photo of a woman sitting in a restaurant holding a menu that says “Menu”

一个女人坐在餐馆里拿着写着「Menu」的菜单

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Photo of a man holding a sign that says “Stable Diffusion”

一个男人举着写着「Stable Diffusion」的牌子

a young female holding a sign that says “Stable Diffusion”, highlights in hair, sitting outside restaurant, brown eyes, wearing a dress, side light

一个年轻的女性举着一个牌子,上面写着「Stable Diffusion」,头发高亮,坐在餐厅外面,棕色的眼睛,穿着裙子,侧灯

更好的人体结构

Stable Diffusion在生成人体解剖结构方面一直存在诸多问题,多几条腿、少个胳膊实在是太常见不过的问题,通常需要使用inpaint功能进一步对图像细节进行修正;或者是使用ControlNet的Open Pose功能从参考图像中复制人体的姿态。

比如说SD-v1.5生成瑜伽的图像,经常会出现扭曲的人体。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Photo of a woman in yoga outfit, triangle pose, beach in evening, rim lighting

一个女人的照片在瑜伽服装,三角形的姿势,海滩在晚上,边缘照明

SD-XL虽然生成的图像并不完美,不过在人体姿态方面已经有了显著的进步。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

更有美感(more aesthetic)

比如同样以屋子为主题,SD-XL可以生成更对称、视觉效果更好的照片。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

SD-XL在肖像照片上也有显著改进。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

photo shot of a woman

一个女人的照片

更贴合prompt的图像

SD-XL可以更好地理解输入的prompt,并生成更精确的图像。

比如以duotone(双色)为例,SD-v1.5只会生成黑白图像,而SD-XL则可以生成具有多种颜色的双色调图像。

与 v1模型相比,理解提示符的能力有所提高。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

duotone portrait of a woman

一个女人的双色调肖像

因为SD-XL同属v2系列模型,所以文本模型尺寸更大,可以比v1模型更好地理解提示词。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

比如下面的例子中,v1.5模型始终无法理解图像中的两个主题(机器人和人类),但SD-XL模型可以生成正常的图像(虽然机器人还是不够big)。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

big robot friend sitting next to a human, ghost in the shell style, anime wallpaper

大机器人朋友坐在人类旁边攻壳机动队风格的动漫壁纸

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

a young man, highlights in hair, brown eyes, in white shirt and blue jean on a beach with a volcano in background

一个年轻人,头发染得很亮,棕色眼睛,穿着白衬衫和蓝色牛仔裤,站在海滩上,背景是一座火山

艺术风格

在艺术风格上,SD-XL并没有显著改进,和之前的版本各有千秋。

比如两个模型以不同的角度生成了Edward Hopper风格的图像。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

New York city by Edward Hopper

Edward Hopper绘制的纽约

Leonid Afmov 的风格中,SD-v1.5更准确,SD-XL缺少了不同颜色的笔刷(unmistakable colorful board brushstrokes)。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

New York city by Leonid Afremov

Leonid Afemov绘制的纽约

William-Adolphe Bouguereau风格中,V1.5和SDXL都可以生成一些类似的内容,其中SD-XL更接近Bouguereau创作的经典学院派绘画,并且面部细节更多。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

Portrait of beautiful woman by William-Adolphe Bouguereau

William-Adolphe Bouguereau绘制的美女肖像

风格转变问题

在添加一些无关紧要的关键字后,模型的风格可能会突然转变。

比如先生成一张照片风格的图像。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

a young man, highlights in hair, brown eyes, in white shirt and blue jean on a beach with a volcano in background

一个年轻人,头发染得很亮,棕色眼睛,穿着白衬衫和蓝色牛仔裤,站在海滩上,背景是一座火山

再添加一条黄色的围巾后,图像风格就变成了卡通风格。

Midjourney危!Stable Diffusion-XL开启公测:会画手、能写字,再也不用写长prompt了

a young man, highlights in hair, brown eyes, wearing a yellow scarf, in white shirt and blue jean on a beach with a volcano in background

一个年轻人,头发染得很亮,棕色的眼睛,围着黄色的围巾,穿着白衬衫和蓝色牛仔裤,站在一个火山为背景的海滩上

问题的故障可能源于预览问题,在正式发布后该问题不知能否得到解决。

以上就是Stable Diffusion-XL开启公测,让你摆脱繁琐的长prompt!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/556552.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 22:49:17
下一篇 2025年11月9日 22:50:16

相关推荐

  • 人工智能工具市场

    AIprophetic.com 网站文章列表: 2025年: 2025-01-24: 人工智能工具市场概览 (https://www.php.cn/link/1c52486ff0b2a44fbfefeb15d21f53ae)2025-01-24: ChatGPT 故障排除及替代方案 (https:/…

    2025年12月19日
    000
  • 开源 C++ 框架如何利用社区贡献提升可扩展性和维护性?

    开源 c++++ 框架利用社区贡献增强可扩展性和可维护性:可扩展性:添加新功能模块化设计可插件架构可维护性:改进文档修复错误代码审查实战案例: boost 库通过社区贡献,扩展了新库,持续维护现有库,提供了广泛的文档,提升了可扩展性和可维护性。 开源 C++ 框架を活用:利用社区贡献增强可扩展性和可…

    2025年12月18日
    000
  • 深度了解开源和商业C++框架之间的差异,以做出最佳选择

    在选择 c++++ 框架时,开源和商业选项的区别在于:许可证:开源框架免费且可修改,而商业框架通常受限。支持:开源框架依靠社区支持,而商业框架提供付费专业帮助。特性:开源框架特性广泛,但稳定性各异,而商业框架通常经过维护,功能可靠。成本:开源框架免费,而商业框架需要许可费用,价格可能很高。根据项目需…

    2025年12月18日
    200
  • C++开源框架与商用框架有何异同?

    商用框架需要购买许可证且拥有专业支持,而开源框架免费且可自定义,具备广泛的社区支持。差异还包括:许可证限制:开源框架更宽松,而商用框架更严格。安全性:商用框架通常经过更严格的测试和审核。认证:某些商用框架已通过行业认证。 C++ 开源与商用框架对比 引言 在现代 C++ 开发中,框架已成为必不可少的…

    2025年12月18日
    000
  • 开源 C++ 框架与商业 C++ 框架的最佳实践有何不同?

    开源和商业 c++++ 框架的最佳实践取决于以下关键差异:许可:开源框架使用免费和开源许可证,允许修改和分发,而商业框架受专有许可证限制。支持:开源框架依赖社区支持,而商业框架提供官方支持和服务。定制:开源框架更具可定制性,而商业框架提供预先构建的组件。价格:开源框架免费,而商业框架需要付费许可证。…

    2025年12月18日
    000
  • 开源C++框架与C++库的区别

    框架提供结构和预建组件,加快开发但限制灵活性。库提供特定功能的实现,扩展功能而不影响结构。例如,qt 框架简化了 gui 开发,而 opencv 库提供了计算机视觉功能。 开源 C++ 框架与库的区别 在软件开发中,框架和库是两种不同的概念。两种工具都可以在加快开发时间和提高代码质量方面发挥重要作用…

    2025年12月18日
    000
  • C++框架的开源与商业模式演变趋势如何?

    c++++ 框架开源与商业模式趋势:开源框架兴起,提供免费且强大的工具。商业框架适应竞争,提供附加功能和支持。混合模型流行,结合开源框架和商业附加组件。qt 作为案例,同时提供开源和商业许可选项。应对策略:评估选项、考虑混合模型、与社区互动。 C++ 框架开源与商业模式演变趋势 引言 开源 C++ …

    2025年12月18日
    000
  • 开源C++框架 vs 商业C++框架:专业人士解读

    开源 C++ 框架与商业 C++ 框架:专业人士的视角 在 C++ 应用开发的世界中,开源和商业框架之间存在着激烈的竞争。每个阵营都有其优缺点,并且根据具体项目要求进行明智的选择至关重要。 开源 C++ 框架 优点: 免费且社区支持丰富高度可定制和灵活可见性高,文档齐全 缺点: 可能缺乏专业支持社区…

    2025年12月18日
    000
  • 如何对比不同C++框架的开源性和商业许可模型?

    了解 c++++ 框架的开源性和商业许可模型至关重要:研究开源许可证:框架通常使用 apache 2.0、mit 等开放源代码许可证。了解许可协议以确保符合项目要求。考虑商业许可证:商业许可证授予额外权利和支持,需要支付费用,但可能包括技术支持和定制开发。对比不同框架:通过比较表格了解特定 c++ …

    2025年12月18日
    300
  • 开源和商业C++框架对比:究竟有何优劣?

    开源和商业 c++++ 框架各有优劣:开源框架:免费,社区支持,可定制,支持新技术,但技术支持有限,质量控制受限,许可限制。商业框架:提供全面支持,稳定可靠,组件预配置,企业级支持,但价格昂贵,源代码封闭,供应商锁定。选择建议:开源框架适合需要定制、技术支持要求不高、预算有限的项目;商业框架适合稳定…

    2025年12月18日
    000
  • 开源C++框架与商业C++框架:成本效益分析

    对于 c++++ 框架,开源框架免除前期费用和提供无限次使用,而商业框架则需支付许可或订阅费。开源框架功能有限但可定制,商业框架功能丰富但灵活性较差。初创公司和需要定制的企业倾向于开源框架,而企业机构和需要广泛功能的企业倾向于商业框架。 开源与商业 C++ 框架的成本效益分析 在选择 C++ 框架时…

    2025年12月18日
    000
  • 深度剖析:开源C++框架和商业C++框架的优劣势

    开源框架的优点是成本节约、灵活性、社区支持和透明度,而缺点是技术支持有限、质量不可靠和安全性问题。商业框架的优点是全面的技术支持、更高的质量和可靠性、针对性优化,而缺点是许可费用、限制性许可和供应商锁定。具体选择取决于项目需求,开源框架提供成本节约和灵活性,而商业框架提供全面的支持和可靠性。 深入分…

    2025年12月18日
    000
  • 从业者视角:开源C++框架与商业C++框架对比

    从开发者的角度来看,开源c++++框架因其免费、可定制且社区支持活跃而受青睐。商业c++框架则以官方支持、完善文档和经过验证的质量取胜,但也需要支付许可费并限制可定制性。在选择时,小型项目、研究项目或熟练团队更适合开源框架,而企业级项目或注重可扩展性、稳定性的项目则更适合商业框架。 从业者视角:开源…

    2025年12月18日
    000
  • C++框架大比拼:开源与商业谁更胜一筹?

    对于 c++++ 框架选择,开源与商业各有千秋:开源框架:免费、灵活,社区支持强,但缺乏技术支持和保证。商业框架:提供支持、文档齐全、版本稳定,但需要许可费,限制灵活性,社区支持有限。 C++ 框架大比拼:开源与商业,谁更胜一筹? C++ 广泛应用于打造高性能、高效的应用程序。选择合适的框架至关重要…

    2025年12月18日
    000
  • 开源还是商业?C++框架选用指南

    开源与商业 c++++ 框架优缺点对比:开源框架:免费使用,社区支持,可定制性强,但性能和商业支持有限。商业框架:性能稳定,专业支持,预置组件,但需付费,定制性受限,开源贡献受限。根据项目需求,选择开源框架适用于灵活性、成本优先的项目,而商业框架适用于高性能、稳定性、技术支持要求高的项目。 开源还是…

    2025年12月18日
    000
  • C++框架评估:开源与商业的全面解析

    摘要:开源c++++框架的优点包括免费、社区支持和灵活性,但缺乏支持和安全性问题。商业框架提供专业支持、性能和稳定性,但需要费用、受限的定制和供应商锁定。选择框架时,应考虑应用程序要求、预算、可定制性、社区支持等标准,根据项目需求做出明智的决策。 C++ 框架评估:开源与商业的全面解析 在选择 C+…

    2025年12月18日
    000
  • 特定领域C++框架的开源和商业解决方案比较

    特定领域c++++框架(dsf)旨在简化开发工作并提高应用程序质量。可用的dsf包含开源和商业解决方案。开源解决方案boost:广泛的c++库集合,涵盖字符串处理、网络编程等领域。opencv:计算机视觉和机器学习库,提供图像处理和物体检测算法。商业解决方案the qt framework:跨平台g…

    2025年12月18日
    000
  • C++ 框架的开源选项有哪些?

    c++++ 开发中的开源框架提供了众多优势,包括可重用代码、设计模式和最佳实践。本文重点介绍了五个流行的开源 c++ 框架:qt:用于创建跨平台 gui,提供丰富的组件、布局管理和信号/槽机制。boost:c++ 标准库的扩展,包含容器、算法、并发和字符串处理等功能。wxwidgets:跨平台 gu…

    2025年12月18日
    000
  • 出售整个Midjourney API后端!

    mjapi.io后端源代码现已公开!这是一个重要的里程碑,标志着我们图像生成模型访问方式的重大转变。 为什么进行架构升级? 原Python后端虽适合个人用户,但难以应对数百并发用户的扩展需求。 此版本包含: 完整的SaaS后端: 集成支付、用户验证、垃圾邮件检测、任务队列等功能,约50%代码可复用。…

    2025年12月13日
    000
  • 怎么看php源码是不是开源_辨php源码是否开源方法

    要判断PHP源码是否开源,需检查根目录是否有LICENSE等文件并确认其为MIT、GPL等公认许可证;查看.php文件头部注释是否包含License关键词或链接;核实项目托管平台(如GitHub)页面是否标明许可证类型;使用FOSSA、Snyk等工具扫描代码库进行自动化检测;最后依据开源定义四大自由…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信