岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

​近日,由Emad Mostaque创立和资助的Stability.ai公司宣布公开发布AI创造的艺术作品。

你可能认为这只是AI在艺术领域的另一次尝试,但实际上远不止如此。有两个原因。 首先,与DALL-E 2不同的是,Stable Diffusion是开源的。这意味着任何人都可以利用它的骨干,免费建立针对特定文本到图像创作任务的应用程序。 另外,Midjourney的开发者实施了一项功能,允许用户将其与Stable Diffusion结合起来,这导致了一些惊人的结果。 

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 试想一下,在接下来的几个月里会出现什么。 第二,与DALL-E mini和Disco Diffusion不同,Stable Diffusion可以创造出惊人的逼真和艺术作品,对OpenAI或谷歌的模型没有什么可羡慕的。人们甚至声称它是「生成式搜索引擎」中新的SOTA。 (除非另有说明,本文所有图片都是通过Stable Diffusion创作的)。 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 Stable Diffusion 体现了人工智能艺术世界的最佳特征:它可以说是现有最好的人工智能艺术模型,而且是开源的。这简直是闻所未闻,将产生巨大的影响。 更有趣的是,关于这些服务的消息可能会通过最意想不到的来源到达你的手中。你的父母、你的孩子、你的伴侣、你的朋友或你的同事。 这些人往往是人工智能领域发生的事情的局外人,他们即将发现这个领域的最新趋势。艺术可能成为AI最终敲开那些对未来视而不见的人的大门的方式。这不是很有诗意吗? 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

不只是开源的DALL·E 2

Stability.ai的诞生是为了创造「开放的AI工具,让我们发挥潜能」。不仅仅是从未进入大多数人手中的研究模型,而是具有现实世界应用的工具,开放给我和你来使用和探索。

​ 这是与其他科技公司不同的地方,比如OpenAI,它嫉妒地守护着它最好的系统(GPT-3和DALL-E 2)的秘密,或者谷歌,它甚至从未打算将自己的(PaLM、LaMDA、Imagen或Parti)作为私人测试版发布。 Stability.ai的这次公开发布不仅分享了模型权重和代码——虽然这对科学和技术的健康发展很关键,但大多数人并不关心它们。而且还为我们这些不想或不知道如何编码的人提供了一个无代码的即用型网站。 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 网站名叫DreamStudio Lite,可以免费使用,最多可生成200张图片。像DALL-E 2一样,它采用付费订阅模式,可以用10英镑获得1千张图片(OpenAI每月补充15个积分,但要获得更多的积分,你必须以15美元购买115个包)。 DALL-E的成本为0.03美元/图,而Stable Diffusion的成本为0.01英镑/图。 此外,还可以通过API大规模地使用Stable Diffusion(成本呈线性增长,所以你可以用1000英镑获得100K代)。除了图像生成,Stability.ai很快将宣布DreamStudio Pro(音频/视频)和Enterprise(工作室)。 DreamStudio可能很快会实现的另一个功能是,可以从其他图像生成图像,而不是通常的文本到图像的设置。就像下面这样: 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

  在网站上,还有一个关于提示工程的资源,如果你是这方面的新手,你可能会用得上。另外,与DALL-E 2不同,你可以控制参数来影响结果,并对其保留更多的代理权。 Stability.ai已经做了一切来促进人们对模型的访问。OpenAI是第一个,必须走得更慢,以评估模型固有的潜在风险和偏见,但他们不需要将模型保持在封闭测试阶段这么久,也不需要建立这样一个限制创造力的商业模式。 Midjourney和Stable Diffusion都已经证明了这一点。 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

安全+开源 > 隐私和控制

开源技术有其自身的局限性。开放性应该走在隐私和严格控制之前,但不应该走在安全之前。 正如该公司在公告中解释的那样,它是「一个允许商业和非商业使用的许可」,重点是模型的开放和负责任的下游使用。它还强制要求衍生作品至少要受到同样的基于用户的限制。 

模力视频 模力视频

模力视频 – AIGC视频制作平台 | AI剪辑 | 云剪辑 | 海量模板

模力视频 51 查看详情 模力视频

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 开源模型本身是很好的模式,但如果我们不希望这项技术最终伤害人们,或以错误信息的形式为互联网增加更多的傲慢,建立合理的护栏也同样重要。 「由于这些模型是在广泛的互联网搜刮的图像-文本对上训练出来的,模型可能会重现一些社会偏见,产生不安全的内容,所以开放的缓解策略以及对这些偏见的公开讨论可以让大家参与到这个对话中来。」 在任何情况下,开放性+安全性>隐私和控制。 

开源力量改变世界

凭借道德价值和开放性的坚实基础,Stable Diffusion承诺在现实世界的影响方面超越其竞争对手。

对于那些想下载它并在他们的电脑上运行它的人来说,你应该知道它需要6.9Gb的VRAM–这适合于高端消费级GPU,使它比DALL-E 2要轻,但对大多数用户来说仍然是遥不可及的。其余的人,像我一样,可以马上开始使用Dream Studio。 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 Stable Diffusion 被普遍认为是目前最好的AI艺术模型,它将成为无数应用程序、网络和服务的基础,重新定义我们如何创造和与艺术互动。 但现在,专门为不同使用情况设计的应用程序将从头开始建立,供所有人使用。人们正在增强儿童画,用外画+内画制作拼贴画,设计杂志封面,画漫画,创造变形和动画视频,从图像中生成图像,等等。 其中一些应用在DALL-E和Midjourney中已经成为可能,但Stable Diffusion可以推动当前的创意革命进入下一个阶段。用前特斯拉AI总监、李飞飞高徒Andrej Karpathy的话说,就是让「艺术创作进入了人类+AI合作的新时代。」 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 像Stable Diffusion这样的AI艺术模型涉及到一类新工具,应该用我们所处的新现实的新思维框架来理解。我们不能简单地与其他时代进行类比或平行对比,并期望能够准确地解释或预测未来。 有些事情会相似,有些则不会。我们必须把这个即将到来的未来当作未知的领域。 

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

写在最后

毫无疑问,Stable Diffusion的公开发布是人工智能艺术模型领域有史以来最重要和最有影响的事件,而这只是一个开始。

 作者之一的Emad Mostaque在Twitter上说:”随着我们发布更快、更好和具体的模型,预计质量将继续全面上升。不仅仅是图像,下个月是音频,然后转向3D、视频。语言、代码,以及更多训练。

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

 我们正处于一场为期数年的革命的边缘,在我们互动、联系和理解艺术,特别是一般的创造力的方式。而且不仅仅是在哲学、知识领域,而是作为现在每个人都分享和体验的东西。 创意世界将永远改变,我们必须进行开放和尊重的对话,为所有人创造一个更好的未来。只有负责任地使用开源技术,才能创造我们希望看到的变化。​

以上就是岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/552832.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 20:48:13
下一篇 2025年11月9日 20:58:46

相关推荐

  • ai生成视频入口

    ai生成视频入口: 即梦ai:jimeng.jianying.com DeepSeek:chat.deepseek.com 访问这些工具的官方网站后,通常在首页显眼位置会看到“AI 生成视频”或“一键生成视频”等按钮。点击进入后,根据页面指引输入视频主题、脚本内容以及风格偏好等信息,即可利用 AI …

    2025年12月6日 软件教程
    000
  • 谷歌浏览器标签页分组颜色怎么修改_谷歌浏览器标签分组个性化设置指南

    可通过右键菜单、拖拽建组或扩展程序修改谷歌浏览器标签分组颜色。首先右键分组圆点选新颜色;其次拖动标签创建分组时选择配色;最后可用“Tab Modifier”等扩展按规则自动着色。 如果您在使用谷歌浏览器时创建了标签页分组,但希望调整其颜色以便更好地区分不同任务或项目,则可以通过内置功能直接修改。以下…

    2025年12月6日 电脑教程
    000
  • 谷歌浏览器如何将扩展程序固定到工具栏_谷歌浏览器扩展图标固定操作方法

    首先进入扩展管理页面,点击浏览器右上角三点菜单选择“扩展程序”,找到目标扩展并开启“在工具栏中显示按钮”;也可通过工具栏拼图图标快速启用,点击扩展下方“在工具栏中显示”完成固定;最后可拖动图标调整顺序或关闭显示开关隐藏不常用图标。 如果您在使用谷歌浏览器时希望快速访问常用扩展程序,但发现图标无法直接…

    2025年12月6日 电脑教程
    000
  • 谷歌浏览器如何将所有打开的标签页都加入书签_谷歌浏览器批量保存标签页方法

    可通过谷歌浏览器内置功能或扩展程序一次性保存多个标签页。首先点击右上角三点菜单,选择“书签”中的“将所有标签另存为书签”,设置名称与位置后保存;也可通过快捷键Ctrl+Shift+O打开书签管理器,创建新文件夹并拖拽选中标签进行批量归档;此外,安装如“Session Buddy”等扩展程序可实现更灵…

    2025年12月6日 电脑教程
    000
  • 谷歌浏览器清除浏览数据按钮无反应怎么办

    先重启浏览器或电脑,检查是否因进程卡顿导致;再通过无痕模式排查扩展干扰,禁用扩展逐一排查;若仍无效,使用Ctrl+Shift+Delete快捷键调出清除窗口,或手动删除缓存文件夹;最后可重置浏览器设置恢复默认。 谷歌浏览器的“清除浏览数据”按钮点击后没反应,确实挺让人头疼。这通常不是单一原因造成的,…

    2025年12月6日 电脑教程
    000
  • 谷歌浏览器怎么安装离线的CRX扩展文件_谷歌浏览器离线插件安装教程

    首先通过开发者模式拖拽CRX文件安装扩展,若失败则重命名CRX为ZIP并解压后加载已解压扩展,必要时启用chrome://flags中的“Extensions on chrome:// URLs”标志以解除限制。 如果您需要在无法连接互联网或官方应用商店受限的环境下为浏览器添加功能,则可以通过本地安…

    2025年12月6日 电脑教程
    000
  • 谷歌浏览器怎么恢复被意外关闭的窗口_谷歌浏览器窗口恢复方法

    使用 Ctrl + Shift + T 可逐个恢复关闭的标签页;2. 通过历史记录中的“最近关闭的窗口”可恢复完整会话;3. 新标签页底部的“最近关闭的标签页”区域支持点击恢复;4. 右键标签栏可快速重新打开最后关闭的标签页;5. 在设置中启用“继续上次会话”可实现启动时自动恢复。 如果您在使用谷歌…

    2025年12月6日 电脑教程
    000
  • 谷歌浏览器怎么强制刷新并忽略缓存_谷歌浏览器强制刷新快捷操作方法

    首先使用快捷键强制刷新可解决页面缓存问题,Windows系统按Ctrl+Shift+R,Mac系统用Command+Shift+R;也可通过F12打开开发者工具,在Network选项卡勾选Disable cache;还可右键刷新按钮选择Empty Cache and Hard Reload;最后可通…

    2025年12月6日 电脑教程
    000
  • 满血旗舰折叠屏荣耀Magic V5发布,售价8999元起

    7月2日,荣耀(honor)在深圳市举行新品发布会,备受瞩目的轻薄折叠旗舰——荣耀magic v5正式登场。这款新品凭借颠覆性的制造工艺、全方位满血的旗舰配置、强大的ai智能体功能以及跨生态的深度融合,重新定义了折叠旗舰的新标准,实现八大“世界纪录”、八大满血体验、八大一语ai功能和七大ai生态布局…

    2025年12月5日 行业动态
    000
  • 为什么谷歌浏览器扩展程序无法启用?

    用户在使用谷歌浏览器时,可能会遇到某些扩展程序安装后无法启用或被自动禁用的情况,点击启用按钮也毫无反应。这一问题可能源于多种因素,包括扩展文件损坏、设置冲突或浏览器配置文件异常。本文将分析这些常见原因,并提供一系列排查步骤,帮助您解决扩展程序无法启用的问题,让您顺利使用所需的功能。 重新安装扩展程序…

    2025年12月5日
    000
  • 谷歌浏览器如何关闭后台运行进程?

    一些用户可能会发现,即使关闭了所有谷歌浏览器窗口,其进程依然在系统后台运行,这会持续占用一定的内存和处理器资源。这种情况通常是因为浏览器默认开启了后台应用运行模式,以支持通知和应用的快速启动。本文将指导您如何通过修改浏览器设置来彻底关闭后台运行进程,并介绍如何使用浏览器自带的任务管理器来处理当前运行…

    2025年12月5日
    000
  • 谷歌浏览器如何截图网页?

    当需要截取网页内容时,许多用户会选择使用系统自带的截图工具或安装第三方扩展程序。实际上,谷歌浏览器内置了一个功能强大的截图工具,它隐藏在开发者工具中,不仅可以截取当前可见区域,还能轻松实现对整个网页的滚动长截图。本文将详细介绍如何启用并使用这一原生功能,让您无需额外安装任何软件即可完成各种网页截图需…

    2025年12月5日
    000
  • 为什么谷歌浏览器总是提示“网页无响应”?

    当您在浏览网页时,谷歌浏览器弹出“网页无响应”的提示,意味着当前的标签页已经停止响应,无法进行任何操作,这无疑会中断您的工作流程。这个问题通常不是由单一原因引起的,它可能与特定网页的脚本、过多的后台活动、扩展程序冲突或浏览器缓存有关。本文将分析导致此问题的几个主要因素,并提供相应的排查和解决方法,帮…

    2025年12月5日
    000
  • 华为鸿蒙原生游戏亮相 ChinaJoy 全场景多设备无缝流转新玩法

    近日,华为 harmonyos 官微宣布,鸿蒙原生游戏即将登陆 chinajoy,将于 7 月 26 日 -29 日在上海新国际博览中心 n3 馆 01 号集中亮相。并表示华为的鸿蒙原生游戏具备三大优势:原生流畅、原生智能、原生互联。在展会期间,华为在展区设置了热门原生游戏区、原生游戏试玩区、鸿蒙全…

    2025年12月5日
    000
  • 大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

    meta、openai 等大模型厂商密集发力之际,谷歌也宣布了一项重磅更新—— 即日起,Gemini 聊天机器人将改由Gemini 1.5 Flash驱动。 与之前的版本相比,窗口长度提高到了 4 倍,响应速度也更快了。 按照谷歌的介绍,新版聊天机器人背后的 1.5 Flash 模型,主打的就是轻量…

    2025年12月5日 硬件教程
    000
  • 外媒吐槽谷歌发布会:炒 AI 冷饭 怀念过去纯粹的发布会

    近日,有外媒发文吐槽谷歌新机发布会,称这场活动的主角不像是手机,而是 ai。在 8 月 13 日的 made by google 活动上,谷歌似乎并不怎么提及最新的手机和硬件,反而急切地想要说服大家它的 ai 才是主角。” 我怀念过去那种纯粹的手机发布会,那时候发布的就是手机,而不是一场…

    2025年12月5日
    000
  • ai绘画软件免费排行榜 推荐十大免费ai绘画软件合集

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 笔魂AI 笔魂AI绘画-在线AI绘画、AI画图、AI设计工具软件 257 查看详情 推荐的十大免费AI绘画软件包括:1.文心一格:百度推出,支持多种风格生成。2.通义万相:阿里云打造,提供多场景…

    2025年12月5日 科技
    000
  • 苹果占 2023 年日本手机市场超一半份额 联想并列第五

    研究公司 idc 发布的最新数据显示,2023 年日本智能手机出货量为 3030 万部,较上年下降 11.6%。其中,iphone 销量下降 6.1%,android 手机销量下降 16.3%。从品牌排名来看,苹果以超过一半的市场份额遥遥领先,谷歌增长明显,联想与京瓷并列第五。 据CNMO报道,排名…

    2025年12月5日
    000
  • 为家居注入更多艺术灵感 三星联合设计师伙伴启动全新合作计划

    在 8 月 29 日「ai 创造家的想象力」沙龙暨三星冰洗新品品鉴会现场,三星生活家电正式启动了设计师伙伴计划,旨在汇聚行业内外的优秀设计师力量,探索智能家居解决方案的新边界。三星将提供给设计师极具优势的价格以及完善的售后服务,同时将携手设计师伙伴共同创造更加个性化的艺术家居崭新体验,为更多用户带来…

    2025年12月5日
    000
  • 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

    大模型做奥赛题游刃有余,简单的数数却屡屡翻车的原因找到了。 谷歌的一项新研究,发现大模型不会数数的原因,并不是简单的 tokenizer 所致,而是没有足够的空间来存储用于计数的向量。 数出一段话中某个单词出现的次数,这样简单的任务可以难倒许多大模型,GPT-4o、Claude 3.5 也无法幸免。…

    2025年12月5日 硬件教程
    000

发表回复

登录后才能评论
关注微信