科技
-
几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling
在标准的UNet结构中,long skip connection上的scaling系数 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 一般为1。 然而,在一些著名的扩散模型工作中,比如Imagen, Score-based generati…
-
K2-Think— 开源AI推理模型,数学和代码领域表现出色
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 协和·太初 国内首个针对罕见病领域的AI大模型 38 查看详情 K2-Think是什么 k2-think是由阿联酋穆罕默德·本·扎耶德人工智能大学(mbzuai)与g42共同研发的一款开源推理大…
-
揭秘扩散模型背后的“硬核骨架”:一文读懂Backbone在生成艺术与智能决策中的关键作用
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 引子:揭开扩散模型及其“脊梁骨”的神秘面纱 如今,AI创作的精美画作、音视频内容层出不穷,其中有一项技术犹如魔法般从无到有地创造出惊艳作品,那就是扩散模型。而在其运作机制的核心深处,有一个至关重…
-
LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训
过去的图像生成模型经常因为主要呈现白人形象而受到批评,而谷歌的 Gemini 模型则因为极端的矫枉过正而陷入困境。它的生成图像结果变得过分谨慎,与历史事实出现显著偏差,令用户感到惊讶。谷歌声称,该模型的谨慎程度超出了开发者的预期。这种谨慎不仅体现在生成的图像中,还表现在通常将一些提示视为敏感提示,进…
-
让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了
有了阿里的 emo,ai 生成或真实的图像「动起来说话或唱歌」变得更容易了。 最近,以 OpenAI Sora 为代表的文生视频模型又火了起来。 除了文本生成视频,以人为中心的视频合成一直备受关注。比如,专注于“说话人头部”的视频生成,其目标是根据用户提供的音频片段生成面部表情。 在技术层面上,生成…
-
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存
陈丹琦团队刚刚发布了一种新的llm上下文窗口扩展方法: 它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。 最重要的是,在这个过程中,只需要原来1/6的内存,模型就获得了10倍吞吐量。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSee…
-
通过人工智能驱动的预测分析彻底改变物流道路
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在当今快节奏的物流行业中,高效运作至关重要。随着全球经济对货物流动的依赖增加,简化物流流程的创新变得日益受到重视。人工智能技术的预测分析在道路物流领域展现出了巨大潜力,引起了人们的关注。 传统上…
-
工信部:发布国内首个个人信息保护 AI 大模型“智御”助手
2 月 29 日消息,工业和信息化部日前发布关于 2023 年第四季度电信服务质量的通告。 通告称,深化 App 用户权益保护。制定《移动互联网应用程序(App)合规开发管理测评规范》《小程序个人信息保护规范》等系列标准,指引企业依法合规经营。实施“SDK 用户权益保护行业协同联动计划”,组织评选移…
-
钉钉启动数智校园标杆校计划,联合小冰提供校长数字人
草长莺飞,春意盎然,又是一年开学季。新学期伊始,钉钉启动了“钉钉数智校园标杆校计划”,致力于为学校提供更安全高效的数智化沟通方式,助力学校迈向教育数智化新时%ign%ignore_a_1%re_a_1%。即日起,在钉钉搜索关键词“钉钉数智校园”,即可报名参加该计划。为更好地让标杆校体验最新ai应用带…
-
ControlNet作者新作:AI绘画能分图层了!项目未开源就斩获660 Star
“绝不是简单的抠图。” ControlNet作者最新推出的一项研究受到了一波高度关注—— 给一句prompt,用Stable Diffusion可以直接生成单个或多个透明图层(PNG)! 例如来一句: 头发凌乱的女性,在卧室里。Woman with messy hair, in the bedroo…