工程_第6页_创想鸟

扩散模型新突破！无需微调，就能高效稳定移除目标物体

aixiv 专栏重磅发布：无需微调，高效目标移除的扩散模型新方法——attentive eraser AIxiv 专栏持续关注并报道全球顶尖AI研究成果。过去数年，我们已发布超过2000篇学术技术文章，涵盖各大高校和企业实验室的最新研究。欢迎投稿或联系我们报道您的优秀工作！投稿邮箱：liyazhou…

程序猿

2025年11月26日 • 用户投稿

2000

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

aixiv专栏持续关注并报道全球顶尖ai研究成果。多年来，我们已发布超过2000篇学术及技术文章，涵盖众多高校和企业实验室的领先研究。欢迎优秀研究者投稿或联系我们进行报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com 当前，大语言模型…

程序猿

2025年11月26日 • 用户投稿

2000

将Transformer用于扩散模型，AI 生成视频达到照片级真实感

在视频生成场景中，用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。近日，一项视频生成研究收获了大量赞誉，甚至被一位 X 网友评价为「好莱坞的终结」。真的有这么好吗？我们先看下效果： ☞☞☞AI…

程序猿

2025年11月11日 • 用户投稿

1000

CVPR 2024满分论文：浙大提出基于可变形三维高斯的高质量单目动态重建新方法

单目动态场景（monocular dynamic scene）是指使用单眼摄像头观察和分析的动态环境，其中物体可以在场景中自由移动。单目动态场景重建在理解环境中的动态变化、预测物体运动轨迹以及生成动态数字资产等任务中具有关键意义。利用单目视觉技术，可以实现动态场景的三维重建和模型估计，帮助我们更好地…

程序猿

2025年11月11日 • 用户投稿

0000

清华姚班本科生连发两作，十年来最大改进：矩阵乘法接近理论最优

通过消除「隐藏的低效」问题，计算机科学家提出了一种比以往更快的大型矩阵相乘新方法。矩阵乘法作为众多gpu算子的基础操作，在高性能计算中扮演着重要角色，也是ai等应用的关键组成部分。虽然其算法本身相对简单，但为了实现更高的速度，人们多年来一直在不断努力优化。然而，优化的程度一直受到一定限制。在最新…

程序猿

2025年11月11日 • 用户投稿

0000

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D，向具身智能更进一步

在许多实际应用中，物体姿态估计扮演着关键角色，比如在具身智能、机器人操作和增强现实等领域。在这一领域中，最先受到关注的任务是实例级别 6D 姿态估计，其需要关于目标物体的带标注数据进行模型训练，使深度模型具有物体特定性，无法迁移应用到新物体上。后来研究热点逐步转向类别级别 6D 姿态估计，用于处理…

程序猿

2025年11月11日 • 用户投稿

1000

ICLR 2024 | 联邦学习后门攻击的模型关键层

联邦学习使用多个参与方可以在数据隐私得到保护的情况下训练模型。但是由于服务器无法监控参与者在本地进行的训练过程，参与者可以篡改本地训练模型，从而对联邦学习的整体模型构成安全隐患，如后门攻击。本文重点关注如何在有防御保护的训练框架下，对联邦学习发起后门攻击。本文发现后门攻击的植入与部分神经网络层的相…

程序猿

2025年11月11日 • 用户投稿

1000

二次元专用超分AI模型APISR：在线可用，入选CVPR

动漫作品如《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是许多人童年回忆的一部分，它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候，我们会突然有重温这些童年回忆的冲动，但我们却可能会遗憾地发现这些童年回忆的辨识率非常低，根本无法在宽屏电视上创建出良好的视觉体验，以至于阻碍…

程序猿

2025年11月11日 • 用户投稿

1000

CVPR 2024 | 分割一切模型SAM泛化能力差？域适应策略给解决了

第一个针对「Segment Anything」大模型的域适应策略来了！相关论文已被CVPR 2024 接收。引言大语言模型（LLMs）的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中，Segmen…

程序猿

2025年11月11日 • 用户投稿

2000

改变LoRA的初始化方式，北大新方法PiSSA显著提升微调效果

随着大模型的参数量日益增长，微调整个模型的开销逐渐变得难以接受。因此，北京大学的研究团队提出了一种名为 PiSSA 的参數高效微调方法，在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜…

程序猿

2025年11月11日 • 用户投稿

2000