工程
-
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
斯坦福大学、北京大学和清华大学的研究团队联合推出一项突破性研究成果:无训练指导(training-free guidance,tfg) 框架,为扩散模型的条件生成难题提供了全新的解决方案。该框架已被neurips 2024接收为spotlight论文。 ☞☞☞AI 智能聊天, 问答助手, AI 智能…
-
用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢…
-
OpenAI的强化微调:RL+Science 创造新神还是灭霸?
openai发布强化微调新方法,或将革新专家模型构建!这项名为“强化微调”(reinforcement finetuning,rft)的技术,仅需少量数据(几十到几千条案例)即可训练出在特定领域(如医疗诊断、罕见病诊断)做出最优决策的模型。 这引发了人们对于ai在科学领域的巨大潜力和潜在风险的双重思…
-
人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力
人能逆向思维,llm 也可以吗?北卡罗来纳大学教堂山分校与谷歌最近的一项研究表明,llm 确实可以,并且逆向思维还能帮助提升 llm 的正向推理能力! AutoGLM沉思 智谱AI推出的具备深度研究和自主执行能力的AI智能体 73 查看详情 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费…
-
AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要
aixiv专栏是本站发布学术、技术内容的栏目。过去数年,本站aixiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@ji…
-
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级
清华大学陈键飞团队推出sageattention2:实现4-bit即插即用注意力机制,显著提升大模型推理速度 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续报道全球顶尖AI研究成果。 近年来,该专栏已发表2000余篇学术技…
-
引入长思维链!微信基于阿里千问大模型搞出个翻译版o1
微信ai团队最新研究成果drt-o1:赋予大型语言模型(llm)长链思维能力,显著提升机器翻译效果!该研究巧妙地将长链思维(cot)应用于神经机器翻译(mt),尤其在处理文学作品中复杂的比喻和隐喻时,展现出显著优势。 DRT-o1的核心在于其创新的数据合成方法。研究团队并非直接训练模型进行长链思维,…
-
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源
GRAPE:通过偏好对齐提升机器人策略泛化能力 aixiv专栏持续报道全球顶尖ai研究成果。本文介绍一篇来自北卡罗来纳大学教堂山分校、华盛顿大学及芝加哥大学的研究,该研究提出了一种名为grape的新算法,显著提升了视觉-语言-动作(vla)模型的泛化能力。 ☞☞☞AI 智能聊天, 问答助手, AI …
-
阶跃公开了自家新型注意力机制:KV缓存消耗直降93.7%,性能不减反增
aixiv专栏长期致力于分享学术和技术前沿内容,已发表2000余篇来自全球顶尖高校和企业实验室的文章,为学术交流和传播做出了重要贡献。欢迎各位专家学者投稿或联系报道,投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com ☞☞☞AI 智能聊天,…
-
奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek
奥特曼能不急吗? 被 DeepSeek 狂轰乱炸了一周后,终于在今天发布了新的模型 o3-mini。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 此次发布,o3-mini 包含 low、medium 和 high 三个版本。 OpenAI…