工程_第12页

NeurIPS Spotlight｜从分类到生成：无训练的可控扩散生成

斯坦福大学、北京大学和清华大学的研究团队联合推出一项突破性研究成果：无训练指导（training-free guidance，tfg）框架，为扩散模型的条件生成难题提供了全新的解决方案。该框架已被neurips 2024接收为spotlight论文。 ☞☞☞AI 智能聊天, 问答助手, AI 智能…

程序猿

2025年11月6日 • 用户投稿

4000

用LLaVA解读数万神经元，大模型竟然自己打开了多模态智能黑盒

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年，本站AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢…

程序猿

2025年11月6日 • 用户投稿

0000

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

openai发布强化微调新方法，或将革新专家模型构建！这项名为“强化微调”（reinforcement finetuning，rft）的技术，仅需少量数据（几十到几千条案例）即可训练出在特定领域（如医疗诊断、罕见病诊断）做出最优决策的模型。这引发了人们对于ai在科学领域的巨大潜力和潜在风险的双重思…

程序猿

2025年11月6日 • 用户投稿

0000

人会逆向思维，LLM也可以？DeepMind研究表明还能提升推理能力

人能逆向思维，llm 也可以吗？北卡罗来纳大学教堂山分校与谷歌最近的一项研究表明，llm 确实可以，并且逆向思维还能帮助提升 llm 的正向推理能力！ AutoGLM沉思智谱AI推出的具备深度研究和自主执行能力的AI智能体 73 查看详情 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费…

程序猿

2025年11月6日 • 用户投稿

2000

AAAI 2025 | 开放世界的深伪检测，北交大团队：解决好无配对数据挑战很重要

aixiv专栏是本站发布学术、技术内容的栏目。过去数年，本站aixiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@ji…

程序猿

2025年11月6日 • 用户投稿

2000

4比特量化三倍加速不掉点！清华即插即用的SageAttention迎来升级

清华大学陈键飞团队推出sageattention2：实现4-bit即插即用注意力机制，显著提升大模型推理速度 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续报道全球顶尖AI研究成果。近年来，该专栏已发表2000余篇学术技…

程序猿

2025年11月6日 • 用户投稿

0000

引入长思维链！微信基于阿里千问大模型搞出个翻译版o1

微信ai团队最新研究成果drt-o1：赋予大型语言模型(llm)长链思维能力，显著提升机器翻译效果！该研究巧妙地将长链思维(cot)应用于神经机器翻译(mt)，尤其在处理文学作品中复杂的比喻和隐喻时，展现出显著优势。 DRT-o1的核心在于其创新的数据合成方法。研究团队并非直接训练模型进行长链思维，…

程序猿

2025年11月6日 • 用户投稿

4000

把RLHF带给VLA模型！通过偏好对齐来优化机器人策略，代码已开源

GRAPE：通过偏好对齐提升机器人策略泛化能力 aixiv专栏持续报道全球顶尖ai研究成果。本文介绍一篇来自北卡罗来纳大学教堂山分校、华盛顿大学及芝加哥大学的研究，该研究提出了一种名为grape的新算法，显著提升了视觉-语言-动作（vla）模型的泛化能力。 ☞☞☞AI 智能聊天, 问答助手, AI …

程序猿

2025年11月6日 • 用户投稿

1000

阶跃公开了自家新型注意力机制：KV缓存消耗直降93.7%，性能不减反增

aixiv专栏长期致力于分享学术和技术前沿内容，已发表2000余篇来自全球顶尖高校和企业实验室的文章，为学术交流和传播做出了重要贡献。欢迎各位专家学者投稿或联系报道，投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com ☞☞☞AI 智能聊天,…

程序猿

2025年11月6日 • 用户投稿

1000

奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek

奥特曼能不急吗？被 DeepSeek 狂轰乱炸了一周后，终于在今天发布了新的模型 o3-mini。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 此次发布，o3-mini 包含 low、medium 和 high 三个版本。 OpenAI…

程序猿

2025年11月4日 • 用户投稿

1000