工程_第13页

炒菜、雕刻、绘画、汽车人变形！MakeAnything用扩散Transformer解锁多任务过程生成

新加坡国立大学show lab的研究成果makeanything，让ai学会了分步骤创作！这项突破性研究，通过巧妙结合diffusion transformer (dit)和非对称lora技术，首次实现了高质量、跨领域的程序化序列生成，并在21类任务中展现出优异性能及强大的泛化能力。 ☞☞☞AI 智…

程序猿

2025年11月4日 • 用户投稿

0000

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

最新研究揭示大语言模型推理能力的局限性：enigmaeval 基准测试结果 Scale AI、Center for AI Safety 和 MIT 的研究人员联合发布了新的多模态推理基准测试 ENIGMAEVAL，再次挑战了大语言模型的推理能力。该基准包含 1184 个难题，涵盖解谜寻宝竞赛中的各种…

程序猿

2025年11月4日 • 用户投稿

7000

仅靠逻辑题，AI数学竞赛能力飙升！微软、九坤投资：7B小模型也能逼近o3-mini

仅靠逻辑益智题，竟能让AI数学竞赛水平大幅提升？DeepSeek R1的秘密武器 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 继中国大模型在技术领域取得突破后，国内团队再次带来惊喜！这项研究揭秘了DeepSeek R1模型背后的秘密：通过…

程序猿

2025年11月4日 • 用户投稿

0000

无编码器架构潜力或被低估，首个无编码器3D多模态LLM大模型来了

aixiv专栏：探索无编码器架构在3d大型多模态模型中的潜力 AIxiv专栏持续报道全球顶尖AI研究成果，已收录2000余篇来自高校和企业实验室的学术技术文章。欢迎投稿或联系报道，投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com 作者简介…

程序猿

2025年11月4日 • 用户投稿

0000

用慢思考提升模型安全性，北交大、鹏城实验室提出系统2对齐

aixiv专栏：北京交通大学adam团队探索系统2对齐，提升大模型安全性 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 北京交通大学ADaM团队长期关注AI安全领域，此前已开源o1复现项目o1-Coder (https://www.php.…

程序猿

2025年11月1日 • 用户投稿

0000

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

阿里云通义千问团队在最新论文中揭示了混合专家模型(moe)训练中的一个关键问题，并提出了一种创新的解决方案。该问题在于现有moe训练框架普遍采用局部负载均衡损失(lbl)，导致专家激活不均衡，限制了模型性能和专家特异性。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 Deep…

程序猿

2025年11月1日 • 用户投稿

0000

用户投稿

执行推理时能对齐语言模型吗？谷歌InfAlign带来一种对齐新思路

google deepmind 和 google research 联合发表的论文提出了一种名为 infalign (推理感知型对齐) 的新框架，旨在优化生成式语言模型在特定推理过程下的胜率。传统的 kl 正则化强化学习 (kl-rl) 方法通常忽略推理阶段，导致训练目标与实际应用脱节。infal…

程序猿

2025年11月1日

2000

从扭秧歌到单脚跳，HugWBC让人形机器人运动天赋觉醒了

上海交通大学和上海人工智能实验室的研究团队研发了一种名为hugwbc的通用人形机器人控制器，赋予机器人多种步态（包括行走、跑步、双脚跳跃和单脚跳跃）及精细化运动控制能力。该控制器突破了以往仅依赖速度指令或关键点的限制，引入了扩展指令空间，包含任务指令（速度）和行为指令（姿态、脚步、步态），实现对机器…

程序猿

2025年11月1日 • 用户投稿

0000

超越思维链？深度循环隐式推理引爆AI圈，LLM扩展有了新维度

突破性语言模型架构：无需额外训练数据，35亿参数媲美500亿参数模型！一项来自马里兰大学的最新研究，在人工智能领域掀起了波澜。该研究提出了一种全新的语言模型架构，它能够在无需特殊训练数据的情况下，通过迭代循环块在潜在空间中进行隐式推理，从而显著提升模型的计算效率，尤其是在需要复杂推理的任务上实现3…

程序猿

2025年11月1日 • 用户投稿

3000

单卡3090帮你一口气看完《黑悟空》，港大百度打造超长视频理解引擎VideoRAG

香港大学黄超教授实验室推出突破性超长视频理解模型videorag，高效解读数百小时视频内容！只需单张rtx 3090 gpu (24gb)，videorag便能轻松应对超长视频理解的挑战。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 这项…

程序猿

2025年11月1日 • 用户投稿

1000