工程
-
炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成
新加坡国立大学show lab的研究成果makeanything,让ai学会了分步骤创作!这项突破性研究,通过巧妙结合diffusion transformer (dit)和非对称lora技术,首次实现了高质量、跨领域的程序化序列生成,并在21类任务中展现出优异性能及强大的泛化能力。 ☞☞☞AI 智…
-
AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
最新研究揭示大语言模型推理能力的局限性:enigmaeval 基准测试结果 Scale AI、Center for AI Safety 和 MIT 的研究人员联合发布了新的多模态推理基准测试 ENIGMAEVAL,再次挑战了大语言模型的推理能力。该基准包含 1184 个难题,涵盖解谜寻宝竞赛中的各种…
-
仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
仅靠逻辑益智题,竟能让AI数学竞赛水平大幅提升?DeepSeek R1的秘密武器 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 继中国大模型在技术领域取得突破后,国内团队再次带来惊喜!这项研究揭秘了DeepSeek R1模型背后的秘密:通过…
-
无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了
aixiv专栏:探索无编码器架构在3d大型多模态模型中的潜力 AIxiv专栏持续报道全球顶尖AI研究成果,已收录2000余篇来自高校和企业实验室的学术技术文章。欢迎投稿或联系报道,投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com 作者简介…
-
用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐
aixiv专栏:北京交通大学adam团队探索系统2对齐,提升大模型安全性 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 北京交通大学ADaM团队长期关注AI安全领域,此前已开源o1复现项目o1-Coder (https://www.php.…
-
阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节
阿里云通义千问团队在最新论文中揭示了混合专家模型(moe)训练中的一个关键问题,并提出了一种创新的解决方案。该问题在于现有moe训练框架普遍采用局部负载均衡损失(lbl),导致专家激活不均衡,限制了模型性能和专家特异性。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 Deep…
-
执行推理时能对齐语言模型吗?谷歌InfAlign带来一种对齐新思路
google deepmind 和 google research 联合发表的论文提出了一种名为 infalign (推理感知型对齐) 的新框架,旨在优化生成式语言模型在特定推理过程下的胜率。 传统的 kl 正则化强化学习 (kl-rl) 方法通常忽略推理阶段,导致训练目标与实际应用脱节。infal…
-
从扭秧歌到单脚跳,HugWBC让人形机器人运动天赋觉醒了
上海交通大学和上海人工智能实验室的研究团队研发了一种名为hugwbc的通用人形机器人控制器,赋予机器人多种步态(包括行走、跑步、双脚跳跃和单脚跳跃)及精细化运动控制能力。该控制器突破了以往仅依赖速度指令或关键点的限制,引入了扩展指令空间,包含任务指令(速度)和行为指令(姿态、脚步、步态),实现对机器…
-
超越思维链?深度循环隐式推理引爆AI圈,LLM扩展有了新维度
突破性语言模型架构:无需额外训练数据,35亿参数媲美500亿参数模型! 一项来自马里兰大学的最新研究,在人工智能领域掀起了波澜。该研究提出了一种全新的语言模型架构,它能够在无需特殊训练数据的情况下,通过迭代循环块在潜在空间中进行隐式推理,从而显著提升模型的计算效率,尤其是在需要复杂推理的任务上实现3…
-
单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG
香港大学黄超教授实验室推出突破性超长视频理解模型videorag,高效解读数百小时视频内容!只需单张rtx 3090 gpu (24gb),videorag便能轻松应对超长视频理解的挑战。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 这项…