模型
-
华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来
比传统方法快1万倍、只需要1.4秒就能完成24小时全球气象预报——它就是来自%ignore_a_1%云的盘古气象大模型。 今天,它登上了Nature,据称还是近年来首篇以中国科技公司作为唯一署名单位发表的Nature正刊论文(也就是华为云独作)。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索,…
-
将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?
今年 2 月,Meta 发布的 LLaMA 大型语言模型系列,成功推动了开源聊天机器人的发展。因为 LLaMA 比之前发布的很多大模型参数少(参数量从 70 亿到 650 亿不等),但性能更好,例如,最大的 650 亿参数的 LLaMA 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM…
-
改动一行代码,PyTorch训练三倍提速,这些「高级技术」是关键
近日,深度学习领域知名研究者、lightning %ignore_a_1% 的首席人工智能教育者 sebastian raschka 在 cvpr 2023 上发表了主题演讲「scaling pytorch model training with minimal code changes」。 ☞☞☞…
-
AI自主设计提示词,谷歌DeepMind发现数学“深呼吸”能让大模型涨8分!
提示词中加上“深呼吸”,ai大模型数学成绩就能再涨8.4分! 谷歌DeepMind团队最新发现,用这个新“咒语”(Take a deep breath)结合大家已经熟悉的“一步一步地想”(Let’s think step by step),大模型在GSM8K数据集上的成绩就从71.8提高到80.2分…
-
MotionLM:多智能体运动预测的语言建模技术
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:MotionLM: Multi-Agent Motion Forecasting as Language Modeling 论文链接:https://arxiv.org/pdf/2309.16534.pdf 作者单位:Waymo 会议:IC…
-
全面超越AutoGPT,面壁智能联合清华NLP实验室开源大模型「超级英雄」XAgent
近日,国内领先的人工智能大模型公司面壁智能又放大招,联合清华大学 NLP 实验室共同研发并推出大模型「超级英雄」——XAgent。 通过任务测试,XAgent 在真实复杂任务的处理能力已全面超越 AutoGPT。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek…
-
4K画质3D合成视频不再卡成幻灯片,新方法将渲染速度提高了30多倍
当 4K 画质、60 帧视频在某些 APP 上还只能开会员观看时,AI 研究者已经把 3D 动态合成视频做到了 4K 级别,而且画面相当流畅。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 %ignore_a_1%☜☜☜ 在现实生活中,我们接触的大多数…
-
北大提出首个复数大模型,2 比特量化,推理仅加法,可手机部署!
首个复数大模型!北大推出 2 比特超低比特量化新方案。 当前,大模型在推理过程中往往面临巨大的存储与计算开销,主要原因在于模型权重普遍采用 FP16 格式存储,占用大量空间。 北京大学研究团队首次提出 iFairy 方案,将模型权重量化至复数集合 {+1, -1, +i, -i}。 这四个数值恰好可…
-
AI大模型风潮下,谁还在“玩”元宇宙?退场与入场的对比
重写后的内容:元宇宙的主打特色是提供沉浸式体验,让用户能够完全融入其中。同时,元宇宙还具备互动性、持续性和高度个性化的特点。在互动性方面,用户可以与其他用户、虚拟角色和各种物品进行互动;在持续性方面,用户可以随时进入元宇宙并与其他用户互动;在高度个性化方面,用户可以根据自己的喜好和需求来自定义体验,…
-
西工大推出创新无人机控制框架:实现群聊式交互、主动感知环境、自主控制无人机
超强的泛化能力,让大%ignore_a_1%成为「通用人工智能」的一缕曙光。 然而,读万卷书,不如行万里路,在开放环境中,大模型需要真正地「走」进物理世界,才能切实地理解复杂任务、解决实际问题。 最近,李学龙教授的团队进行了关于开放环境中自主无人机集群的创新研究。他们利用国产大型模型成功实现了在开放…