预训练大模型
-
把LLM视作操作系统,它就拥有了无限「虚拟」上下文,伯克利新作已揽1.7k star
近年来,大语言模型(llm)及其底层的 transformer 架构已经成为了对话式 ai 的基石,并催生了广泛的消费级和企业应用程序。尽管有了长足的进步,但 llm 使用的固定长度的上下文窗口极大地限制了对长对话或长文档推理的适用性。即使是使用最广泛的开源 llm,它们的最大输入长度只允许支持几十…
-
端到端自动驾驶、多模态场景大脑、全新3D交互:商汤绝影大模型即将亮相北京车展
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 商汤绝影将带来面向量产的真·端到端自动驾驶解决方案UniAD上车演示首秀商汤绝影打造敏锐洞察、深度思考、高效执行的多模态场景大脑“Vision Pro”裸眼上车,商汤绝影将展示全球首创3D高精视…
-
腾讯混元大模型正式亮相,我们抢先试了试它的生产力
国内首批大型模型备案上周获批,开始向全社会开放服务,标志着大型模型进入了规模应用的新阶段。在之前发布应用的公司中,一些科技巨头似乎还没有行动 在2023年9月7日,腾讯在腾讯全球数字生态大会上正式公开了混元大模型,并向外界开放了腾讯云 作为一个超千亿参数的大模型,混元使用的预训练语料超过两万亿 to…
-
华为云在香港为大模型训练推理提供即开即用澎湃算力
华为云于4月23日成功举办华为云峰会,在香港提供即开即用的ai云服务,为大模型训练和推理提供高效、长稳、可靠的ai算力。 华为云表示,其基础设施将通过全链路云化工具链支持大模型高效迁移、开发和高效运行,并提供针对昇腾云进行特别优化的大模型专区,使能 “百模千态” 应用快速落地。 ☞☞☞AI 智能聊天…