来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

中国电子学会 2023 科学技术奖授奖名单公布,这次,我们发现了一个熟悉的身影 —— 腾讯 Angel 机器学习平台。
在大模型飞速发展的当下,科学技术奖授予机器学习平台类研究和应用项目,对于模型训练平台的价值和重要性给予了充分的肯定。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

科学技术奖认可了机器学习平台类项目的研究和应用,特别在大型模型快速发展的背景下,对模型训练平台的价值和重要性给予了充分的认可。

随着深度学习的兴起,各大公司开始认识到机器学习平台在发展人工智能技术中的重要性。谷歌、微软、英伟达等公司都推出了自己的机器学习平台,以加速人工智能模型的训练过程。这些平台为开发者提供了便捷的支持,使他们能够更快地构建和优化复杂的人工智能系统。这种趋势促使人们更加关注机器学习技术的发展,并为未来的人工智能应用打下了坚实的基础。

从2023年开始,大型模型的兴起进一步推动了模型参数量的提升。各大公司纷纷推出了参数规模达到千亿甚至万亿级别的模型,这些模型普遍采用深度神经网络结构。然而,这种发展也带来了两个核心痛点:模型分布式训练的困难以及应用复杂性所带来的模型设计挑战。

为什么是 Angel 机器学习平台?

详解四大核心技术突破

由多名院士等权威专家组成的鉴定委员会认为, 腾讯 Angel 机器学习平台技术复杂度高、研制难度大、创新性强,应用前景广阔,整体技术达到国际先进水平,其中面向 all-to-all 通信的高效缓存调度与管理技术、自适应预采样与图结构搜索技术达到国际领先水平。

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

                              腾讯 Angel 平台架构图

腾讯的 Angel 机器学习平台采用了分布式参数服务器架构,这种架构的特点是将存储模型参数和执行模型计算这两个任务分别在不同的服务器上运行。通过增加更多的服务器,可以支持更大规模、计算需求更高的模型。这种架构使得模型训练过程更为高效,能够处理大规模数据集和复杂模型计算。分布式参数服务器的设计使得系统具有良好的扩展性和灵活性,能够满足不同规模和需求的机器学习任务。这种架构的优势在于可以有效地利用集群资源,提高计算效率,并为用户提供更快速、更

面对海量数据和超大规模模型训练需求 ,腾讯 Angel 机器学习平台在网络通信与缓存、模型存储与调度、多模态模型与融合学习排序以及大规模图模型与结构搜索技术等核心环节取得技术突破。

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

为了提高训练效率,TB 级机器学习模型通常采用分布式训练方法,需要大量的参数和梯度同步,以 1.8T 模型千卡训练为例,IO 通信量达到 25TB, 耗时占比 53%,此外,加上不同算力集群间的异构网络环境,通信网络延迟不一,这些都对模型训练过程中的通信开销提出了较高的要求。腾讯 Angel 机器学习平台基于腾讯云星脉网络的高效通信与缓存调度管理技术,可有效解决 TB 级模型训练通讯开销大的问题,实现网络通信耗时减少 80%,分布式训练性能达业界主流方案的 2.5 倍。

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

现有的算力条件下,尽管模型达到 TB 级,而主流 GPU 的显存仍只有 80G,参数存储有瓶颈。针对 TB 级模型训练参数存储难的关键问题, 腾讯 Angel 机器学习平台提出了显存主存统一视角存储管理机制,实现模型存储容量比业界增加 1 倍,训练性能是业界主流方案 2 倍。

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

腾讯混元文生视频 腾讯混元文生视频

腾讯发布的AI视频生成大模型技术

腾讯混元文生视频 137 查看详情 腾讯混元文生视频

大模型要向通用模型发展,离不开对多模态数据的处理支持,不同模态,例如文字、图像、视频等数据的对齐融合理解难度大。在多模态模型的训练上, 腾讯 Angel 机器学习平台针对广告场景,提出多模态融合学习的全链路排序广告推荐技术,助力广告召回率提升 40% 以上。

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

另外,针对面向推荐系统的图模型训练, 腾讯 Angel 机器学习平台设计了图节点特征自适应图网络结构搜索技术,可自动输出最优结构,解决了 TB 图模型应用中 “图数据挖掘难” 的问题,实现模型训练性能提升 28 倍,与业界比具有最优扩展性。

腾讯 Angel 机器学习平台锻造之路

腾讯混元大模型扩展到万亿规模

作为腾讯人工智能技术的基础平台,腾讯 Angel 平台诞生于 2015 年,支持 PS-Worker 分布式训练, 以及十亿参数 LDA 模型的训练。

2017 年,Angel 框架在 Github 开源,向开发者开放,同时,技术上,Angel 解决了异构网络下的通信问题,性能进一步提升。2019 年,在可扩展图模型多模态理解技术取得突破,解决万亿节点可扩展图模型问题。2021 年,提出 GPU 显存统一视角存储技术,解决大模型 参数存储与性能问题。

在腾讯通用人工智能大模型腾讯混元的打造中,腾讯 Angel 机器学习平台也发挥了重要作用。

2023 年 9 月,腾讯混元大模型正式对外亮相,预训练语料超 2 万亿 tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。

面对建设腾讯混元大模型的需求,腾讯 Angel 机器学习平台打造了自研的面向大模型训练和推理的机器学习框架 Angel PTM 和 Angel HCF,支持单任务万卡级别超大规模训练和大规模推理服务部署。实现大模型训练效率提升至主流开源框架的 2.6 倍,千亿级大模型训练可节省 50% 算力成本,升级后支持单任务万卡级别超大规模训练。在推理上,腾讯 Angel 机器学习平台推理速度提高了 1.3 倍,在腾讯混元大模型文生图的应用中,推理耗时从原本的 10 秒缩短至 3 至 4 秒。

此外,Angel 还提供了从模型研发到应用落地的一站式平台,支持用户通过 API 接口或精调等方式快速调用腾讯混元大模型能力,加速大模型应用构建,腾讯会议、腾讯新闻、腾讯视频等超过 400 个腾讯产品及场景均已接入腾讯混元内测。

腾讯混元通过采用混合专家模型 (MoE) 结构,已将模型扩展至万亿级参数规模,推动了性能提升和推理成本下降。作为通用模型,腾讯混元在中文表现上处于业界领先水平,尤其在文本生成、数理逻辑和多轮对话中性能表现卓越。目前,腾讯混元也在积极发展多模态模型,以进一步加强文生图和文生视频能力。

腾讯大量的应用场景,为腾讯 Angel 机器学习平台的落地提供了实验地。除了腾讯混元大模型,腾讯 Angel 机器学习平台也支持了腾讯广告以及腾讯会议等产品,并通过腾讯云服务多个行业和企业客户,助力各行各业的数字化和智能化发展。

以腾讯广告为例,采用腾讯 Angel 机器学习平分布式训练优化、多模态理解图数据挖掘等创新技术,广告业务场景中的多模态大模型训练速度提升 5 倍,模型规模提升 10 倍,实现广告召回率大幅提升。

以上就是来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/618504.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月11日 05:20:11
下一篇 2025年11月11日 05:21:27

相关推荐

  • 表单中的CDN怎么利用?如何加速静态表单的加载?

    cdn通过将表单的css、javascript、图片等静态资源分发至全球边缘节点,使用户从最近的服务器获取资源,大幅缩短加载时间,提升表单加载速度。其技术原理包括dns智能解析、边缘缓存、tcp连接优化和负载均衡,实现“近源分发”与高效响应。为优化cdn缓存策略,应合理设置cache-control…

    2025年12月22日
    000
  • 表单中的Serverless怎么应用?如何用云函数处理提交?

    答案:Serverless处理表单通过云函数直接响应前端提交,无需自建后端服务器。用户提交表单时,数据发送至云函数API网关,函数从请求体获取数据并解析,支持application/x-www-form-urlencoded、JSON及multipart/form-data格式,后者需借助库处理文件…

    2025年12月22日
    000
  • 表单中的OTP怎么支持?如何集成一次性密码验证?

    表单中实现OTP验证需集成生成、发送与验证流程。前端添加OTP输入框,用户提交后触发后端生成6位数字OTP,使用CSPRNG算法确保安全,并存储其哈希值至Redis等缓存,设置5分钟过期时间。通过Twilio或阿里云等平台发送短信,确保高送达率。用户输入OTP后,后端比对哈希值完成验证,成功则删除记…

    2025年12月22日
    000
  • 微信公众号播放海康视频流15秒后卡顿是什么原因?

    微信公众号海康视频流15秒卡顿问题排查 本文分析了微信公众号内播放海康威视视频流15秒后卡顿的原因,并提供相应的解决方案。 问题现象 在微信公众号页面嵌入的海康视频流,播放15秒后出现卡顿,网络流量骤降至几KB,无论切换Wi-Fi或移动网络均无法解决。 代码片段 问题代码如下: 可能原因 经测试和分…

    2025年12月22日
    000
  • 推荐的网站性能优化工具:提升用户体验的秘密武器

    在当今互联网时代,用户体验已经成为了网站成功的重要因素之一。无论是企业官网、电商平台还是个人博客,一个良好的用户体验都能吸引更多的访问者,并帮助网站提升用户满意度和留存率。 然而,要实现优质的用户体验并非易事。除了网站设计、内容质量等外在因素外,网站性能也是非常关键的一点。如果网站加载速度过慢,会严…

    好文分享 2025年12月21日
    000
  • 如何构建一个支持语音识别的交互式应用?

    答案是构建语音交互应用需整合语音识别、自然对话逻辑与即时反馈。首先选择Web Speech API、云服务或本地模型实现语音识别;接着设计带视觉提示、唤醒机制和文字回显的交互流程;再通过关键词匹配或对话引擎解析意图,连接业务逻辑并反馈结果;最后优化降噪、个性化及多口音适应,确保体验流畅。核心在于建立…

    2025年12月20日
    000
  • 如何构建一个支持Serverless架构的无服务应用?

    构建Serverless应用需先拆分业务为独立函数,选择FaaS平台与配套服务,利用API网关、对象存储等组件实现事件驱动架构,通过外部系统管理状态,并用IaC工具自动化部署,以降低运维成本、提升伸缩性。 构建一个支持Serverless架构的无服务应用,核心在于合理设计函数逻辑、选择合适的云服务组…

    2025年12月20日
    000
  • 如何利用设计模式封装复杂的第三方API调用?

    适配器模式统一API接口,门面模式简化复杂调用,策略模式支持多供应商切换,装饰器模式增强功能;通过封装解耦外部依赖,提升代码可维护性与扩展性。 封装复杂的第三方API调用时,设计模式能显著提升代码的可维护性、可测试性和扩展性。关键在于解耦业务逻辑与外部依赖,隐藏实现细节,并提供清晰的接口。以下是几种…

    2025年12月20日
    000
  • BOM中如何操作浏览器的短信API?

    浏览器不提供直接发送短信的api,是出于安全、隐私、跨平台兼容性和用户体验的考虑。1. 安全与隐私风险:恶意网站可能滥用该功能发送垃圾短信或窃取联系人信息;2. 跨平台差异大:不同系统短信机制不统一,难以标准化;3. 用户控制权缺失:自动发送会剥夺用户对操作的确认权。实际做法是使用 sms: uri…

    2025年12月20日 好文分享
    000
  • 如何用BOM获取用户的短信发送权限?

    网页无法通过bom直接获取短信发送权限,这是浏览器安全模型的设计原则;1. 浏览器禁止网页代码访问敏感硬件或系统功能,防止恶意行为;2. 可通过sms:协议启动短信应用,但需用户手动发送;3. web share api允许用户选择短信分享,但不能静默发送;4. 网页无直接api访问短信模块,所有敏…

    2025年12月20日 好文分享
    000
  • 前端实时语音传输到后端:如何实现并解决无声段问题?

    前端实时语音数据传输到后端:技术方案与挑战 许多应用,例如实时语音翻译和语音监控,都需要前端实时将语音数据传输到后端进行处理。本文探讨使用JavaScript和Node.js实现此功能的可行性,并重点分析如何捕捉语音、实时传输有效音频数据以及处理无声段的问题。 用户需求是前端实时传输语音到后端进行翻…

    2025年12月20日
    000
  • 桥接模式怎么解耦抽象与实现 多维变化分离方法

    桥接模式通过组合将抽象与实现分离,使两者独立变化。抽象部分定义高层逻辑,实现部分封装底层细节,通过引用实现接口动态绑定具体实现,避免继承导致的类爆炸。例如图形类持渲染器接口,形状与渲染方式解耦,运行时可切换。适用于多维变化场景,如通知类型与发送渠道的组合,扩展时无需新增类。关键在于识别正交变化维度,…

    2025年12月18日
    000
  • 如何使用Golang实现微服务调用链监控_使用日志和Trace追踪请求

    Golang微服务调用链监控核心是统一Trace ID透传、结构化日志自动注入、关键Span手动埋点及Trace数据导出;通过context.Context传递ID,zap日志封装注入trace_id/span_id,HTTP/DB/RPC层埋点记录操作元信息,最终上报Jaeger或OTLP后端。 …

    2025年12月17日
    000
  • 如何用Golang实现适配器模式_Golang 适配器模式实践

    适配器模式用于解决接口不兼容问题,通过组合和接口实现转换。目标接口为客户端期望的Logger或SMSSender,被适配者如FileLogger、AliyunSMS有不同方法签名,适配器FileLoggerAdapter和AliyunSMSAdapter持有被适配者实例并实现目标接口,使旧组件或第三…

    2025年12月16日
    100
  • Golang如何使用适配器模式整合第三方库_Golang适配器模式第三方库整合实践详解

    适配器模式通过统一接口整合多个第三方短信服务,使业务代码与具体实现解耦,提升可维护性和扩展性。 在 Go 语言开发中,经常会遇到需要集成多个第三方库的场景。这些库可能接口不统一、方法命名风格不同,甚至行为逻辑差异较大。为了屏蔽这些差异,让系统更灵活、可维护,适配器模式是一个非常实用的设计模式。它通过…

    2025年12月16日
    000
  • Go HTTP 服务面临 DDoS 攻击的防御策略与实践指南

    本文探讨 Go HTTP 服务器如何应对分布式拒绝服务(DDoS)攻击。强调防火墙作为基础安全的重要性,但指出其在应对复杂 DDoS 攻击时的局限性。对于多数 Go 服务而言,最有效且实际的 DDoS 防御策略是依赖专业的云服务提供商提供的网络级防护,而非在应用层盲目构建复杂的自适应防御机制,以避免…

    2025年12月16日
    000
  • Golang适配器模式第三方接口兼容示例

    适配器模式通过定义统一SMSSender接口,为阿里云和腾讯云短信服务分别实现AliyunAdapter和TencentAdapter适配器,使不同SDK接口标准化,业务层可透明切换服务商,提升扩展性与维护性。 在使用 Golang 开发项目时,经常会对接第三方服务,比如支付、短信、物流等。不同第三…

    2025年12月16日
    000
  • Golang Web静态资源CDN加速与缓存管理技巧

    通过CDN加速和缓存策略提升Golang Web服务静态资源加载速度,具体包括:使用http.FileServer提供静态服务并配置CDN域名;设置合理Cache-Control头区分长缓存与短缓存资源;采用文件名哈希实现精准缓存失效;结合构建流程读取manifest.json动态生成带哈希路径;上…

    2025年12月16日
    000
  • 如何解决Golang依赖包下载时出现的网络超时问题

    答案是配置GOPROXY代理并统一团队下载策略。通过设置GOPROXY=”https://goproxy.cn,direct”可有效解决Go模块下载超时问题,优先使用国内代理加速访问,direct作为备用选项直连源站;同时可优化DNS、使用go mod vendor离线依赖、…

    2025年12月15日
    000
  • Golang模块代理与国内源加速实践

    国内拉取Go模块慢或失败主因是官方服务被网络限制,通过配置GOPROXY指向goproxy.cn等国内镜像并设置GOSUMDB为sum.golang.cn或关闭校验可显著提升下载速度与稳定性,同时建议组合多个代理并保留direct回退以增强容错性。 在Golang的开发实践中,尤其是在国内网络环境下…

    2025年12月15日
    000

发表回复

登录后才能评论
关注微信