2021年6月11日,中国信息通信研究院公布了可信%ign%ignore_a_1%re_a_1%代碼大模型評估的首輪評估名單,阿里云通用灵码、华为云盘古、智谋codegeex等国产ai大模型均入选并首批通过。
此次大模型评估以《智能化软件工程技术和应用要求 第 1 部分:代码大模型》标准为依据,围绕通用能力、专用场景能力、应用成熟度,为模型能力提升和企业选型提供规范性参考。

本站注:“智能化软件工程技术和应用要求 第1部分:代码大模型”(标准编号AIIA/PG 0110-2023)标准于2024年1月25日正式发布,该标准由中国信通院与中国工商银行联合牵头发起,涵盖通用能力、专用场景能力和应用成熟度三大部分,包括100多个能力要求。
根据标准开展,评价指标覆盖6大通用能力场景、7大专用能力场景、3大服务成熟度,多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度,重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力支持度,全方位评估研发大模型在数据合规性、模型成熟度、服务成熟度方面的应用成熟度。

目前,华为云盘古大模型、智谱 CodeGeeX 代码大模型、阿里云 AI 编程助手通义灵码、中国电信星辰政务大模型等首批通过评估,并在全部 100 多个能力评估中表现优秀,获得 4 + 评级。
绘蛙
电商场景的AI创作平台,无需高薪聘请商拍和文案团队,使用绘蛙即可低成本、批量创作优质的商拍图、种草文案
175 查看详情


以阿里云通义灵码为例,信通院评测结果显示:
在通用能力方面,通义灵码在代码转换、代码检查及修复、代码优化等方面表现突出;在专用场景方面,通义灵码提供网站开发、数据库开发、大数据开发、嵌入式开发等多个场景支持能力;在应用成熟度方面,通义灵码具备较完善的数据合规及数据分类分级机制,且模型稳定性及可维护性表现优异,在模型推理性能、模型服务风险可控性等方面均表现优秀。
公开资料显示,AI 代码大模型首轮评估于今年 3 月启动,主要面向适用于金融、科技、互联网、电信、软件等各行业,生产、使用或计划使用代码大模型的企业,评估结果旨在为模型厂商提供代码大模型能力的评价和指导标准,以及为模型应用方提供有效衡量其能力水平的标准依据。
以上就是中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/916731.html
微信扫一扫
支付宝扫一扫