讯飞星火V3.5正式发布,基于全国产算力平台“飞星一号”训练

科大讯飞将在1月30日举行星火认知大模型v3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火v3.5。

科大讯飞宣布于2023年10月24日,发布首个支撑万亿参数大模型训练的万卡国产计算力平台“飞星一号”,正式启用。启用后的90多天里,讯飞星火基于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。

基于全民开放大模型训练的全民开放大模型火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面取得了全面升级。其中语言理解、数学能力超过GPT-4+Turbo,代码达到GPT-4+Turbo+96%,多模态理解达到GPT-4V+91%。

目前,讯飞星火已赋能保险、银行、能源、汽车、通信等领域联合龙头企业,通过与太平洋保险合作,通过星火太平洋保险合作,通过星火太平洋计划赋能内部知识服务、办公、审计、展业等,打造数字劳动力在保险领域的应用标杆;联合交通银行,赋能客服、展业、办公、研发等,重点打造银行领域的代码能力应用标杆;与国家能源集团联合,赋能煤炭、电力、运输、化工等方面,打造央企集团一体化联动的大模型应用标杆;与国家能源集团联合,赋能煤炭、电力、运输、化工等方面,打造央企集团一体化联动的大模型应用标杆。

除此之外,深度适配国产算力的“讯飞星火开源大模型”首次发布,场景应用效果领先,昇思开源社区联合首发上线。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

讯飞星火V3.5正式发布,基于全国产算力平台“飞星一号”训练

这次开源拥有1.3亿参数(13B),包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。

刘庆峰透露,星火开源大模型在技术上形成了差异化优势。星火开源-13B在多项知名公开评测任务中名列前茅,在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中,通过对学习辅助、语言理解等领域的深入研究和优化,实现了性能大幅提升,在处理复杂的自然语言任务时更加得心应手。

讯飞公文 讯飞公文

讯飞公文写作助手是一款依托于讯飞星火大模型、专为广大公文材料撰稿人打造的高效公文写作平台。

讯飞公文 46 查看详情 讯飞公文

基于“飞星一号”训练,星火开源大模型全栈国产适配优化,简单易用,场景应用效果领先,训练策略针对昇腾算力极致优化,训练效率达A100的90%。这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。

开源只有更多的场景落地,才能更好地增进生态合作。目前,华为昇思开源社区已正式上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。

展望2024年讯飞星火大模型发展,刘庆峰指出三点:“首先,一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”我们要清醒理智看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。“今天的通用大模型并不一定代表人工智能的全部未来,还有很多创新要做,如脑科学互动、对抗网络的深度连接等需要整个创新的生态,但我们一定要有勇气、有期许走在最前列。”刘庆峰指出。

“第二,2024年要真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型,中国企业界、科学界有信心实现超越。”

“第三,高楼大厦要建立在安全可控的平台之上,我们要实现自主可控平台上的生态繁荣。”刘庆峰表示,自己有信心,能够实现从算法、数据、应用场景到算力,构建一个完全自主可控的繁荣的人工智能生态。

以上就是讯飞星火V3.5正式发布,基于全国产算力平台“飞星一号”训练的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/616678.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月11日 04:19:57
下一篇 2025年11月11日 04:24:52

相关推荐

  • MongoDB从入门到提高【第一集】———MongdoDB配置参数说明及示例

    【第一集】———MongdoDB配置参数说明及示例 开头依然是扯蛋 写这个系列的文章确实是我鼓起好大的勇气完成的。如果在文章中出现什么错误或者不妥的地方,请好心的读者朋友尽快指出,让我们共同成长。最近在个人项目中想用到最近接触的NoSql数据库来试着 【第一集】&…

    2025年12月2日
    100
  • mysql语句入门详解

    本文主要和大家分享mysql语句入门详解,专门和大家一步一步详解mysql语句,希望能帮助到大家。 Select,Left Join的用法,及模糊查询的实现: left join 关键字会从左表 (table_name1) 那里返回所有的行,即使在右表 (table_name2) 中没有匹配的行。(…

    2025年12月2日
    000
  • 2024Q2全球入门手机TOP10出炉:Redmi 13C屠榜第一 遥遥领先

    9月4日消息,市场调查机构counterpoint research最新发布了2024年第2季度入门机的市场数据。其中显示,该季度全球经济型智能手机销量突破1亿部,同比增长10%,占全球智能手机销量的37%。最畅销的前10款经济型智能手机达到四分之一,高于去年同期的21%。 1. 前十排行榜被小米、…

    2025年12月1日 行业动态
    000
  • 海致科技发布首个知识图谱融合大模型应用平台,助力国内百模大战

    9月8日下午,中国工程院院士、清华大学计算机系教授、%ignore_a_1%首席科学家郑纬民在北京演示发布了由海致科技与高性能图计算院士工作站共同开发的「atlas llm 知识图谱与大模型融合应用平台」,该平台面向广大b端用户,运用知识图谱这项人工智能基础技术,帮助大模型在企业级和工业界应用中克服…

    2025年12月1日 科技
    000
  • 千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

    阿里云于10月31日正式发布了千亿级参数大模型通义千问2.0。根据10个权威测评结果显示,通义千问2.0的综合性能超过了GPT-3.5,并且正在快速迎头赶上GPT-4。当天,通义千问APP在各大手机应用市场上线,任何人都可以通过该APP直接体验最新模型的能力 过去 6 个月,通义千问 2.0 在性能…

    2025年12月1日 科技
    000
  • 阿里云全面升级AI基础设施,通义千问2.0正式亮相,中国大模型公司一半部署在阿里云上

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 智能时代的云计算技术体系 全面升级 AI 基础设施 AI产业中的核心技术是大模型,而基础模型的质量很大程度上决定了AI产业化的前景。训练大模型需要包括算力底座、网络、存储、大数据、AI框架、AI…

    2025年12月1日 科技
    000
  • 微软免费课程,吴恩达亲自授课,为顶级生成式AI提供必备课程

    你已经准备好了吗?准备迎接新一轮的学习之旅 在当今盛行生成式 AI 的时代,你是否也为这项技术所倾倒,比如说只需输入简单的文字,短暂的瞬间,一个精美的图片或是流畅的文字就会呈现在你眼前 许多人都认为生成式人工智能是深不可测的,没有系统的课程讲解就难以理解其精髓。如果有科技公司或知名学者来协助完成这项…

    2025年12月1日 科技
    000
  • 中国科学院研究团队发布了两篇重要论文:首个跨物种生命基础大模型问世,以及新型细胞命运预测AI模型的发布

    作者 | 中国科学院多学科交叉研究团队 编辑 | ScienceAI 被称为20世纪人类三大科学计划之一的人类基因组计划,拉开了深度解析生命奥秘的序幕。由于生命过程具有多维度、高度动态的特点,传统实验研究手段难以系统精准地破解基因密码的底层共性规律,亟需运用强大的计算技术来实现基因数据的表征建模与知…

    2025年12月1日 科技
    000
  • Linux入门必备指令

    前言:   从今天开始,我们将进入Linux的学习,想要学好Linux,指令一定是不可忽略的重要部分,那么话不多说,进入今天的正题! 一、ls指令 常用选项: -a 列出目录下所有文件,包括以 . 开头的隐含文件。 -b 将目录像文件一样显示,而不是显示其下的文件。如:ls -d 指定目录。 -i …

    2025年11月29日 运维
    000
  • [教程]MongoDB 从入门到进阶 (TextSearch)

    随着MongoDB 2.4.1的发布(由于2.4.0刚发布就发现一个重大的Bug,所以现在的最新版本是2.4.1),全文检索的功能也被追加进MongoDB了。不过全文检索功能现在仅仅能够用于对于拉丁文的检索。 1.首先要使用MongoDB2.4.1,请先到官网下载最新版的MongoDB 2.如果 随…

    2025年11月28日 数据库
    000
  • MongoDB从入门到提高【第二集】———MongdoDB权限设置

    前集回顾 上一集我们讲到了MongoDB的安装,以及常用的配置文件,一般用于开发的话,我的配置文件已经够用了。之所以选择MongoDB,究其原因,别的不说单单一个,安装分分种事情,这就是好处,卸载就更方便了,其余的优点不说大家也知道。呵呵有点废话了。今天 前集回顾   上一集我们讲到了MongoDB…

    2025年11月28日 数据库
    000
  • C-Eval中文大模型最新榜单发布,云天励飞居榜首

    日前,c-eval%ignore_a_1%大模型榜单更新,云天励飞大模型以77.1的平均分位列榜单第一。(榜单目前有62个模型) ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向…

    2025年11月28日 科技
    000
  • 英特尔推出下一代数据中心CPU设计:Chiplet设计,性能提升达240%

    下一代英特尔芯片,要有巨大的性能提升。 每年一度的 Hot Chips 是半导体业界最重要的技术会议。在其中,芯片领域专家齐聚一堂,全球芯片厂商也经常选择在这里发布新产品,或是阐述未来的发展方向。 当地时间周一,在斯坦福大学举办的 Hot Chips 2023 上,英特尔首次披露了新一代数据中心芯片…

    2025年11月27日 科技
    000
  • 又一Sora级选手来炸街!我们拿它和Sora、可灵PK了下

    当sora「千呼万唤」不出来时,openai 的对手们却纷纷祭出大杀器来炸街。 Sora 再不开放使用,真的要被偷家了! 今日,旧金山初创公司 Luma AI 打出一手王牌,推出新一代 AI 视频生成模型 Dream Machine。人人免费可用。 据介绍,该模型能够根据简单的文本描述生成高质量、逼…

    2025年11月26日 科技
    000
  • AI出图更快、更美、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 随着大模型的落地按下加速键,文生图无疑是最火热的应用方向之一。 自从 Stable Diffusion 诞生以来,海内外的文生图大模型层出不穷,一时有「神仙打架」之感。短短几个月,「最强 AI …

    2025年11月26日 科技
    000
  • NeurIPS2024 | OCR-Omni来了,字节&华师提出统一的多模态文字理解与生成大模型

    研究背景与挑战 在人工智能领域,赋予机器类人的图像文字感知、理解、编辑和生成能力一直是研究热点。目前,视觉文字领域的大模型研究主要聚焦于单模态生成任务。尽管这些模型在某些任务上实现了统一,但在 OCR 领域的多数任务上仍难以达成全面整合。 例如,Monkey 等视觉语言模型(VLM)擅长文字检测、识…

    2025年11月26日 科技
    100
  • 吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型

    在构建应用程序时,与多个提供商集成很麻烦,现在 aisuite 给解决了。 用相同的代码方式调用 OpenAI、Anthropic、Google 等发布的大模型,还能实现便捷的模型切换和对比测试。 刚刚,AI 著名学者、斯坦福大学教授吴恩达最新开源项目实现了。 ☞☞☞AI 智能聊天, 问答助手, A…

    2025年11月26日 科技
    000
  • 成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体

    利用%ignore_a_1%高效提升酶热稳定性:上海交大研究团队取得突破 酶的热稳定性对于生物技术和工业应用至关重要。传统方法通过逐步引入单点突变来优化酶的热稳定性,过程费时且效率低下。近日,上海交通大学杨广宇研究员团队与洪亮教授合作,在《mLife》杂志发表研究成果,提出了一种基于人工智能的策略,…

    2025年11月26日 科技
    000
  • 旗舰与入门款电视分水岭 万元以下别谈 HDR

    在视像技术日新月异的今天,动态对比范围作为提升画面质量的五大关键维度之一,其重要性不言而喻。hdr(high-dynamic range,高动态范围)技术的出现,不仅打破了传统 sdr(standard dynamic range,标准动态范围)在亮暗细节表现上的局限,更将电视画质推向了一个新的高度…

    2025年11月20日
    000
  • 入门级4K投影仪开打 价格跌破3000元

    10月27日消息,随着技术迭代与市场竞争加剧,曾属中高端领域的4k投影仪正加速走向亲民化。 洛图科技(RUNTO)数据显示,搭载TI 0.39英寸芯片的DLP产品终端价格为3500元左右,3LCD的4K LED产品价格则已进入3000元以内。 这一轮价格战的背后是产业成熟的必然趋势,随着0.47英寸…

    2025年11月12日 行业动态
    000

发表回复

登录后才能评论
关注微信