直追ChatGPT?千亿AI巨头,火速升级大模型!

中国基金报记者 冯尧

距离首次推出多模态大模型刚一个月有余,科大讯飞又马不停蹄对其“星火认知大模型”升级。

6月9日,科大讯飞公布其通用大模型新进展,发布“星火认知大模型”V1.5版,该版本在开放式问答方面取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力也得到提升。此外,科大讯飞推出了星火APP,并将其配备了“星火认知大模型”。

科大讯飞在一个月前发布时已计划在10月24日前达到与ChatGPT能力的对标。科大讯飞方面透露,计划于8月15日推出“星火认知大模型”的多模态交互升级。

瞄准待攻克的“三大缺陷”

在5月6日,科大讯飞首次公布“星火认知大模型”,当时科大讯飞董事长刘庆峰即为其立下目标:争取今年10月24日在中文方面超越GPT,在英文达到相当水平。

科大讯飞进行了升级并发布了“星火认知大模型”V1.5版本,这是在34天后的事情。刘庆峰介绍,该版本在开放式问答方面取得突破,在多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

直追ChatGPT?千亿AI巨头,火速升级大模型!

尤其在泛领域开放式问答方面,“星火认知大模型”V1.5版本瞄准了纯大模型技术有待攻克的“三大缺陷”:新知识难以更新、事实类问答容易“张冠李戴”、史实传统典籍等容易“编造情节”。

同时,多轮对话能力的跃迁,让讯飞星火的对话体验更加贴合真人。多轮对话是大模型的传统难题,简单来说即为“没记性”。

在会上,科大讯飞也对“星火认知大模型”进行现场演示。在谈及“中国关于人工智能有何新动向”这一问题时。“星火认知大模型”提及今年6月3日,长三角企业家联盟产业数字化峰会发布了《通用人工智能长三角(合肥)宣言》和《通用认知智能大模型评测体系》。

实际上,星火大模型在5月已经定型,而“星火认知大模型”给出的答案,已经包括6月相关政策动向,也表明大模型已处于实时更新学习状态。需要注意的是,”星火认知大模型”进一步揭示了当前中国人工智能所面临的差距。

“大模型与搜索给出一样的答案没有意义,而是要通过专业知识、推理能力给出具有建设性的方案,”科大讯飞研究院院长刘聪也在会上直言。另外,”星火认知大模型” 在会议上成功地回答了今年高考数学题和语文题。

下一节点:多模态交互再升级

科大讯飞计划在今年内进行三轮迭代升级,旨在在10月24日达到与ChatGPT相媲美的水平。除了6月9日,下一个升级阶段在8月15日,主要是为了提升代码能力和多模态交互能力。多模态领域的功能,例如虚拟人合成和图文理解,将在未来向客户开放。

科大讯飞董事长刘庆峰此前表示,目前科大讯飞的代码能力重点针对工业互联网,针对企业内部的很多应用,将来目标是不需要程序员,让大模型生成各种代码。但刘庆峰也坦言,星火大模型的这一功能和ChatGPT相比,还有很大差距,下一步升级的重点功能也是这一领域。

天工大模型 天工大模型

中国首个对标ChatGPT的双千亿级大语言模型

天工大模型 115 查看详情 天工大模型

而刘庆峰在会上透露,在更为前沿的领域,科大讯飞方面还将探索更多潜在人工智能技术路线,如博弈智能、类脑智能和神经网络模型。

除了大模型自身能力进一步提升外,科大讯飞此次还发布了“星火认知大模型”在学习、医疗、工业、办公等领域进一步的商业落地进展,包括推出星火APP和星火语伴APP。

同时,科大讯飞还进一步瞄准了细分领域,推出星火认知大模型+医疗诊后管理平台、星火认知大模型+工业互联网平台、星火认知大模型+讯飞听见智慧屏产品。在业内人士看来,此举意在推动其在细分领域的商业化,有望率先突破的场景即为上述医疗、工业制造以及办公领域。

同时,除了面向不同应用场景开发示范性应用产品外,科大讯飞面向AI开发者、大模型上下游企业、创业团队的星火生态,也在同步招募生态合作伙伴。

实际上,参考OpenAI的发展史,大模型研发的前提是对小模型的研发、训练、应用等已经足够成熟,OpenAI创立之初的产品也仅为游戏领域的垂直小模型,在完全摸透小模型的研发、落地后才不断扩大参数量最终形成1750亿参数的大模型GPT3。

国内大模型开启“百模大战”

自今年3月以来,国内的通用大模型如雨后春笋般陆续发布。其中,百度率先发布文心一言,阿里紧跟其后官宣通义千问,甚至清华大学、北京智源人工智能研究院、上海人工智能实验室等科研院所也发布了各自的AI大模型成果。

根据民生证券相关研报的统计,目前国内至少已经有30多家大模型亮相,出品方涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司,有的大模型的参数规模已经接近,甚至超越ChatGPT的规模(上千亿条)。

IDC预测数据显示,中国人工智能市场支出规模将在2023年增至147.5亿美元,约占全球总规模十分之一。长远来看,AI技术的创新迭代驱动了应用场景的进一步落地,以AIGC、数字人、多模态、AI 大模型、智能决策为代表的热点为市场带来了更多想象力和可能性。

IDC预计,2026年中国AI市场将实现264.4亿美元市场规模,2021-2026五年复合增长率(CAGR) 将超20%。中信建投认为,国内大模型研发应用热潮持续高涨,大模型发展全面加速,但当前全球大模型产业落地仍然处于早期探索的阶段,需要与下游的场景企业合作来建立大模型的商业模式。

编辑:舰长

审核:许闻

版权声明

《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。

刚刚,方星海重磅发声!

以上就是直追ChatGPT?千亿AI巨头,火速升级大模型!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/525335.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 07:38:25
下一篇 2025年11月9日 07:39:53

相关推荐

  • LangChain本地部署Llama模型:构建离线AI应用的详细教程

    本教程旨在指导用户如何利用langchain框架结合本地llama兼容模型,无需注册、api密钥或外部服务,快速搭建一个用于测试的离线聊天机器人。文章将详细介绍模型下载、llama.cpp集成以及langchain代码实现,帮助开发者在本地环境中高效运行大型语言模型,实现隐私保护和成本控制。 理解本…

    2025年12月15日
    000
  • 优化XGBoost海量数据加载策略:兼顾内存效率与并发读取

    本文旨在解决使用pandas和多进程读取海量csv文件进行xgboost训练时遇到的内存瓶颈。核心策略包括利用xgboost的dmatrix外部内存机制处理超大数据集,以及优化pandas数据加载流程,具体涉及将i/o密集型任务切换至线程池执行器,并采用一次性批量拼接dataframe以提高效率并降…

    2025年12月15日
    000
  • Llama模型微调:AutoTokenizer加载Repo ID错误解析与修正

    本教程旨在解决llama 7b模型微调中常见的`hfvalidationerror`,该错误通常源于`autotokenizer.from_pretrained`方法接收了模型对象而非预期的字符串仓库id。文章将详细阐述这一错误机制,并提供正确的tokenizer加载代码示例,强调应始终使用原始模型…

    2025年12月14日
    000
  • Python AsyncElasticsearch 异步批量操作实践

    本教程旨在指导开发者如何在Python中使用AsyncElasticsearch客户端高效执行异步批量操作。针对helpers.actions.bulk不支持异步客户端的问题,文章详细介绍了如何利用elasticsearch.helpers.async_bulk这一专为异步设计的辅助函数,实现数据的…

    2025年12月14日
    000
  • PyTorch模型导出ONNX:在无PyTorch环境中高效推理

    本文介绍如何在不依赖PyTorch的环境中部署和运行PyTorch训练的模型。针对软件依赖限制,核心方案是利用PyTorch的ONNX导出功能,将模型转换为通用ONNX格式。这使得模型能在轻量级运行时(如ONNX Runtime)中高效执行推理,从而避免在部署环境中安装庞大的PyTorch库,实现模…

    2025年12月14日
    000
  • ChatGPT冲击下,国内技术问答社区如何突围?

    ChatGPT的崛起对全球技术问答社区造成了巨大冲击,Stack Overflow的困境更是敲响了警钟。国内技术问答平台,例如SegmentFault,也面临着同样的挑战。它们该如何应对呢? SegmentFault长期以来专注于为开发者提供高质量的技术问答服务,并不断优化用户体验。这包括持续改进平…

    2025年12月13日
    000
  • Flask流式传输如何模拟ChatGPT的实时响应?

    使用Flask流式传输模拟ChatGPT实时响应 许多应用,例如模拟ChatGPT的实时聊天或大型文件下载,都需要边生成边传输数据,避免客户端长时间等待。本文演示如何在Python Flask框架中实现这种流式传输,并修正原代码中的缺陷。 原代码尝试使用yield实现流式传输,但由于response…

    2025年12月13日
    000
  • Flask如何实现类似ChatGPT的实时数据流传输?

    使用Flask框架构建实时数据流:模拟ChatGPT响应 在Flask Web应用开发中,常常需要模拟ChatGPT的实时数据传输效果,即数据生成的同时即时传输给客户端,而非等待所有数据生成完毕再一起发送。本文将介绍如何利用Flask实现这种流式传输,并解决传统方法中存在的延迟问题。 传统方法的问题…

    2025年12月13日
    000
  • Flask如何实现类似ChatGPT的实时流式响应?

    使用Flask模拟ChatGPT的实时流式响应 许多开发者希望在Flask应用中实现类似ChatGPT的实时响应效果:内容生成过程中持续传输给客户端。然而,简单的Flask response 对象无法满足此需求,它会等待生成器函数完全执行后才发送结果。本文探讨如何利用Flask框架实现真正的流式传输…

    2025年12月13日
    000
  • ChatGPT冲击下,SegmentFault的生存策略是什么?

    ChatGPT的崛起对开发者社区带来了巨大冲击,Stack Overflow的困境已敲响警钟。SegmentFault作为国内领先的开发者社区,如何应对ChatGPT带来的挑战,确保自身持续发展? SegmentFault的核心竞争力在于庞大的中文开发者用户群体和高质量的技术问答内容。然而,Chat…

    2025年12月13日
    000
  • 如何通过 ADB 控制小米手机进行长截图并保存到手机上?

    ADB控制小米手机长截图:探索与实践 许多Android用户需要截取超出屏幕范围的内容,特别是包含滚动内容的页面。本文探讨如何利用ADB (Android Debug Bridge) 在小米手机上实现长截图并保存到手机。目标是截取1600×720分辨率屏幕的完整内容,生成3200&#215…

    2025年12月13日
    000
  • ChatGPT时代,技术问答社区思否如何应对挑战?

    ChatGPT浪潮下,技术问答社区思否(SegmentFault)如何突围? Stack Overflow近期面临挑战,其CEO公开承认公司正经历艰难时期,这与ChatGPT等大型语言模型的崛起息息相关。那么,作为另一个重要的技术问答社区,思否将如何应对这一挑战呢? 本文将分析思否可能的应对策略。参…

    2025年12月13日
    000
  • Flask框架下如何实现ChatGPT式的流式文本传输?

    使用Flask框架构建类似ChatGPT的流式文本传输应用 许多开发者希望利用Flask框架创建类似ChatGPT的应用,实现文本内容的实时生成和传输。然而,Flask的response对象并非为这种场景设计,它会在生成器函数完全执行后才开始返回数据。本文将介绍如何使用Flask的stream_wi…

    2025年12月13日
    000
  • Python的GIL:究竟是作用于整个进程还是每个线程?

    python全局解释器锁(gil)详解:作用范围及误区 Python的GIL (全局解释器锁) 限制了多线程程序的性能,但其作用范围常常被误解。本文将澄清GIL究竟作用于进程还是线程。 许多Python开发者对GIL有所了解,但关于GIL是否作用于每个线程,存在疑问。 这种疑问可能源于与AI模型(例…

    2025年12月13日
    000
  • ChatGPT时代,SegmentFault如何应对开发者问答社区的挑战?

    大型语言模型(LLM)如ChatGPT的崛起,给开发者问答社区带来了前所未有的挑战。Stack Overflow的困境已为业界敲响警钟。那么,SegmentFault将如何应对ChatGPT带来的冲击,保持其在开发者社区中的领先地位呢? ChatGPT能够快速生成代码和答案,这无疑会对Segment…

    2025年12月13日
    000
  • Flask框架如何实现类似ChatGPT的实时流式数据传输?

    使用Flask框架构建实时流式数据传输,如同ChatGPT的即时响应 许多开发者希望在Flask应用中实现类似ChatGPT的实时响应效果:数据生成的同时即时传输给客户端。然而,简单的yield语句无法直接实现这一目标。本文深入探讨如何利用Flask框架高效实现这种流式传输。 问题在于,之前的代码片…

    2025年12月13日
    000
  • Python的GIL:一个进程只有一个,还是每个线程都有一个?

    python全局解释器锁(gil)的真相:只有一个,而非每个线程一个 关于Python的GIL(全局解释器锁),一个常见的误解是它是否每个线程都拥有一个。 事实并非如此。Python进程只有一个GIL。 许多Python开发者对GIL的运作机制有所了解,但一些细节容易混淆。最近,一个截图(此处略去)…

    2025年12月13日
    000
  • 为什么科学家们最初选择Python而非JavaScript进行科学计算?

    Python在科学计算领域的统治地位:从最初的选择到如今的广泛应用 Python在科学计算领域的广泛应用,常常令专注于Web开发并习惯使用JavaScript的开发者感到疑惑。近期ChatGPT源码采用Python编写,更是加剧了这种好奇。JavaScript凭借其丰富的库和框架,在Web开发领域占…

    2025年12月13日
    000
  • Python的全局解释器锁(GIL)究竟作用于进程还是线程?

    Python 全局解释器锁 (GIL) 的作用范围:一个进程只有一个 GIL。 关于 Python 的 GIL 作用范围,存在一些误解。有人认为 GIL 作用于每个线程,也有人认为它作用于整个进程。本文将澄清这个疑问。 Python 的 GIL 仅作用于整个进程,且只有一个 GIL 实例。 这意味着…

    2025年12月13日
    000
  • 为什么科学计算领域偏爱Python而非JavaScript?

    Python在科学计算领域的统治地位:一个前端开发者的视角 ChatGPT源码的公开,让许多前端开发者,例如提问者,开始关注Python在科学计算领域的广泛应用。提问者注意到JavaScript凭借其丰富的库在Web开发中占据主导地位,却好奇为什么科学计算领域偏爱Python。这不仅仅是因为Pyth…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信