百度智能云千帆正式开源推出全新视觉理解模型——qianfan-vl。该模型系列涵盖3b、8b和70b三种参数规模,专为面向企业级多模态应用需求而设计,并在实际产业场景中进行了深度优化。
官方表示,Qianfan-VL不仅拥有强大的通用视觉理解能力,更针对OCR识别、教育等高频垂直应用场景进行了专项增强,显著提升其在真实业务环境中的表现。即日起至10月10日,开发者与企业用户可登录百度智能云千帆平台,免费试用8B与70B版本模型。
Qianfan-VL基于主流开源架构研发,全量训练与推理流程均在百度自研昆仑芯P800平台上完成,具备以下核心优势:
多规格适配多样化场景:提供3B、8B、70B三款不同尺寸的模型,满足从边缘端到云端各类部署需求,灵活匹配各类企业与开发团队。支持思维链推理机制:8B及70B版本可通过特定token启用“思考”模式,实现复杂图表解析、视觉逻辑推理、数学题目解答等高阶任务。强化OCR与文档处理能力:重点优化了全场景文字识别与复杂版式文档理解能力,在多项权威评测中取得领先成绩,助力企业构建高精度视觉AI系统。
部分性能测评结果如下:


文心大模型
百度飞桨-文心大模型 ERNIE 3.0 文本理解与创作
56 查看详情

更多技术细节与使用指南请参见官方发布内容。
源码下载地址:点击获取
以上就是百度智能云开源视觉理解模型 Qianfan-VL的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/225643.html
微信扫一扫
支付宝扫一扫