8 月 13 日消息,商汤科技联合创始人、执行董事兼首席科学家林达华于 8 月 12 日发布深度长文《迈向多模态通用智能:商汤的思考》,系统阐述了通向多模态通用智能的底层逻辑、技术路线、实践探索以及未来愿景。

林达华指出,人工智能的核心在于通过计算实现智能行为,而智能本身是一个高度复杂且多维度的概念。其本质体现为个体与外部环境(包括物理世界或其他智能体)进行自主交互的能力,涵盖感知、推理、决策、学习等多个关键维度。
他强调,语言仅仅是人类智能发展过程中的产物,并非智能的根源;语言是描述现实的工具,但并不等同于现实本身。他也明确表示:“仅依赖语言模型无法实现真正意义上的 AGI”。

林达华认为,尽管大语言模型在通向 AGI(通用人工智能)的道路上迈出了关键一步,但随着现有文本数据终将被模型充分吸收,AI 的下一次飞跃必须突破语言的局限,回归智能的本质——即与真实世界的互动。
他提出,要实现真正的通用智能,AI 必须具备类似人类的多感官信息接收能力,能够将来自视觉、听觉等原始模态的数据转化为可计算的内部表示。他强调:“对多模态信息的感知与处理能力,是构建 AGI 的核心前提,也是从语言模型进化至通用智能的必然路径”。
以上就是商汤科技林达华:AI 下一阶段突破必然要超越语言,回归世界交互的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/152853.html
微信扫一扫
支付宝扫一扫