让机器拟人化,从“人工智障”到“人工智能”

5月27日,创业黑马在北京举办 “2023跃迁•黑马AIGC峰会”。此次大会的主题为“预见新世界,构建新格局”。有“AI专家”之称的卡耐基梅隆大学计算机学院前副院长、达沃斯世界经济论坛(WEF)计算机全球未来理事会前主席贾斯汀•卡塞尔,以及360集团、智源研究院、昆仑万维、云知声、蓝色光标、万兴科技、知道创宇等众多行业内企业高层到场,与上千位参会者进行了深入交流。

在峰会现场,云知声创始人、CEO 黄伟分享了 《通向智享未来之路》主题。

以下为分享内容整理:

开始我们希望按照专家的方式去做,希望交给机器一些方法论,十年前,机器开始从错误反馈里学习。这都是在过去人工智能技术里的大概阶段和路径。

今天OpenAI推出了ChatGPT和预训练模型,整个智能变得更加拟人化,首先我们用非常强大的算力阅读了全世界已知的所有文本,训练形成了大模型。它特别像婴儿大脑,可能有几百亿、上千亿的参数,和人脑不同的是,婴儿最多只是遗传了父母的外表和性格等,但大模型的大脑遗传了知识,这只是初始状态,接下来会通过微调等各种方式,像小孩在成长过程中会有各种教育,整个大模型的演进更加拟人化。

这是整个人工智能的变化。

今天的AGI和之前有什么本质变化?2022年12月份之前,整个人工智能还是一种鉴别式人工智能,做判断题、专用系统和智能模块,做一些特定任务。一方面人工智能的表现并不是那么智能,常被别人诟病“你们提供的是人工智障”,以至于过去人工智能的能力天花板较低。

第二,在很多场景里,客户的需求是千差万别的,但人工智能的能力没那么强,很多公司和团队用各种定制去满足。人工智能企业并不像高科技公司,在过去十年里,只能做鉴别式AI是手工作坊的时代。但现在有了大模型,有更加强大的通用能力,人工智能开始进入工业化时代。

有了新的生成能力、涌现能力,用一个模型就能解决很多场景下的不同问题。今天这个时代,人工智能大模型就是发电机,在发动机没有发明之前,中东国家并没有那么富裕,石油的价值没那么大。就像今天可以把数据变成燃料和能力,用这个能力赋能千行百业。

云知声为什么能够在短时间推出自研大模型?

2016年看到AlphaGo,我们把医疗产品在医院里落地,帮助北京协和医院的医生,极大提高工作效率。在医院这个场景里,只是效率工具是不够的,人工智能真正的智能是认知智能,Transformer是2017年提出来的,认知智能的背后需要比较强大的算力。

有了这些铺垫,无论从学术还是工程化方面,积累了很多经验。这个经验对于个人来讲是你谋生的能力,但是对于公司来说是在市场上胜出的核心竞争力。把ChatGPT框架看了之后,发现没有一项是新的,都是一些已有的工程化组合,我们很快把这种能力结合,投入到大模型研发中。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

让机器拟人化,从“人工智障”到“人工智能”

我们在三天前,发布了商业大模型,名字叫山海。把预训练、指令微调、基于人反馈的增强学习全部跑通,看到了期待已久的涌现能力。那时候团队就在想是不是要给它起个名字,那段时间我在频繁出差,觉得名字还挺好的。海是波澜壮阔,有容乃大,体现出大模型的无限生成能力,山是高山仰止,我们知道什么能说、什么不能说,这恰恰是既要强调大模型的生成能力,又要强调大模型的安全合规问题。

有一个很有意思的现象,大家都在谈大模型,国内对大模型的关注是在春节后,但大家都不谈这个事,心里都没底。到今天为止,有一种观点这件事情只有技术还不能做,哪怕人都到位了,但训练成本很大,是极其烧钱的。大模型不是科学革命、不是发明了新的算法,是把已有的算法组合在一起做大,大都是有代价的,当然还有很多工程在里面。观点是对的。

反过来讲,如果认为未来10-20年大模型是很大的机会,BAT投不进去了,就放弃了,我认为还是有机会的。

云知声在过去的几年里,并不需要特别牛的科学家,我甚至认为这个事就不是科学家干的事情,科学家没有玩过那么多算力,也不知道场景在哪里,所以结果一定是不好的。有场景的厂商反而是最有可能成功的。

起山海这个名字,还有一个意思,所爱隔山海,山海皆可平。

山海之力是十项全能。生成能力是非常主观的,真正在场景落地的时候,语言理解能力很重要,为什么以前觉得是人工智障,因为缺乏理解和代码能力。代码能力的提升能够有助提升大模型的推理能力,输出结果一定要符合国内的法律法规甚至道德价值观等。我们还采用GPT-4 插件的架构,帮助企业和客户,从数据的优选、模型训练、模型部署等一条龙服务。

为什么大模型具备复杂的逻辑推理能力?我们今天做到了,但不知道为什么,到底是500亿参数还是1000亿参数更好,却不好说,可能1000亿参数里面神经元还没有被激活。

另外还有医疗,一开始我们在做大模型,很多人以为云知声做的是垂直行业模型,并不是,我们是做行业应用。挑战了一个最严肃的场景——医疗,通过预训练阶段,收集了很多医学的文献、专著、书籍,病案,积累了几千万真实标注的数据,这些数据可以转化成我们的微调数据。

另外在2019年还获得了北京市科技进步一等奖,获奖项目就是大规模知识图谱构建关键技术及应用,我们有国内最大规模之一的医疗知识图谱,我们把知识图谱分解成知识插件嵌入到大语言模型中,使得大模型变成医疗领域的专家。

MedQA是一个非常权威的医疗知识问答测试集,包括谷歌的Med-PaLM,ChatGPT和GPT-4都在这个测试集上公布了它们的评测结果,山海前不久的评测中做到了81分,大大超过了GPT-4的71分。通过领域增强以后,能够把大模型变成某个领域的专家。还有一个数字可以做横向对比,医学院毕业生要通过临床执业医师考试目前已知的AI最高分数是456分,山海大概考了511分,这就是大模型通过领域增强以后获得的超强能力。

想做大模型还是挺难的,门槛非常高,除了需要很多钱之外、优秀的算法工程师和算法之外,还需要很多能力,我们把它总结为山海之功。直观来讲,大模型本身就是大数据集,大模型是工程师的活儿,云知声为什么能够用几个月的时间就能做出一个非常权威的客观的评测数据,我们内部去评,不只在医疗,在通用领域方面,云知声都是最好之一。

算力平台不是买多少卡来插就行了,云知声差不多有200P算力,利用集群的效率达到业内最顶尖的水平,可以用相对比较少的卡,很快速地训练出我们的模型。

我们目前GPU集群的利用率能做到50%,大模型需要多卡,目前业内的水平大概是42%。大模型还要做到3D混合并行训练。什么是3D?就是模型的并行化、数据的并行化、流水线的并行化,要把任务分离到很多不同机器的不同卡里分别计算,最后能快速得到响应的结果。另外在模型推理里得到了很多优化,推理的速度提高了5倍,怎么样把训练卡和推理卡分开,训练卡是A800,推理卡是在一张单卡A6000上就可以实现快速推理。

另外数据很重要,数据规模、数据多样性、数据高质量,我们现在能做到支持10T级别的快速去重,ChatGPT的训练数去是45T,但是优选之后用了几百G的数据来训练。

有了这些能力之后,就能够基于Atlas和UniDataOps的能力,可以把山海的能力和行业客户更好地提供服务。

智慧物联也是公司的一块重要业务,我们有很多落地,过去用的效果确实不太好,希望有了山海之后,用大模型把已有的物联网的产品全部做一遍。

医疗是我们看好的方向。以前的医疗方向,产品主要有两个方面,一是不用手敲键盘,直接拿麦克风说话,极大提升了医生的工作效率,把病历输入时间从3个小时缩短到了1个小时;二是有了病历之后,还有一套系统,通过AI大脑审核病历,审核病历有没有错误,现在有了AI大模型能力之后能够做什么呢?

山海的愿景是通过人工智能打造互联、直观的世界,以前对人工智能的定义是让机器服从人,今天希望机器更加拟人。人和物的沟通交流会变的更加直观,新的能力会带来新的产品、新的商业模式,非常愿意和在座各位共同迎接大模型的新时代。

扫码加入黑马创业者交流群

↓↓↓

HTML5人工智能技术网站模板 HTML5人工智能技术网站模板

HTML5人工智能技术网站模板是一款适合从事人工智能服务机构宣传网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。

HTML5人工智能技术网站模板 107 查看详情 HTML5人工智能技术网站模板

扫描下方二维码

加入黑马AIGC产业营

读懂AIGC底层逻辑,一步接入产业未来

↓↓↓

分享、赞和在看,完成三连击,把好的内容传递给更多需要的人。

更多精彩内容,尽在i黑马视频号

↓↓↓

关注黑马传播矩阵,get更多精彩内容

↓↓ ↓

以上就是让机器拟人化,从“人工智障”到“人工智能”的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/902608.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
PDF文件太大压缩技巧_PDF优化方法分享
上一篇 2025年11月28日 21:10:11
两奈米洩密案台积电喊告!罗唯仁离职谎称转任学术单位
下一篇 2025年11月28日 21:10:22

相关推荐

  • 人工智能如何为 C 语言代码提供安全增强功能?

    人工智能通过提供以下功能来提升 c 代码安全性:静态分析:识别潜在安全漏洞(例如缓冲区溢出);动态分析:监控代码执行并检测异常行为;模糊测试:生成随机输入以测试代码的异常行为;自动化修复:建议修复措施或自动生成补丁程序。 人工智能赋能 C 代码:提升安全性 人工智能 (AI) 在 C 代码安全方面发…

    2026年5月10日
    100
  • ChromaDB向量嵌入的有效持久化策略

    本文详细介绍了如何利用langchain中chromadb的`persist_directory`功能,高效地持久化存储向量嵌入。通过将生成的嵌入数据保存到本地磁盘,可以有效避免重复计算,显著提升工作流程效率。教程将涵盖持久化chromadb实例的创建与后续加载的完整过程。 在处理大规模文本数据并生…

    2026年5月10日
    000
  • DeAgentAI(AIA)币是什么?值得投资吗?DeAgentAI上线指南、价格预测及路线图介绍

    目录 DeAgentAI (AIA) 上市:关键细节和交易时间表关键上市信息DeAgentAI(AIA)价格预测:上市后DeAgentAI (AIA) 是什么:解释DeAgentAI (AIA) 为何脱颖而出?DeAgentAI (AIA) 生态系统:其运作方式认识 DeAgentAI (AIA) …

    2026年5月10日
    000
  • C++ 框架如何支持人工智能模型的持续改进和维护?

    C++ 框架助力持续改进和维护 AI 模型 简介 训练和部署 AI 模型是一项持续的过程,需要不断改进和维护。C++ 框架提供了强大的工具和特性,以支持这些活动。 持续改进 立即学习“C++免费学习笔记(深入)”; 数据收集和特 征工 程 C++ 框架如 TensorFlow 和 PyTorch 提…

    2026年5月10日
    000
  • C++框架在人工智能领域的应用

    c++++ 框架在 ai 领域应用广泛,提供速度、效率和灵活性的优势。流行的 ai c++ 框架包括 tensorflow、pytorch、caffe2、mxnet 和 theano。这些框架用于开发图像分类、自然语言处理和机器学习等应用程序。 C++ 框架在人工智能领域的应用 C++ 以其速度、效…

    2026年5月10日
    000
  • 人工智能助力 C 代码集成和 DevOps实践

    通过将人工智能 (ai) 集成到 c 代码集成和 devops 实践中,可以提高效率和质量:代码审查: ai 工具可以分析代码并识别潜在问题,评估质量指标,例如可读性、可维护性和安全风险。(实战案例:codescene)测试自动化: ai 算法可以生成测试用例并执行测试,提高测试覆盖率。(实战案例:…

    2026年5月10日
    000
  • Holoworld AI(HOLO)是什么币?怎么买?未来能涨到多少

    Holoworld AI(HOLO)是AI驱动虚拟社交平台的原生代币,用于生态内功能与激励。用户可通过中心化平台(如用USDT交易)或去中心化平台获取HOLO,需注意合约地址准确性与网络手续费。其市场表现受项目团队、技术进展、代币经济模型、市场环境及社区活跃度等多重因素影响,且所有数字资产交易均伴随…

    2026年5月10日
    200
  • 如何运用人工智能提升 C 代码可维护性?

    如何运用人工智能提升 C 代码可维护性 在 C 编程中,可维护性是至关重要的,它可以确保代码易于理解、修改和调试。人工智能 (AI) 可以成为提升 C 代码可维护性的强大工具。 1. 代码生成和重构 AI 可以用于生成新的代码或重构现有代码,使其更易于维护。例如,代码生成器可以根据指定规范自动生成代…

    2026年5月10日
    000
  • 开发基于ChatGPT的自动写诗系统:Python让诗意流淌

    开发基于ChatGPT的自动写诗系统:Python让诗意流淌 自古以来,诗歌一直是人类表达感情和思想的一种重要方式。然而,写好一首优美的诗歌并不是每个人都能做到的,特别是对于那些没有诗歌创作经验的人来说。但是,现代技术的发展让自动写诗成为可能,人们可以利用计算机和人工智能技术来自动生成诗歌。在这篇文…

    2026年5月10日
    000
  • Solana基金会主席 Lily 上海演讲:万物皆可代币化

    在 2025 年 10 月 23 日至 27 日举行的第 11 届全球区块链峰会期间,Solana 基金会主席 Lily Liu 在上海区块链国际周上发表了主题演讲,阐述了“万物皆可代币化”的愿景,并分享了 Solana 在全球金融基础设施建设方面的战略布局。 Solana 的愿景:万物皆可代币化 …

    2026年5月10日
    000
  • html搜索框如何跳转_实现HTML搜索框跳转搜索结果【结果】

    HTML搜索框跳转失败多因表单action或参数错误,可通过五种方法解决:一、百度用form提交至https://www.baidu.com/s?q=关键词;二、Google类似,action为https://www.google.com/search;三、JavaScript拼接必应URL并loc…

    2025年12月23日
    400
  • 从OpenAI API JSON响应中高效提取生成文本内容

    本教程详细指导开发者如何从openai api返回的json格式响应中准确提取生成的文本。通过利用`json.parse()`方法解析响应字符串,并访问`choices[0].text`属性,可以安全、高效地获取核心文本内容,从而避免直接字符串操作的潜在问题,确保api数据处理的健壮性。 OpenA…

    2025年12月23日
    500
  • ai做html怎么运行_AI生成html运行步骤【教程】

    答案是使用AI生成HTML代码后,将其保存为.html文件并用浏览器打开即可运行。具体步骤为:1. 在AI工具中输入需求生成HTML代码;2. 将代码复制到文本编辑器并另存为index.html,编码选UTF-8,类型选“所有文件”;3. 双击该文件用浏览器打开,若无法正常显示需检查文件后缀、编码及…

    2025年12月23日
    000
  • HTML语义化未来趋势有哪些_HTML语义化在Web发展中的趋势与展望

    HTML语义化正朝着智能、高效、包容发展,深度融合结构化数据与ARIA属性,提升机器理解;2. 组件化趋势推动可复用语义结构普及,Web Components实现自定义语义标签;3. 语义化助力性能优化与可访问性,支持懒加载与内容优先级划分;4. AI工具将自动生成语义化代码并辅助检测,降低实践门槛…

    2025年12月23日
    300
  • HTML数据如何实现数据智能 HTML数据智能分析的技术架构

    实现HTML数据智能分析需构建包含采集、解析、存储、分析与可视化的闭环系统,首先通过爬虫技术获取网页数据并进行清洗标准化,接着利用DOM树分析与NLP技术提取结构化信息,随后将数据存入合适数据库或数据仓库并建立元数据管理机制,进而应用AI模型开展分类、情感分析、趋势预测与知识图谱构建等智能分析,最终…

    2025年12月23日
    100
  • HTML5 section怎么用_HTML5内容分区标签应用场景说明

    在HTML5中,标签用于定义文档中具有明确主题的独立内容区块,需包含标题以体现其结构性与语义性,常用于文章章节、产品模块等场景,区别于无语义的和可独立分发的。 在HTML5中,section 标签用于定义文档中的一个独立内容区块。它不是简单的容器,而是有语义的结构化标签,表示文档中一个主题性的分区,…

    2025年12月23日
    000
  • htm算法 前景如何_分析HTM算法应用前景

    HTM算法在实时异常检测、预测性维护等时序数据场景中具备应用价值,其无需大量标注数据的特性适合工业监控、网络安防等领域;但受限于生态薄弱、性能不及主流模型及工程实现难度,短期内难以成为主流,更可能作为边缘计算或AI系统补充技术,在特定专业领域持续发展。 HTM(Hierarchical Tempor…

    2025年12月23日
    000
  • HTML结构化数据怎么添加_Schema标记添加教程

    Schema标记通过结构化数据帮助搜索引擎理解网页内容,提升搜索结果展示效果,如添加星级评分、价格等富文本信息。使用JSON-LD或Microdata格式将符合Schema.org标准的类型(如Article、Product)嵌入HTML中,可增强SEO,需通过Google Rich Results…

    2025年12月22日
    000
  • 如何实现自定义提示

    掌握自定义提示需构建迭代工作流,通过明确目标、设定角色、提供上下文、结构化输出、示例引导、迭代优化、负面提示和链式思考,实现AI输出的精准控制与高效协同。 实现自定义提示,核心在于理解与AI模型交互的本质,并将其从“提问”升级为“引导”。它不是简单的抛出问题,而是通过精心设计的语言结构、上下文信息、…

    2025年12月22日
    900
  • p5.js中类方法声明的语法解析与常见错误修复指南

    本文旨在解决从java processing迁移至p5.js时常见的语法错误,特别是类内部方法声明不当引发的问题。我们将深入探讨javascript中全局函数与类方法声明的语法差异,提供清晰的示例代码,并指导如何识别和修复“unexpected token”及“declaration or stat…

    2025年12月21日
    600

发表回复

登录后才能评论
关注微信