是什么阻碍人工智能进步?还是数据的问题

弗雷斯特咨询公司(Forrester Consulting)代表Capital One进行的一项新调查显示,缺乏坚实的数据基础和坚实的数据工作流正阻碍企业在机器学习人工智能方面取得更大进展。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

是什么阻碍人工智能进步?还是数据的问题

据Capital One近日发布的新报告《可操作性机器学习实现关键业务成果》,尽管企业在将机器学习(ML)和人工智能(AI)投入生产方面取得了一些成功,但如果数据管理问题不成为阻碍,它们将会取得更大进展。

该报告部分基于Forrester今年7月对北美150名数据管理决策者的调查,发现73%的决策者认为数据流的透明度、可追溯性和可解释性是阻碍机器学习和AI应用操作化的关键问题。调查还发现,57%的受访者表示,他们的数据科学家和业务者之间的内部竖井阻碍了机器学习的部署。

Capital One高级副总裁兼数据分析主管David Kang表示:“我们仍然处在这样一个阶段,机器学习算法本身并不是阻碍人们获得成功的障碍。”“关键还是数据!”

当Capital One委托进行这项调查时,他们认为最大的挑战将集中在机器学习的可操作性上。随着机器学习和人工智能应用的发展,MLOps(机器学习运营)已经成为独立学科,也是Capital One正在投资的领域。

阿里云-虚拟数字人 阿里云-虚拟数字人

阿里云-虚拟数字人是什么? …

阿里云-虚拟数字人 2 查看详情 阿里云-虚拟数字人

Kang说,但当这份报告出炉时,数据决策者最关心的还是在建立坚实的数据基础(包括数据工程和数据基础设施)方面缺乏进展。

“从某些方面来说,这令人失望。但从其他方面来说,这并不令人惊讶。因为要大规模利用数据,就需要持续关注思考和重新思考数据生态系统中的每一个能力——如何生产和消费,如何监控,如何以不同的方式管理数据。数据生态系统的转型旅程仍在进行中。这不是一件你只做一次就会忘记的事。它需要持续关注。”

Capital One的调查与最近其他研究的发现相似。这些研究发现,数据管理的问题减缓了机器学习和人工智能的采用速度和程度。其中包括9月份受Databricks委托发布的《麻省理工科技评述》(MIT Technology Review)报告,强调了数据管理不当对人工智能的危害;以及IDC 8月份受Collibra委托进行的一项研究,该研究发现,数据编目、传承、质量管理和治理等具有“数据智能”特征的公司与市场成功之间存在相关性。

如果说这些研究有一个共同的主题,那就是,尽管现有的机器学习和人工智能技术的复杂性正在迅速增长,但企业发现,他们还没有做好一些核心数据管理工作,而这些工作是实现这些技术进步所必须的。

企业可能会发现,ML或AI应用对有限的概念验证(POC)产生了积极的影响,但未能采取必要的步骤,以确保在更广泛的真实生产中顺利推出。

在你想要扩大规模的技术开始在市场上产生影响之前,可能需要等待一段时间。诱惑总是存在的,这些概念开始看到效果,然后突然就发现自己在某一个地方有一堆数据竖井和一堆其他数据工程基础设施的挑战。

数据科学仍然是一门相当新的学科,许多公司都在努力填补职位空缺。Capital One的报告发现,57%的受访者表示,他们打算利用合作关系来填补数据科学从业者之间的空白。Kang表示,缺乏内部专业知识也使得企业建立核心数据基础设施变得更加关键,从而使更先进的ML和AI用例更容易在此基础上构建,也更容易重复。

Capital One的调查也发现了减缓机器学习和人工智能采用的其他问题。该公司发现,36%的受访者认为“庞大、多样化、混乱的数据集”是主要障碍,38%的受访者认为人工智能风险是最大挑战。38%的人提到了跨组织和外部数据合作伙伴的数据竖井,称这对机器学习的成熟度构成了挑战。

数据管理的“小问题”似乎并没有减缓人工智能和机器学习的投资(至少目前还没有)。Capital One的调查发现,61%的决策者计划在未来三年增加新的机器学习能力和应用。超过一半(53%)的受访者目前正在优先考虑利用机器学习提高业务效率。

那么,公司用机器学习做什么呢?这是调查的另一个有趣的花絮,即自动异常检测是机器学习的最主要用例,40%的受访者报告这是他们的最主要用例。这引起了Kang的共鸣,他帮助Capital One建立了基于机器学习的异常检测系统。

ML和AI的其他主要用例包括: 自动应用程序和基础设施更新(39%),以及满足负责任和有道德AI的新监管和隐私要求(39%)。

以上就是是什么阻碍人工智能进步?还是数据的问题的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/568613.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
GitHub镜像库是什么_GitHub镜像库原理与使用场景分析
上一篇 2025年11月10日 04:49:55
b站怎么同步播放进度_b站视频进度同步功能使用
下一篇 2025年11月10日 04:49:57

相关推荐

  • 人工智能如何为 C 语言代码提供安全增强功能?

    人工智能通过提供以下功能来提升 c 代码安全性:静态分析:识别潜在安全漏洞(例如缓冲区溢出);动态分析:监控代码执行并检测异常行为;模糊测试:生成随机输入以测试代码的异常行为;自动化修复:建议修复措施或自动生成补丁程序。 人工智能赋能 C 代码:提升安全性 人工智能 (AI) 在 C 代码安全方面发…

    2026年5月10日
    100
  • ChromaDB向量嵌入的有效持久化策略

    本文详细介绍了如何利用langchain中chromadb的`persist_directory`功能,高效地持久化存储向量嵌入。通过将生成的嵌入数据保存到本地磁盘,可以有效避免重复计算,显著提升工作流程效率。教程将涵盖持久化chromadb实例的创建与后续加载的完整过程。 在处理大规模文本数据并生…

    2026年5月10日
    000
  • DeAgentAI(AIA)币是什么?值得投资吗?DeAgentAI上线指南、价格预测及路线图介绍

    目录 DeAgentAI (AIA) 上市:关键细节和交易时间表关键上市信息DeAgentAI(AIA)价格预测:上市后DeAgentAI (AIA) 是什么:解释DeAgentAI (AIA) 为何脱颖而出?DeAgentAI (AIA) 生态系统:其运作方式认识 DeAgentAI (AIA) …

    2026年5月10日
    000
  • 使用C++构建机器学习模型:初学者入门指南

    使用 c++++ 构建机器学习模型的初学者指南。首先安装编译器和线性代数库,创建数据集,建立线性回归模型,优化模型权重以训练模型,然后使用模型预测目标值。实战案例演示了使用房屋面积和价格数据集预测房屋价格。 使用 C++ 构建机器学习模型:初学者入门指南 简介 利用机器学习构建强大的预测模型对于解决…

    2026年5月10日
    000
  • typescript用来干嘛_typescript的作用

    TypeScript 是一种用于构建大型复杂应用程序的开源编程语言,它扩展了 JavaScript 的功能,具有以下作用:类型系统:编译时检查类型错误,提高代码可靠性。面向对象编程特性:支持类、接口、抽象类,增强代码组织性和维护性。模块系统:分解程序为可重用模块,提升可维护性和可扩展性。全面的类型推…

    2026年5月10日
    000
  • C++ 框架如何支持人工智能模型的持续改进和维护?

    C++ 框架助力持续改进和维护 AI 模型 简介 训练和部署 AI 模型是一项持续的过程,需要不断改进和维护。C++ 框架提供了强大的工具和特性,以支持这些活动。 持续改进 立即学习“C++免费学习笔记(深入)”; 数据收集和特 征工 程 C++ 框架如 TensorFlow 和 PyTorch 提…

    2026年5月10日
    000
  • C++框架在人工智能领域的应用

    c++++ 框架在 ai 领域应用广泛,提供速度、效率和灵活性的优势。流行的 ai c++ 框架包括 tensorflow、pytorch、caffe2、mxnet 和 theano。这些框架用于开发图像分类、自然语言处理和机器学习等应用程序。 C++ 框架在人工智能领域的应用 C++ 以其速度、效…

    2026年5月10日
    000
  • 人工智能助力 C 代码集成和 DevOps实践

    通过将人工智能 (ai) 集成到 c 代码集成和 devops 实践中,可以提高效率和质量:代码审查: ai 工具可以分析代码并识别潜在问题,评估质量指标,例如可读性、可维护性和安全风险。(实战案例:codescene)测试自动化: ai 算法可以生成测试用例并执行测试,提高测试覆盖率。(实战案例:…

    2026年5月10日
    000
  • 如何高效地在Go中使用http.ResponseWriter构建JSONP响应

    本教程探讨在go语言中高效构建jsonp响应的方法,重点解决如何使用`http.responsewriter`处理回调函数封装。文章通过对比传统字符串拼接与字节切片转换的不足,详细介绍了利用`fmt.fprintf`直接写入和`fmt.sprintf`预格式化两种优化方案,旨在提升代码的简洁性和执行…

    2026年5月10日
    000
  • Holoworld AI(HOLO)是什么币?怎么买?未来能涨到多少

    Holoworld AI(HOLO)是AI驱动虚拟社交平台的原生代币,用于生态内功能与激励。用户可通过中心化平台(如用USDT交易)或去中心化平台获取HOLO,需注意合约地址准确性与网络手续费。其市场表现受项目团队、技术进展、代币经济模型、市场环境及社区活跃度等多重因素影响,且所有数字资产交易均伴随…

    2026年5月10日
    200
  • 如何运用人工智能提升 C 代码可维护性?

    如何运用人工智能提升 C 代码可维护性 在 C 编程中,可维护性是至关重要的,它可以确保代码易于理解、修改和调试。人工智能 (AI) 可以成为提升 C 代码可维护性的强大工具。 1. 代码生成和重构 AI 可以用于生成新的代码或重构现有代码,使其更易于维护。例如,代码生成器可以根据指定规范自动生成代…

    2026年5月10日
    000
  • 使用C++实现机器学习算法:常见挑战及解决方案

    c++++ 中机器学习算法面临的常见挑战包括内存管理、多线程、性能优化和可维护性。解决方案包括使用智能指针、现代线程库、simd 指令和第三方库,并遵循代码风格指南和使用自动化工具。实践案例展示了如何利用 eigen 库实现线性回归算法,有效地管理内存和使用高性能矩阵操作。 C++ 机器学习算法:常…

    2026年5月10日
    000
  • Solana基金会主席 Lily 上海演讲:万物皆可代币化

    在 2025 年 10 月 23 日至 27 日举行的第 11 届全球区块链峰会期间,Solana 基金会主席 Lily Liu 在上海区块链国际周上发表了主题演讲,阐述了“万物皆可代币化”的愿景,并分享了 Solana 在全球金融基础设施建设方面的战略布局。 Solana 的愿景:万物皆可代币化 …

    2026年5月10日
    000
  • html搜索框如何跳转_实现HTML搜索框跳转搜索结果【结果】

    HTML搜索框跳转失败多因表单action或参数错误,可通过五种方法解决:一、百度用form提交至https://www.baidu.com/s?q=关键词;二、Google类似,action为https://www.google.com/search;三、JavaScript拼接必应URL并loc…

    2025年12月23日
    400
  • 从OpenAI API JSON响应中高效提取生成文本内容

    本教程详细指导开发者如何从openai api返回的json格式响应中准确提取生成的文本。通过利用`json.parse()`方法解析响应字符串,并访问`choices[0].text`属性,可以安全、高效地获取核心文本内容,从而避免直接字符串操作的潜在问题,确保api数据处理的健壮性。 OpenA…

    2025年12月23日
    500
  • HTML语义化未来趋势有哪些_HTML语义化在Web发展中的趋势与展望

    HTML语义化正朝着智能、高效、包容发展,深度融合结构化数据与ARIA属性,提升机器理解;2. 组件化趋势推动可复用语义结构普及,Web Components实现自定义语义标签;3. 语义化助力性能优化与可访问性,支持懒加载与内容优先级划分;4. AI工具将自动生成语义化代码并辅助检测,降低实践门槛…

    2025年12月23日
    300
  • 动态生成HTML表格:优化JavaScript数据展示与导出

    本文旨在解决JavaScript中动态生成HTML表格时遇到的代码冗余和样式控制难题。通过引入数据驱动的编程思想,我们将数据与视图逻辑分离,首先将表格内容组织为JavaScript对象数组,然后利用一个通用的函数将这些结构化数据渲染为可读性强、易于维护且支持灵活样式的HTML表格字符串。这种方法不仅…

    2025年12月23日
    000
  • HTML5性能优化怎么实现_HTML5新特性在性能优化方面的应用方法

    HTML5通过语义化标签、Web Storage、Canvas/SVG、Service Worker和原生媒体支持等技术提升性能:1. 语义化标签优化渲染效率;2. Web Storage减少网络请求;3. Canvas/SVG降低资源加载量;4. Service Worker实现离线缓存;5. 原…

    2025年12月23日
    100
  • 利用UTM参数与GTM优化链接点击来源追踪

    本文详细阐述了如何通过UTM参数精准追踪营销链接的点击来源,并深入探讨了Google Tag Manager (GTM) 在此过程中的高级应用。文章首先介绍了UTM参数的构成、生成方法及其在Google Analytics中的自动解析机制,强调其在识别流量来源方面的核心作用。随后,探讨了GTM如何通…

    2025年12月23日
    000
  • 如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

    使用HTML构建标签结构,CSS3添加旋转与过渡效果,JavaScript生成随机HSL颜色并设置字体大小,实现动态交互的标签云组件。 要在网页中实现一个动态的标签云组件,结合 HTML、CSS3 变换和随机颜色生成算法,可以按照以下步骤操作。这个组件不仅能提升页面视觉效果,还能通过色彩和旋转增加交…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信