实施稳健的AI治理以实现数据民主化

 

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

实施稳健的AI治理以实现数据民主化

gen%ignore_a_1%的出现加快了人们释放数据潜力的步伐,为获取新见解和更佳决策提供了机会。然而,要实现更广泛的数据访问,需要一种完善的数据治理策略。那些能够在数据民主化和严格数据治理之间取得平衡的企业,将通过释放独特的数据驱动洞察力而在市场上脱颖而出。

根据Gartner的数据,到2026年,超过80%的企业将使用GenAI API和模型,或在生产中部署启用GenAI的应用程序,而去年这一比例不到5%。GenAI的自然语言界面允许非技术用户,从部门负责人到一线工作人员,更轻松地访问和使用数据。这在获取信息和技能方面创造了公平的竞争环境,Gartner称这是“本十年最具颠覆性的趋势之一”。 

如果公司要避免隐私、安全和数据质量方面的风险增加,以这种方式实现数据民主化就会使强有力的治理变得更加关键,这意味着准确地知道你拥有什么数据、驻留在哪里、谁有权访问这些数据以及每种类型的用户被允许如何使用这些数据,但一个企业如何在不压制创新的情况下实施全面控制? 

在更高级别上,推崇的方法是将数据整合到一个综合的存储库中,这样不同团队和工作组就可以便捷、安全地共享这个存储库。通过统一数据,企业能够实现集中管理,并扩大对数据的访问范围,同时最大程度地减少复杂性并优化成本。这种集中存储数据的方法有助于确保数据的一致性和准确性,避免数据重复和不一致性带来的问题。此外,这也有助于提高数据的安全性和保护隐私,因为可以更容易地实施访问控制和监控措施。因此,建立一个统一的数据存储库对企业来说是非常重要的,

在实际操作中,这可能会带来一些挑战,因为数据主权法规要求某些数据必须存储在特定的国家或地区。面对这种情况,企业需要努力消除数据孤岛,并在其数据平台上实施一致的治理框架。

此外,一些特定的方法和技术有助于确保企业能够保持有效的治理,同时在GenAI扩大数据访问的同时保持安全。这些方法包括基本的治理实践,适用于各种环境,但随着GenAI推动数据访问进一步民主化,这些实践变得尤为关键。

针对隐私和法规遵从性的精细控制 

随着员工对数据的访问量增加,数据泄露和个人身份信息(PII)被未授权用户访问的风险也在增加。因此,实施严格的访问控制策略以及使用匿名化和身份识别技术对于确保合规性和防止数据被不当访问至关重要。

在我们分析雪花数据云趋势的新《数据趋势2024》报告中,我们注意到治理功能的使用显著增加,这些功能在提供对数据的精细控制的同时,还适当地将其提供给更多的用户,用于更多的用例,例如,在截至2024年1月31日的12个月中,应用的掩码或行访问策略的使用量与去年同期相比增加了98%,与此同时,分配了掩码策略的列数增长了97%。 

然而,值得注意的是,针对受策略保护的对象运行的查询总数上升了142%,这个数字意义重大,因为它表明良好的数据治理不是说“不”和限制数据使用。尽管看到越来越多的治理通过使用标签和屏蔽政策,但报告指出,使用这些数据所做的工作量正在迅速上升。 

在某些情况下,员工可能希望检查他们不能被授予直接访问权限的数据集,在这种情况下,差异隐私是一项强大的技术,因为它允许用户通过查看数据集内的模式来共享和探索数据集,而不会泄露任何个人用户的PII。更进一步,数据净化室允许多方在不向彼此披露原始数据的情况下就数据进行协作,数据净化室通常用于在不同企业之间共享数据,但我们正在看到内部使用的技术来满足日益增长的监管和隐私需求,它可以成为在GenAI界面环境中探索PII数据的有效技术。 

一致、协调的安全性 

安全应该构建在数据平台的结构中,而不是试图稍后为个别数据集和用户固定它,支持对话界面的技术不应该复制数据上的身份和其他核心权限,这将导致脆弱的设置。如果两个或多个系统都在跟踪谁可以访问哪些数据,则出错和未经授权访问的可能性会大大增加。 

在保护GenAI用例的数据方面发挥关键作用的技术包括持续的风险监控和保护、基于角色的访问控制(RBAC)和细粒度授权策略。基于角色的标记和基于标记的掩码策略允许你通过将掩码策略分配给标记,然后在一个或多个数据库对象上设置该标记,从而在列级别保护数据。 

小艺 小艺

华为公司推出的AI智能助手

小艺 549 查看详情 小艺

数据孤岛是良好治理的敌人 

将数据的副本或片段存储在不同的系统中,使得跟踪谁可以访问哪些信息以及保持访问和控制策略的一致性变得极其困难,这就是为什么数据孤岛是强大治理的敌人。 

数据孤岛还使得很难确保员工查询的是最新、最准确的数据,这可能会导致代价高昂的错误。为了通过GenAI实现对数据的广泛访问,企业需要一个单一的真实来源,以确保所有员工都在查看相同的信息,并且可以在所有数据中全面应用和更新控制和策略。 

确保数据质量以获得准确的结果 

即使你消除了孤岛并拥有适当的权限,也不能保证员工访问的信息是正确的,数据质量框架基于应用于表中特定列或一组列的可配置数据质量规则,可以帮助检测质量问题并确保准确的信息。 

此外,到目前为止,我们都知道,GenAI有时会产生幻觉,并产生实际上没有根据的答案,这对于企业使用来说是不可接受的。企业可以通过将大型语言模型(LLM)与他们知道值得信任的数据源相结合来解决这一问题,例如内部客户数据库或来自可信第三方提供商的经过审查的数据集。 

这些受信任的数据源可以使用需要LLM定制(如微调)或不需要LLM定制(如即时工程或检索增强生成(RAG))的过程合并。无论是哪种情况,这些技术都有助于确保员工收到准确、高质量的结果,同时遵守内部云环境中内置的治理标准。 

数据访问和通用搜索的威力 

GenAI治理的一个重要方面是让员工很容易找到合适的数据集和数据产品来帮助他们进行分析,人工智能如此强大的一个原因是,它允许员工在不通过中央团队的情况下与数据交互,但这需要这些员工知道他们可以获得什么数据,以及如何找到这些数据。 

搜索功能提供了这一功能,允许用户查找和查询数据集和数据产品,这一搜索功能本身可以由LLM提供支持,使数据搜索更加直观-这是我们在Snowflake开发的,作为我们通用搜索的一部分。 

治理是数据民主化的基础 

商业用户渴望更广泛地利用他们组织的数据,而GenAI最终使这成为可能。多亏了LLMS和自然语言处理,财务、人力资源、销售和运营等领域的员工现在可以针对自己的角色制定问题,并获得他们做出更明智决策所需的答案。 

但要满足企业的安全和法规遵从性需求,这只能在具有强大治理的环境中发生,治理越强,你的员工就越能自由地浏览数据,而不会给公司带来额外的风险,GenAI为真正的数据民主化打开了大门,而良好的治理是使之成为可能的基础。

以上就是实施稳健的AI治理以实现数据民主化的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/798620.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月26日 16:56:28
下一篇 2025年11月26日 16:58:20

相关推荐

  • 怎样用免费工具美化PPT_免费美化PPT的实用方法分享

    利用KIMI智能助手可免费将PPT美化为科技感风格,但需核对文字准确性;2. 天工AI擅长优化内容结构,提升逻辑性,适合高质量内容需求;3. SlidesAI支持语音输入与自动排版,操作便捷,利于紧急场景;4. Prezo提供多种模板,自动生成图文并茂幻灯片,适合学生与初创团队。 如果您有一份内容完…

    2025年12月6日 软件教程
    000
  • Pages怎么协作编辑同一文档 Pages多人实时协作的流程

    首先启用Pages共享功能,点击右上角共享按钮并选择“添加协作者”,设置为可编辑并生成链接;接着复制链接通过邮件或社交软件发送给成员,确保其使用Apple ID登录iCloud后即可加入编辑;也可直接在共享菜单中输入邮箱地址定向邀请,设定编辑权限后发送;最后在共享面板中管理协作者权限,查看实时在线状…

    2025年12月6日 软件教程
    100
  • REDMI K90系列正式发布,售价2599元起!

    10月23日,redmi k90系列正式亮相,推出redmi k90与redmi k90 pro max两款新机。其中,redmi k90搭载骁龙8至尊版处理器、7100mah大电池及100w有线快充等多项旗舰配置,起售价为2599元,官方称其为k系列迄今为止最完整的标准版本。 图源:REDMI红米…

    2025年12月6日 行业动态
    200
  • Linux中如何安装Nginx服务_Linux安装Nginx服务的完整指南

    首先更新系统软件包,然后通过对应包管理器安装Nginx,启动并启用服务,开放防火墙端口,最后验证欢迎页显示以确认安装成功。 在Linux系统中安装Nginx服务是搭建Web服务器的第一步。Nginx以高性能、低资源消耗和良好的并发处理能力著称,广泛用于静态内容服务、反向代理和负载均衡。以下是在主流L…

    2025年12月6日 运维
    000
  • Linux journalctl与systemctl status结合分析

    先看 systemctl status 确认服务状态,再用 journalctl 查看详细日志。例如 nginx 启动失败时,systemctl status 显示 Active: failed,journalctl -u nginx 发现端口 80 被占用,结合两者可快速定位问题根源。 在 Lin…

    2025年12月6日 运维
    100
  • 华为新机发布计划曝光:Pura 90系列或明年4月登场

    近日,有数码博主透露了华为2025年至2026年的新品规划,其中pura 90系列预计在2026年4月发布,有望成为华为新一代影像旗舰。根据路线图,华为将在2025年底至2026年陆续推出mate 80系列、折叠屏新机mate x7系列以及nova 15系列,而pura 90系列则将成为2026年上…

    2025年12月6日 行业动态
    100
  • Linux如何优化系统性能_Linux系统性能优化的实用方法

    优化Linux性能需先监控资源使用,通过top、vmstat等命令分析负载,再调整内核参数如TCP优化与内存交换,结合关闭无用服务、选用合适文件系统与I/O调度器,持续按需调优以提升系统效率。 Linux系统性能优化的核心在于合理配置资源、监控系统状态并及时调整瓶颈环节。通过一系列实用手段,可以显著…

    2025年12月6日 运维
    000
  • 助力工业转型升级金士顿工博会大放异彩

    在刚刚落幕的第二十五届中国国际工业博览会(简称“工博会”)上,参会嘉宾或满载而归,或回味无穷,但无一例外地达成了一项共识——人工智能正深度赋能新型工业化,中国制造业正从“制造”迈向“智造”,并在转型升级之路上取得了令人瞩目的成就。 工业变革的核心在于技术架构的重塑与关键技术的支撑。当现代工业逐步演进…

    2025年12月6日 行业动态
    000
  • 曝小米17 Air正在筹备 超薄机身+2亿像素+eSIM技术?

    近日,手机行业再度掀起超薄机型热潮,三星与苹果已相继推出s25 edge与iphone air等轻薄旗舰,引发市场高度关注。在此趋势下,多家国产厂商被曝正积极布局相关技术,加速抢占这一细分赛道。据业内人士消息,小米的超薄旗舰机型小米17 air已进入筹备阶段。 小米17 Pro 爆料显示,小米正在评…

    2025年12月6日 行业动态
    000
  • 荣耀手表5Pro 10月23日正式开启首销国补优惠价1359.2元起售

    荣耀手表5pro自9月25日开启全渠道预售以来,市场热度持续攀升,上市初期便迎来抢购热潮,一度出现全线售罄、供不应求的局面。10月23日,荣耀手表5pro正式迎来首销,提供蓝牙版与esim版两种选择。其中,蓝牙版本的攀登者(橙色)、开拓者(黑色)和远航者(灰色)首销期间享受国补优惠价,到手价为135…

    2025年12月6日 行业动态
    000
  • 淘宝优惠活动显示错误怎么办 淘宝活动信息刷新与优化方法

    多数淘宝优惠显示错误由技术或网络问题导致,刷新页面、重启App、切换网络、更新应用可解决;检查账号资格与商品参与条件,清除缓存、重新登录或换设备核对,确认活动规则与系统公告即可恢复正常。 淘宝优惠活动显示错误,多数情况是临时性技术或网络问题,也可能是账户或商品本身的限制。直接刷新页面或重启App通常…

    2025年12月6日 软件教程
    000
  • 环境搭建docker环境下如何快速部署mysql集群

    使用Docker Compose部署MySQL主从集群,通过配置文件设置server-id和binlog,编写docker-compose.yml定义主从服务并组网,启动后创建复制用户并配置主从连接,最后验证数据同步是否正常。 在Docker环境下快速部署MySQL集群,关键在于合理使用Docker…

    2025年12月6日 数据库
    000
  • Xbox删忍龙美女角色 斯宾塞致敬板垣伴信被喷太虚伪

    近日,海外游戏推主@HaileyEira公开发表言论,批评Xbox负责人菲尔·斯宾塞不配向已故的《死或生》与《忍者龙剑传》系列之父板垣伴信致敬。她指出,Xbox并未真正尊重这位传奇制作人的创作遗产,反而在宣传相关作品时对内容进行了审查和删减。 所涉游戏为年初推出的《忍者龙剑传2:黑之章》,该作采用虚…

    2025年12月6日 游戏教程
    000
  • 如何在mysql中分析索引未命中问题

    答案是通过EXPLAIN分析执行计划,检查索引使用情况,优化WHERE条件写法,避免索引失效,结合慢查询日志定位问题SQL,并根据查询模式合理设计索引。 当 MySQL 查询性能下降,很可能是索引未命中导致的。要分析这类问题,核心是理解查询执行计划、检查索引设计是否合理,并结合实际数据访问模式进行优…

    2025年12月6日 数据库
    000
  • VSCode入门:基础配置与插件推荐

    刚用VSCode,别急着装一堆东西。先把基础设好,再按需求加插件,效率高还不卡。核心就三步:界面顺手、主题舒服、功能够用。 设置中文和常用界面 打开软件,左边活动栏有五个图标,点最下面那个“扩展”。搜索“Chinese”,装上官方出的“Chinese (Simplified) Language Pa…

    2025年12月6日 开发工具
    000
  • php查询代码怎么写_php数据库查询语句编写技巧与实例

    在PHP中进行数据库查询,最常用的方式是使用MySQLi或PDO扩展连接MySQL数据库。下面介绍基本的查询代码写法、编写技巧以及实用示例,帮助你高效安全地操作数据库。 1. 使用MySQLi进行查询(面向对象方式) 这是较为推荐的方式,适合大多数中小型项目。 // 创建连接$host = ‘loc…

    2025年12月6日 后端开发
    000
  • 重现iPhone X颠覆性时刻!苹果2027年跳过19命名iPhone 20

    10月23日,有消息称,苹果或将再次调整iPhone的发布节奏,考虑跳过“iPhone 19”,并于2027年直接推出“iPhone 20”系列。 此举据传是为了庆祝初代iPhone发布二十周年,同时开启新一轮的设计革新,目标是复刻2017年iPhone X带来的划时代变革。 据悉,苹果或将告别长期…

    2025年12月6日 手机教程
    000
  • 如何在mysql中使用索引提高查询效率

    合理创建索引可显著提升MySQL查询效率,应优先为WHERE、JOIN、ORDER BY等高频字段建立B-Tree复合索引,如CREATE INDEX idx_status_created ON users(status, created_at, id),并遵循最左前缀原则;避免在索引列使用函数或前…

    2025年12月6日 数据库
    000
  • Linux命令行中free命令的使用方法

    free命令用于查看Linux内存使用情况,包括总内存、已用、空闲、共享、缓存及可用内存;使用-h可读格式显示,-s周期刷新,-c限制次数,-t显示总计,帮助快速评估系统内存状态。 free命令用于显示Linux系统中内存和交换空间的使用情况,包括物理内存、已用内存、空闲内存以及缓存和缓冲区的占用情…

    2025年12月6日 运维
    000
  • 在 Java 中使用 Argparse4j 接收 Duration 类型参数

    本文介绍了如何使用 `net.sourceforge.argparse4j` 库在 Java 命令行程序中接收 `java.time.Duration` 类型的参数。由于 `Duration` 不是原始数据类型,需要通过自定义类型转换器或工厂方法来处理。文章提供了两种实现方案,分别基于 `value…

    2025年12月6日 java
    000

发表回复

登录后才能评论
关注微信