ChatGPT应用爆火，安全的大数据底座何处寻？

程序猿 • 2025年11月9日 17:38:57 • 用户投稿 • 阅读 1

毫无疑问，AIGC正在给人类社会带来一场深刻的变革。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

而剥开其令人眼花缭乱的华丽外表，运行的核心离不开海量的数据支持。

ChatGPT的“入侵”已经引起了各行各业对内容抄袭的担忧，以及网络数据安全意识的提高。

虽然AI技术是中立的，但并不能成为规避责任与义务的理由。

最近，英国情报机构——英国政府通讯总部（GCHQ）警告称，ChatGPT和其他人工智能聊天机器人将是一个新的安全威胁。

尽管ChatGPT的概念出现没有多久，但对网络安全和数据安全带来威胁的问题已经成为业内关注的焦点。

对于目前还处于发展初期的ChatGPT，如此担忧是否杞人忧天？

安全威胁或正在发生

去年年底，初创公司OpenAI推出ChatGPT，之后，其投资商微软于今年推出了基于ChatGPT技术开发的聊天机器人“必应聊天（Bing Chat）”。

由于此类软件能够提供酷似人类的对话，目前这项服务已风靡全球。

GCHQ的网络安全部门指出，提供AI聊天机器人的公司可以看到用户输入的查询内容，就ChatGPT而言，其开发商OpenAI就能够看到这些。

ChatGPT通过大量文本语料库进行训练，其深度学习能力很大程度上依赖于背后的数据。

出于对信息泄露的担忧，目前已有多家公司和机构发布“ChatGPT禁令”。

伦敦金融城律师事务所Mishcon de Reya禁止其律师将客户数据输入ChatGPT，因为担心在法律上享有隐私特权的资料可能会遭泄露。

国际咨询公司埃森哲警告其全球70万名员工，出于类似的原因，不要使用ChatGPT，因为担心客户的机密数据最终会落入他人之手。

英国电脑芯片公司Arm的母公司日本软银集团同样警告其员工，不要向人工智能聊天机器人输入公司人员的身份信息或机密数据。

今年2月，摩根大通成为第一家在工作场所限制使用ChatGPT的华尔街投行。

花旗集团和高盛集团紧随其后，前者禁止员工在整个公司范围内访问ChatGPT，后者则限制员工在交易大厅使用该产品。

而在更早些时候，亚马逊和微软为防备员工在使用ChatGPT的过程中泄密，禁止他们向其分享敏感数据，因为这些信息可能会被用作进一步迭代的训练数据。

事实上，这些人工智能聊天机器人背后是大型语言模型（LLM），用户的这些查询内容将会被存储起来，并且会在未来某个时候被用于开发LLM服务或模型。

这就意味着，LLM提供商能够读取到相关查询，并可能以某种方式将它们合并到未来的版本中。

尽管LLM运营商应该采取措施保护数据，但不能完全排除未经授权访问的可能性。因此，企业需要确保他们有严格的政策，提供技术性支持，来监控LLM的使用，以最大限度地降低数据暴露的风险。

另外，尽管ChatGPT本身尚不具备直接攻击网络安全和数据安全的能力，但是由于它具有自然语言生成和理解的能力，可以被用于伪造虚假信息、攻击社交工程等方面。

此外，攻击者还可以使用自然语言来让ChatGPT生成相应的攻击代码、恶意软件代码、垃圾邮件等。

因此，AI可以让那些原本没有能力发起攻击的人基于AI生成攻击，并大大提高攻击成功率。

在自动化、AI、“攻击即服务”等技术和模式加持下，网络安全攻击呈现出暴涨趋势。

在ChatGPT火爆之前，已发生了多次黑客使用AI技术进行的网络攻击。

事实上，人工智能被用户调教“带偏节奏”的案例并不鲜见，6年前，微软推出智能聊天机器人Tay，上线时，Tay表现得彬彬有礼，但不到24小时，其就被不良用户“带坏”，出言不逊、脏话不断，言语甚至涉及种族主义、色情、纳粹，充满歧视、仇恨和偏见，只好被下线结束了短暂的生命。

另一方面，距离用户更近的风险是，用户在使用ChatGPT等AI工具时，可能会不经意间将私密数据输入到云端模型，这些数据可能成为训练数据，也可能成为提供给他人答案的一部分，从而导致数据泄露和合规风险。

AI应用要打好安全底座

ChatGPT作为大语言模型，其核心逻辑事实上是海量数据的收集、加工、处理和运算结果的输出。

总的来说，这几个环节可能会在技术要素、组织管理、数字内容三个方面伴生相关风险。

虽然ChatGPT表示，存储训练和运行模型所需的数据会严格遵守隐私和安全政策，但在未来可能出现网络攻击和数据爬取等现象，仍存在不可忽视的数据安全隐患。

特别是涉及国家核心数据、地方和行业重要数据以及个人隐私数据的抓取、处理以及合成使用等过程，需平衡数据安全保护与流动共享。

除了数据与隐私泄露隐患外，AI技术还存在着数据偏见、虚假信息、模型的难解释性等问题，可能会导致误解和不信任。

风口已至，AIGC浪潮奔涌而来，在前景向好的大背景下，关口前移，建立数据安全防护墙也至关重要。

尤其是当AI技术逐渐完善，它既能成为生产力进步的有力抓手，又易沦为黑产犯罪的工具。

奇安信威胁情报中心监测数据显示，2022年1月份-10月份，超过950亿条的中国境内机构数据在海外被非法交易，其中有570多亿条是个人信息。

因此，如何确保数据存储、计算、流通过程中的安全问题，是数字经济发展的大前提。

从整体看，应该坚持顶层设计与产业发展齐头并进，在《网络安全法》的基础上，要细化风险与责任分析体系，确立安全问责机制。

同时，监管部门可开展常态化监查工作，安全领域企业协同发力，构建全流程数据安全保障体系。

对于数据合规和数据安全的问题，特别是在《数据安全法》推出后，数据隐私越来越重要。

如果在应用AI技术的过程中无法保证数据安全和合规，可能会给企业造成很大风险。

特别是中小企业对数据隐私安全方面的知识比较匮乏，不知道应当如何保护数据不会受到安全威胁。

数据安全合规并不是某个部门的事情，而是整个企业最为重要的事情。

企业要对员工进行培训，让他们意识到每个使用数据的人，都有义务保护数据，包括IT人员、AI部门、数据工程师、开发人员、使用报表的人等，人和技术要结合在一起。

面对前述潜藏风险，监管方和相关企业如何从制度和技术层面加强AIGC领域的数据安全保护？

相较于直接针对用户终端采取限制使用等监管措施，明确要求AI技术研发企业遵循科技伦理原则会更具成效，因为这些企业能够在技术层面限定用户的使用范围。

在制度层面，需要结合AIGC底层技术所需数据的特性和作用，建立健全数据分类分级保护制度。

例如，可根据数据主体、数据处理程度、数据权利属性等方面对训练数据集中的数据进行分类管理，根据数据对于数据权利主体的价值，以及数据一旦遭到篡改、破坏等对数据主体的危害程度进行分级。

在数据分类分级的基础上，建立与数据类型和安全级别相配套的数据保护标准与共享机制。

目光投向企业，还需加快推动“隐私计算”技术在AIGC领域的应用。

这类技术能够让多个数据拥有者在不暴露数据本身的前提下，通过共享SDK或者开放SDK权限的方式，在进行数据的共享、互通、计算、建模，在确保AIGC能够正常提供服务的同时，保证数据不泄露给其他参与方。

此外，全流程合规管理的重要性愈加凸显。

企业首先应关注其所运用的数据资源是否符合法律法规要求，其次要确保算法和模型运作的全流程合规，企业的创新研发还应最大限度地满足社会公众的伦理期待。

同时，企业应制定内部管理规范，设立相关的监督部门，对AI技术应用场景的各个环节进行数据监督，确保数据来源合法、处理合法、输出合法，从而保障自身的合规性。

AI应用的关键在于部署方式与成本间的考量，但必须注意的是，如果没有做好安全合规、隐私保护，对企业来说或将蕴含“更大风险点”。

AI是把双刃剑，用得好让企业如虎添翼；用不好疏忽了安全、隐私和合规，会给企业带来更大损失。

因此，在AI应用前，需要构筑更加稳固的“数据底座”，正所谓，行稳方能致远。

以上就是ChatGPT应用爆火，安全的大数据底座何处寻？的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/546001.html

chatgpt 人工智能大数据

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

一文读懂：如何快速实现u盘启动系统设置操作指南

上一篇 2025年11月9日 17:38:54

调试困难？spiral/dumper助你轻松掌握PHP变量状态

下一篇 2025年11月9日 17:39:00

好文分享

如何用html5_使用HTML5新特性开发网页应用【应用】

需掌握HTML5五大核心特性：一、语义化标签（如header、main、article）提升结构与可访问性；二、Canvas API实现动态绘图与动画；三、localStorage进行客户端持久化存储；四、Geolocation API获取用户地理位置；五、Web Workers执行后台线程任务。 …

程序猿
2025年12月23日
0000
好文分享

html搜索框如何跳转_实现HTML搜索框跳转搜索结果【结果】

HTML搜索框跳转失败多因表单action或参数错误，可通过五种方法解决：一、百度用form提交至https://www.baidu.com/s?q=关键词；二、Google类似，action为https://www.google.com/search；三、JavaScript拼接必应URL并loc…

程序猿
2025年12月23日
2000
好文分享

从OpenAI API JSON响应中高效提取生成文本内容

本教程详细指导开发者如何从openai api返回的json格式响应中准确提取生成的文本。通过利用`json.parse()`方法解析响应字符串，并访问`choices[0].text`属性，可以安全、高效地获取核心文本内容，从而避免直接字符串操作的潜在问题，确保api数据处理的健壮性。 OpenA…

程序猿
2025年12月23日
1000
好文分享

构建可持久化任务列表：JavaScript前端实现与常见问题解析

本教程旨在指导开发者如何使用纯JavaScript实现一个基本的待办事项（To-Do List）应用，并解决任务持久化存储问题。文章将详细阐述任务添加逻辑、前端输入框的实时显示机制，以及利用浏览器`localStorage`实现数据保存与加载的方法，同时提供优化建议，确保用户体验和数据完整性。理解…

程序猿
2025年12月23日
0000
好文分享

ai做html怎么运行_AI生成html运行步骤【教程】

答案是使用AI生成HTML代码后，将其保存为.html文件并用浏览器打开即可运行。具体步骤为：1. 在AI工具中输入需求生成HTML代码；2. 将代码复制到文本编辑器并另存为index.html，编码选UTF-8，类型选“所有文件”；3. 双击该文件用浏览器打开，若无法正常显示需检查文件后缀、编码及…

程序猿
2025年12月23日
0000
好文分享

HTML5WebWorkers怎么用_HTML5WebWorkers后台线程的使用方法与实例

Web Workers是HTML5的多线程机制，通过创建后台线程执行耗时任务，避免阻塞UI线程。1. 创建worker.js文件，编写耗时计算逻辑并监听消息；2. 主页面使用new Worker()加载Worker，通过postMessage发送数据，onmessage接收结果，实现主线程与Work…

程序猿
2025年12月23日
0000
好文分享

HTML语义化未来趋势有哪些_HTML语义化在Web发展中的趋势与展望

HTML语义化正朝着智能、高效、包容发展，深度融合结构化数据与ARIA属性，提升机器理解；2. 组件化趋势推动可复用语义结构普及，Web Components实现自定义语义标签；3. 语义化助力性能优化与可访问性，支持懒加载与内容优先级划分；4. AI工具将自动生成语义化代码并辅助检测，降低实践门槛…

程序猿
2025年12月23日
0000
好文分享

Angular应用中动态管理响应式背景图片：从TypeScript到CSS

本教程旨在解决在Angular应用中从TypeScript动态设置CSS背景图片URL的需求。由于CSS文件无法直接引用TypeScript变量，文章将详细介绍如何利用Angular的属性绑定机制，特别是`[ngStyle]`或`[style.background-image]`，将动态图片路径应用…

程序猿
2025年12月23日
0000
好文分享

HTML表单数据怎么传递_HTML表单数据通过getpost传递的原理与区别

答案：GET通过URL传递数据，适合非敏感、小量信息；POST将数据放在请求体中，更安全且支持大数据量和文件上传。 HTML表单数据通过 GET 和 POST 两种方式传递，它们在工作原理、数据传输方式和使用场景上有明显区别。理解这些差异有助于正确选择适合的提交方式。 GET 方法传递数据的原理当…

程序猿
2025年12月23日
0000
好文分享

html5使用web workers运行复杂算法 html5将耗时任务移至后台的实践

Web Workers是HTML5的多线程API，允许JavaScript在后台线程执行耗时任务，避免阻塞主线程。通过new Worker()创建子线程，利用postMessage和onmessage实现主线程与Worker间通信，适用于大数据处理、加密、图像分析等场景。Worker不能操作DOM或…

程序猿
2025年12月23日
0000
好文分享

使用 jQuery 实现表格内容分段显示

本文介绍了如何使用 jQuery 实现表格内容的分段显示效果，即先显示表格的一部分内容，然后逐渐显示剩余部分。通过 `fadeIn()` 和 `fadeOut()` 方法，结合 `setInterval()` 或 `setTimeout()` 函数，可以轻松实现这种动态展示效果，提升用户体验。文章提…

程序猿
2025年12月23日
0000
好文分享

Mac nginx反向代理，CSS加载快到让你尖叫！

Nginx通过启用Gzip压缩、配置静态缓存、开启sendfile及调整worker进程数显著提升CSS等静态资源加载速度，具体包括：1. 启用Gzip并设置压缩级别；2. 为CSS文件设置1年过期时间；3. 开启sendfile和tcp_nopush；4. 根据CPU核心数设置worker_pro…

程序猿
2025年12月23日
0000
好文分享

HTML5代码如何管理客户端存储 HTML5代码中IndexedDB的增删改查

IndexedDB通过增删改查操作实现浏览器端大量结构化数据存储。首先打开数据库并创建对象仓库；接着使用事务添加数据；然后可按主键查询或遍历所有数据；支持获取记录后更新字段；还能根据主键删除指定数据，适用于离线应用与大数据处理场景。 HTML5 提供了多种客户端存储方式，其中 IndexedDB 是…

程序猿
2025年12月23日
0000
好文分享

前台html如何显示_前端HTML页面显示与渲染优化方法

优化前端HTML渲染需缩短关键渲染路径，内联核心CSS、移除冗余代码、延迟非关键JS；预加载重要资源；简化DOM结构；压缩合并文件；使用高效CSS选择器；懒加载非首屏内容。如果您在开发前端页面时发现HTML内容显示缓慢或渲染效果不理想，可能是由于资源加载顺序、DOM结构复杂或CSS阻塞等问题导致。…

程序猿
2025年12月23日
1000
好文分享

怎么使用HTML在线分页组件_HTML在线分页组件使用方法与数据分页方案

答案：使用HTML在线分页需结合前端结构与后端数据控制，通过基础HTML构建分页按钮，CSS美化样式，JavaScript实现前端动态分页，或以后端接口支持大数据分页，配合现成组件库提升效率。使用HTML在线分页组件，核心在于结合前端结构与后端数据控制，实现用户友好、高效加载的分页功能。虽然HTM…

程序猿
2025年12月23日
1000
好文分享

JavaScript实现API数据搜索与动态表格展示

本教程旨在指导如何使用javascript从api获取数据，并在网页表格中动态展示。核心内容包括数据全局存储、利用`array.prototype.filter()`方法实现高效的数据搜索功能，并根据用户输入实时更新表格内容，同时强调代码结构优化和大小写不敏感的搜索实现。在现代前端应用中，从API…

程序猿
2025年12月23日
0000
好文分享

HTML5代码如何创建Web Worker HTML5代码多线程编程的实践方案

Web Worker 是 HTML5 提供的一种让 JavaScript 在后台线程中运行的机制，避免耗时操作阻塞页面渲染。通过 Web Worker，可以实现多线程编程，提升网页性能。创建 Web Worker 的基本步骤要使用 Web Worker，需将需要在后台执行的代码放入一个独立的 J…

程序猿
2025年12月23日
0000
好文分享

HTML数据如何实现数据智能 HTML数据智能分析的技术架构

实现HTML数据智能分析需构建包含采集、解析、存储、分析与可视化的闭环系统，首先通过爬虫技术获取网页数据并进行清洗标准化，接着利用DOM树分析与NLP技术提取结构化信息，随后将数据存入合适数据库或数据仓库并建立元数据管理机制，进而应用AI模型开展分类、情感分析、趋势预测与知识图谱构建等智能分析，最终…

程序猿
2025年12月23日
0000
好文分享

html5使用web workers进行多线程计算 html5使用后台任务优化性能

Web Workers是HTML5的多线程机制，可在后台线程运行JS代码，通过postMessage通信，避免阻塞主线程，适用于复杂计算等任务。 HTML5 的 Web Workers 允许在后台线程中运行 JavaScript 代码，避免阻塞主线程，从而提升页面响应速度和整体性能。尤其适用于执行复…

程序猿
2025年12月23日
0000
好文分享

HTML数据如何构建数据集 HTML数据标注与整理的完整流程

答案是构建HTML数据集需经历采集、解析、清洗、标注和整合五步。首先明确目标并用requests或selenium采集HTML；接着用BeautifulSoup或Selenium解析提取结构化数据；然后清洗噪声、统一格式、去重处理；若用于机器学习，需定义标签体系并进行手动或半自动标注；最后导出为CS…

程序猿
2025年12月23日
0000

发表回复

登录后才能评论

ChatGPT应用爆火，安全的大数据底座何处寻？

安全威胁或正在发生

AI应用要打好安全底座

关于作者

相关推荐

发表回复