如何克服安全障碍去解锁医疗数据

医疗保健行业是数据最丰富的行业之一,但由于严格的隐私和安全法律,数据科学家无法利用这些数据做太多事情。但现在,由于云计算中强大的安全设置和隐私保护分析技术的使用,Providence健康公司开始解开数据科学家的“手铐”,并在大医疗数据上展开创新。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如何克服安全障碍去解锁医疗数据

Providence健康与服务公司拥有52家医院、1000多家诊所和约12万名员工,是美国最大的医疗保健集团之一。与大多数医疗保健公司一样,Providence健康公司采取措施维护患者数据的完整性。毕竟,没有人想要违反HIPAA(Health Insurance Portability and Accountability Act 健康保险携带和责任法案/医疗电子交换法案),每违反一次就要罚款5万美元。

在这家总部位于华盛顿伦顿(Renton)的公司着手更新其数据分析架构时,安全问题是他们最关心的问题,首先是将老旧的SQL Server数据仓库迁移到微软Azure云上。Providence的数据科学总监林赛·米科表示,该公司在2019年底与Databricks和其他公司合作建立新的数据环境时,采取了额外的预防措施,以确保对数据保持严格的控制。

“Providence为安全云设置了一个独特的高标准,”米科说。“与我合作的每一家科技公司….认为这就是安全云的样子。然后他们开始与我们合作,他们很快就会对标准的设定产生疑虑。我们与微软和Databricks携手合作,打造新的部署架构,我们需要一些与公共互联网隔绝的东西能够妥善保护患者数据。”

Snowflake也参与了Providence新的基于云的数据架构。最初的项目是将老化的SQL Server仓库迁移到Snowflake数据仓库中,后者将为分析业务和临床数据提供一个更可伸缩的系统。Providence足够大,可以容纳多个数据仓库中的用户,因此Databricks和Snowflake环境是独立存在的。

成本控制是Providence新云仓库的一个重要目标,该云仓库用于传统分析以及构建和运行机器学习模型。作为一家非营利性天主教医院,Providence的使命是帮助穷人和有需要的人,它有责任提供负担得起的医疗服务,而分析可以在这方面提供帮助。

“我们还知道,医疗保健存在成本泡沫。病人的费用一直在上涨。医疗保健系统的利润极其微薄。这是双输,”他说。“因此,找到利用数据和分析控制成本的方法——这是整个医疗保健体系的存在价值。”

一些最初的用例涉及到使用机器学习模型来预测患者需求,包括像发病率和住院时间等。这些预测被输入到一个人员配置模型中,该模型告诉Providence,在接下来的两个月里,服务人员需求可能会是什么样子。

云端的无限弹性是公司之前使用的一个重大升级。虽然数据仓库迁移在COVID-19大流行之前就开始了,但米科和他的团队在大流行期间完成了大部分工作。这家医疗保健公司利用了Epic Systems公司的电子病历(EMR)软件自带的几个开箱即用的机器学习模型,这些模型运行良好。作为Epic最大的用户,机器学习模型的成功对Epic的研发团队来说是个好兆头。

同时它加速了下一代系统的部署,包括远程医疗。“我们已经准备好了。我们有一个非常强大的基础设施来处理远程医疗。能够向远程医疗转移大量的数据。它还推动了预测分析的发展。围绕死亡风险、ICU住院时间和大流行早期的一些其他模型部署了一些模型。这些都是内置在Epic中的应用。这只是漫长旅程的第一步。人工智能在改善临床护理方面有更多的机会。”米科说。

例如,该公司正在对源自Epic的健康级别7 (HL7)医疗文件进行实时分析。使用Spark Streaming处理这些数据,然后将其实时加载到Databricks仓库的表单中。

他说:“这项工作一开始是为了建立我们所说的任务控制中心,它可以实时查看医院的情况。”

任务控制中心的早期用例之一是获得对单个医院资源的可见性,以确定它是否能够处理传入的病人。这是有助于防止医院人满为患的有用工具,在COVID-19疫情高峰期,医院人满为患是一个非常现实的威胁。

利用分析和人工智能改善业务和临床运营,他说:“这是一个很好的起点,一旦你对医疗保健系统正在发生的事情有了实时的了解——谁在那里,你需要什么,并与他们的图表联系起来——你就可以开始预测接下来会发生什么。你可以开始优化关于临床护理或手术的决策。所以我对任务控制非常感兴趣。”

该公司正在考虑利用一些更强大的人工智能技术,包括深度学习,以进一步优化其运营和改善医疗服务。具体来说,它正在与John Snow实验室及其Spark NLP模型合作,以便能够从医生的病历中提取有意义的数据。​​

在处理这种级别的敏感数据时,安全性和隐私性是最重要的,因此Spark NLP的首要任务是去识别关于患者的医生记录。这家医疗保健公司正在使用来自John Snow实验室的经过预先训练的模型,该模型可以识别日期、姓名、地址和邮政编码等标识符。

Providence旗下的技术和服务公司Tegria的高级数据科学家纳达·泰亚布(Nadaa Taiyab)说,“它的工作效果令人惊讶地好。”

在标记标识符之后,Providence用虚拟数据替换数据,从而消除了私人健康信息(PHI)的风险。这一过程使Providence能够使用聚合的医疗数据进行高级分析和训练机器学习模型。

Taiyab说,虽然混淆步骤降低了PHI落入错误之手的风险,但有时需要真实的患者数据,特别是在使用机器学习模型时。“如果你把它聚合起来,就不能把它用于机器学习,如果你试图在病人的水平上预测一些东西。”“如果你想在群体水平上预测它,这是一回事。但你需要有患者级别的数据”来进行患者级别的预测。

Providence还可以通过系统生物学研究所(ISB),将其患者数据用于进一步的医学研究。ISB是一家位于华盛顿州西雅图的医学分析公司,由人类基因组计划的研究人员之一Leroy Hood博士创建。Providence所做的数据安全工作使其能够与2016年收购的ISB共享数据。

米科表示,ISB挖掘Providence的大型医疗数据仓库的能力对ISB对健康状况的研究非常重要,例如长期COVID-19。“这只是一个例子,说明当你能够在安全的云环境中部署和集成数据时意味着什么。”他说。

随着Providence探索使用高级分析和人工智能的其他方法来改善其医疗保健使命,对构建安全云数据架构的投资有望获得回报。

“Providence已经为医疗保健的安全云设计了一幅蓝图,”米科说。“这需要大量的反复练习,大量的学习,与我们的合作伙伴进行大量的合作。在每一步都在改进它。当我们学习新东西时,部署模型会发生变化。但我们认为有一个非常可靠的蓝图。”获取数据仍然是这方面取得进展的主要障碍之一。Providence为降低安全和隐私风险所做的工作是良好的第一步,但还有更多的工作要做。​

以上就是如何克服安全障碍去解锁医疗数据的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/569788.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月10日 05:30:10
下一篇 2025年11月10日 05:32:00

相关推荐

  • html搜索框如何跳转_实现HTML搜索框跳转搜索结果【结果】

    HTML搜索框跳转失败多因表单action或参数错误,可通过五种方法解决:一、百度用form提交至https://www.baidu.com/s?q=关键词;二、Google类似,action为https://www.google.com/search;三、JavaScript拼接必应URL并loc…

    2025年12月23日
    200
  • 从OpenAI API JSON响应中高效提取生成文本内容

    本教程详细指导开发者如何从openai api返回的json格式响应中准确提取生成的文本。通过利用`json.parse()`方法解析响应字符串,并访问`choices[0].text`属性,可以安全、高效地获取核心文本内容,从而避免直接字符串操作的潜在问题,确保api数据处理的健壮性。 OpenA…

    2025年12月23日
    000
  • HTML如何防范入侵攻击_前端安全防护策略【解析】

    HTML安全防护需五方面协同:一、用户输入严格转义与过滤,用DOMPurify净化富文本、JSON.parse替代eval、模板引擎启用自动转义;二、设置CSP白名单响应头,禁用unsafe-inline/eval,启用report-uri;三、补充X-XSS-Protection和X-Conten…

    2025年12月23日
    000
  • HTML语义化未来趋势有哪些_HTML语义化在Web发展中的趋势与展望

    HTML语义化正朝着智能、高效、包容发展,深度融合结构化数据与ARIA属性,提升机器理解;2. 组件化趋势推动可复用语义结构普及,Web Components实现自定义语义标签;3. 语义化助力性能优化与可访问性,支持懒加载与内容优先级划分;4. AI工具将自动生成语义化代码并辅助检测,降低实践门槛…

    2025年12月23日
    000
  • HTML表单数据怎么加密传输_HTML表单数据加密传输的安全方法与实现

    答案:HTML表单数据加密传输依赖HTTPS、前端加密和安全配置。首先必须使用HTTPS(SSL/TLS)加密通信,部署有效证书并强制跳转;其次可选前端加密如RSA或SHA-256增强敏感信息保护;同时设置autocomplete=”off”、CSP等防护属性;服务端需验证数…

    好文分享 2025年12月23日
    000
  • 如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

    使用HTML构建标签结构,CSS3添加旋转与过渡效果,JavaScript生成随机HSL颜色并设置字体大小,实现动态交互的标签云组件。 要在网页中实现一个动态的标签云组件,结合 HTML、CSS3 变换和随机颜色生成算法,可以按照以下步骤操作。这个组件不仅能提升页面视觉效果,还能通过色彩和旋转增加交…

    2025年12月23日
    000
  • 如何在Go Gin应用中集成前端JavaScript模块(如Sentry)

    本文探讨了在Go Gin框架下,通过HTML模板服务前端页面时,如何有效集成JavaScript模块(如Sentry)。针对浏览器不直接支持Node.js模块导入语法的问题,文章详细阐述了利用CDN引入Sentry SDK的解决方案,并提供了具体的代码示例,帮助开发者实现前端错误监控功能,避免了复杂…

    2025年12月23日
    000
  • HTML数据如何实现数据智能 HTML数据智能分析的技术架构

    实现HTML数据智能分析需构建包含采集、解析、存储、分析与可视化的闭环系统,首先通过爬虫技术获取网页数据并进行清洗标准化,接着利用DOM树分析与NLP技术提取结构化信息,随后将数据存入合适数据库或数据仓库并建立元数据管理机制,进而应用AI模型开展分类、情感分析、趋势预测与知识图谱构建等智能分析,最终…

    2025年12月23日
    000
  • html官网浏览入口_html网站设计免费平台

    html官网浏览入口在https://www.codepen.io,该平台支持实时预览代码、创建Pen项目、Fork开源示例,可添加外部资源,具备点赞评论收藏等社区互动功能,设有挑战活动与作品集分类,开放API接口,界面简洁适合初学者,在线编写无需配置环境,支持多种预处理器和响应式测试。 html官…

    2025年12月23日
    000
  • HTML5 section怎么用_HTML5内容分区标签应用场景说明

    在HTML5中,标签用于定义文档中具有明确主题的独立内容区块,需包含标题以体现其结构性与语义性,常用于文章章节、产品模块等场景,区别于无语义的和可独立分发的。 在HTML5中,section 标签用于定义文档中的一个独立内容区块。它不是简单的容器,而是有语义的结构化标签,表示文档中一个主题性的分区,…

    2025年12月23日
    000
  • htm算法 前景如何_分析HTM算法应用前景

    HTM算法在实时异常检测、预测性维护等时序数据场景中具备应用价值,其无需大量标注数据的特性适合工业监控、网络安防等领域;但受限于生态薄弱、性能不及主流模型及工程实现难度,短期内难以成为主流,更可能作为边缘计算或AI系统补充技术,在特定专业领域持续发展。 HTM(Hierarchical Tempor…

    2025年12月23日
    000
  • Django模板中Markdown转HTML内容显示异常的解决方案

    本教程旨在解决Django应用中将Markdown内容转换为HTML后,在模板中显示为原始文本而非渲染为可交互页面的问题。核心解决方案是利用Django模板语言提供的|safe过滤器,指示模板引擎将特定变量视为安全HTML内容,从而避免自动转义,确保HTML标签能够被浏览器正确解析和渲染。 问题剖析…

    2025年12月22日
    000
  • HTML结构化数据怎么添加_Schema标记添加教程

    Schema标记通过结构化数据帮助搜索引擎理解网页内容,提升搜索结果展示效果,如添加星级评分、价格等富文本信息。使用JSON-LD或Microdata格式将符合Schema.org标准的类型(如Article、Product)嵌入HTML中,可增强SEO,需通过Google Rich Results…

    2025年12月22日
    000
  • 如何实现自定义提示

    掌握自定义提示需构建迭代工作流,通过明确目标、设定角色、提供上下文、结构化输出、示例引导、迭代优化、负面提示和链式思考,实现AI输出的精准控制与高效协同。 实现自定义提示,核心在于理解与AI模型交互的本质,并将其从“提问”升级为“引导”。它不是简单的抛出问题,而是通过精心设计的语言结构、上下文信息、…

    2025年12月22日
    000
  • 前端开发中sessionStorage的优点及应用案例分析

    sessionStorage在前端开发中的优势与应用案例分析 随着Web应用的发展,前端开发的需求也越来越多样化。前端开发人员需要使用各种工具和技术来提高用户体验,其中,sessionStorage是一个非常有用的工具。本文将介绍sessionStorage在前端开发中的优势,以及几个具体的应用案例…

    2025年12月21日
    000
  • html如何修改日期样式

    在html中,可以使用“::-webkit-datetime-edit”伪元素选择器来修改日期格式,只需要用该选择器选中元素,在设置具体样式即可,具体语法为“::-webkit-datetime-edit{属性:属性值}”。 本教程操作环境:windows7系统、CSS3&&HTML…

    2025年12月21日
    100
  • 单选框的type属性值为什么

    单选框的type属性值为“radio”。html type属性可以规定要显示的输入框“”元素的类型;值为“radio”时显示为单选框、“checkbox”时显示为复选框、“select”时显示为下拉式选框等等。 本教程操作环境:windows7系统、HTML5版、Dell G3电脑。 在HTML中,…

    2025年12月21日
    000
  • HTML中type是什么意思

    在HTML中,type是类型的意思,是一个标签属性,主要用于定义标签元素的类型或文档(脚本)的MIME类型;例在input标签中type属性可以规定input元素的类型,在script标签中type属性可以规定脚本的MIME类型。 本教程操作环境:windows7系统、html5版、Dell G3电…

    2025年12月21日
    000
  • HTML中ul标签如何去掉点?HTML无序列表的样式实例解析

    本篇文章主要讲述的是关于html中的ul标签的默认小点给取消掉,还有关于html的无序列表ul标签的样式解释,给出了ul标签中的type属性三种值的介绍。现在就让我们一起来看本篇文章吧 首先这篇文章一开始我们就开始介绍在html中是怎么把ul标签的点给去掉的: 大家应该都使用过ul无序列表标签,ul…

    2025年12月21日 好文分享
    000
  • html中的ol标签如何去掉标号呢?标签的使用方法总结

    本篇文章介绍了html的ol标签是怎么去掉序号标号的,这里还有代码的详细解释,还有介绍了关于html ol有序列表标签如何更改序号,下文介绍了三种序号,大家也可以自己去想填写怎样的序号。现在来看这篇文章吧 一、我们先看看html中的ol标签是如何去掉标号的呢: 我们都知道html的ol标签是个有序列…

    2025年12月21日 好文分享
    000

发表回复

登录后才能评论
关注微信