美国商务部公开征求关于GenAI数据准备意见和建议

数据是人工智能的核心。如果没有良好的数据,开发有用的人工智能模型的可能性微乎其微。考虑到这一点,美国商务部上周发布了一份公开请求,就如何更好地为构建生产式人工智能(GenAI)模型准备众多公共数据集进行意见征求。这份公开请求是为了解决当前人工智能领域面临的一个关键问题:缺乏高质量、多样化的公共数据集。这些数据集对于培养机器学习模型、促进创新和推动人工智能应用的发展至关重要。商务部希望通过这份公开请求收集到各方的意见,以便更好地理解如何建立和管理公共数据集。他们希望听到

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

美国商务部公开征求关于GenAI数据准备意见和建议

美国商务部于4月17日发布了一份信息征询书(rfi),要求“行业专家、研究人员、民间社会组织和其他公众成员”就如何开发“支持人工智能的开放数据集”提供帮助。

商务部自称为“美国数据机构”,负责收集、存储和分析有关美国的各种数据,包括有关经济、人口和环境的数据。对商业数据中心的快速搜索显示了超过122,000个可公开访问的数据集,其主题从气候和天气到专利再到人口普查信息。

这部分内容旨在随着多年来技术的变化和改进,该部门一直向私营企业和公共机构寻求帮助,以保持其数据管理和数据共享活动达到当前技术标准。通过机器可读格式或通过Web服务和API以电子方式访问数据都是使其数据服务适应时代的例子。

现在,随着GenAI革命的到来,该部门正在寻找最合适的数据定位,以便使用它来构建人工智能模型。

美国商务部首席数据官Oliver Wise在信息征询书中写道:“如今,随着人工智能技术的出现,商务部正面临一场新的技术变革,这些技术为用户提供了更好的信息和数据访问。”“商业对生成式人工智能(GenAI)应用程序特别感兴趣,它可以消化不同来源的文本、图片、音频、视频和其他类型的信息,以产生新的内容。GenAI和其他人工智能技术为商业等数据提供者和包括政府实体、行业、学术界和美国人民在内的数据用户带来了机遇和挑战。”字数不要超过482

“智能”表明,商业部门面临的最大挑战是让人工

“最近的人工智能系统接受了大量数字内容的训练,并根据内容的上下文生成响应。”“然而,这些系统并没有以一种有意义的方式真正‘理解’文本。”

先见AI 先见AI

数据为基,先见未见

先见AI 95 查看详情 先见AI

未来的人工智能系统必须能够访问的数据不仅是机器可读的,而且是“机器可理解的”。今天的人工智能系统受限于它们对大量非结构化数据存储的依赖,这些存储依赖于底层数据,而不是基于理解进行推理和判断的能力。

商务部正在寻求帮助,以便在考虑到GenAI技术这些基本限制的情况下共享数据。它正在为可读和可理解的数据寻找新的数据传播标准,包括许可标准。在数据可访问性和检索方面,商务部希望得到关于如何使其数据更易于访问的建议,例如通过API或“网络爬虫”。

特别在如何使用利用元数据的知识图谱来更好地将人类术语与数据联系起来方面有需求。它还希望得到采用标准本体(如Schema.org或NIEM)的方向,以及知识图谱如何帮助“协调和链接”本体和词汇表。

该部门希望社区能够就如何推进这些数据标准化工作提供意见,同时在数据完整性、质量、安全性和道德方面保持最高标准。

Wise要求有兴趣的各方将他们的建议通过电子邮件发送,主题行为“AI-Ready开放数据资产信息征询书”。并希望在七月十六日之前收到有关这些议题的意见或反馈。

以上就是美国商务部公开征求关于GenAI数据准备意见和建议的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/421113.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
Linux文件系统中blkid命令的使用方法
上一篇 2025年11月7日 09:21:18
抖音关注和粉丝一样吗?运营误区有哪些?细分抖音关注与粉丝的本质区别!
下一篇 2025年11月7日 09:21:23

相关推荐

  • 人工智能如何为 C 语言代码提供安全增强功能?

    人工智能通过提供以下功能来提升 c 代码安全性:静态分析:识别潜在安全漏洞(例如缓冲区溢出);动态分析:监控代码执行并检测异常行为;模糊测试:生成随机输入以测试代码的异常行为;自动化修复:建议修复措施或自动生成补丁程序。 人工智能赋能 C 代码:提升安全性 人工智能 (AI) 在 C 代码安全方面发…

    2026年5月10日
    100
  • ChromaDB向量嵌入的有效持久化策略

    本文详细介绍了如何利用langchain中chromadb的`persist_directory`功能,高效地持久化存储向量嵌入。通过将生成的嵌入数据保存到本地磁盘,可以有效避免重复计算,显著提升工作流程效率。教程将涵盖持久化chromadb实例的创建与后续加载的完整过程。 在处理大规模文本数据并生…

    2026年5月10日
    000
  • 使用 C++ 构建高性能服务器架构的最佳实践

    遵循 c++++ 中构建高性能服务器架构的最佳实践可以创建可扩展、可靠且可维护的系统:使用线程池以重用线程,提高性能。利用协程减少上下文切换和内存开销,提升性能。通过智能指针和引用计数优化内存管理,避免内存泄漏和性能瓶颈。选择哈希表、数组和链表等高效的数据结构,优化数据访问和存储。充分利用现代 c+…

    2026年5月10日
    000
  • DeAgentAI(AIA)币是什么?值得投资吗?DeAgentAI上线指南、价格预测及路线图介绍

    目录 DeAgentAI (AIA) 上市:关键细节和交易时间表关键上市信息DeAgentAI(AIA)价格预测:上市后DeAgentAI (AIA) 是什么:解释DeAgentAI (AIA) 为何脱颖而出?DeAgentAI (AIA) 生态系统:其运作方式认识 DeAgentAI (AIA) …

    2026年5月10日
    000
  • .NET中的仓储模式(Repository Pattern)是什么?如何解耦业务逻辑和数据访问?

    仓储模式是.NET中用于分离业务逻辑与数据访问的抽象层,通过定义如IUserRepository接口并结合依赖注入,实现对数据访问的具体技术解耦;业务逻辑仅依赖接口,可通过SqlUserRepository等具体实现操作数据库,而无需知晓底层细节;该模式提升可维护性、支持单元测试、降低耦合,并可配合…

    2026年5月10日
    000
  • 掌握Python中嵌套列表与字典的数据访问技巧

    本文详细介绍了在Python中如何高效且准确地访问复杂嵌套数据结构(特别是包含列表和字典的多层JSON数据)中的特定值。通过具体示例,文章解释了直接索引列表元素和字典键的正确方法,避免了常见的类型错误,并提供了处理多条记录和潜在数据缺失的健壮性建议,旨在帮助开发者熟练提取深层数据。 理解嵌套数据结构…

    2026年5月10日
    000
  • 指针和数组在C++中有什么区别 内存访问方式与使用场景对比

    指针和数组在C++中有什么区别 内存访问方式与使用场景对比指针和数组在C++中有什么区别 内存访问方式与使用场景对比指针和数组在C++中有什么区别 内存访问方式与使用场景对比指针和数组在C++中有什么区别 内存访问方式与使用场景对比

    指针和数组在c++++中本质不同,使用场景和内存访问方式也存在差异。1. 指针是变量,存储地址,可改变指向;数组是连续内存块,大小固定,不可赋值。2. 数组访问基于固定偏移,编译器直接计算地址;指针访问依赖当前地址,通过移动实现数据访问。3. 数组适合静态结构、保证内存连续的场景,如局部数据存储;指…

    2026年5月10日 用户投稿
    000
  • .NET中的WPF是什么?如何使用MVVM模式来构建桌面应用?

    WPF是.NET的UI框架,使用XAML实现界面与逻辑分离,支持数据绑定、样式模板和MVVM模式,通过ViewModel暴露数据与命令,View绑定其属性与ICommand实现交互,提升可维护性。 WPF(Windows Presentation Foundation)是 .NET 框架中的一个用于…

    2026年5月10日
    000
  • 前端基本面20

    前端开发实践:自动完成功能设计与实现 本文探讨如何设计和实现一个高效的前端自动完成功能,并重点关注其架构、API设计、性能优化和用户体验。 1. 数据序列化 (JSON.stringify) 在处理自动完成功能的数据时,JSON.stringify 用于将 JavaScript 对象转换为 JSON…

    2026年5月10日
    000
  • Golang反射与标签解析结合使用实例

    Golang反射结合结构体标签的核心优势在于提供运行时动态解析和操作结构体元数据的能力,实现高度灵活、解耦的系统设计。通过reflect.TypeOf(obj).Field(i).Tag.Get(“tag_name”)模式,可在不修改结构体的前提下集中管理JSON序列化、数据…

    2026年5月10日
    300
  • 如何计算C++结构体的大小?解析结构体内存对齐原则

    如何计算C++结构体的大小?解析结构体内存对齐原则如何计算C++结构体的大小?解析结构体内存对齐原则如何计算C++结构体的大小?解析结构体内存对齐原则如何计算C++结构体的大小?解析结构体内存对齐原则

    结构体内存对齐的原则包括:1. 结构体成员对齐,每个成员按自身大小对齐;2. 结构体整体对齐,整体大小需是对齐系数(通常为最大成员大小)的倍数;3. 填充字节插入以满足上述规则。例如,struct mystruct { char a; int b; char c;} 默认情况下会因填充导致大小为12…

    2026年5月10日 用户投稿
    000
  • C#中什么是依赖注入 C# ASP.NET Core依赖注入(DI)的实现原理

    依赖注入是ASP.NET Core实现IoC的核心机制,通过外部容器在运行时将服务实例自动传递给类的构造函数,降低耦合并提升可测试性与维护性。传统方式中类内部直接new依赖导致紧耦合,而DI通过构造函数接收依赖接口,由框架注入具体实现,使业务逻辑与实现分离。ASP.NET Core内置轻量级容器,基…

    2026年5月10日
    000
  • SIMD指令集优化:手写循环速度提升15倍实测

    SIMD指令集优化:手写循环速度提升15倍实测SIMD指令集优化:手写循环速度提升15倍实测SIMD指令集优化:手写循环速度提升15倍实测SIMD指令集优化:手写循环速度提升15倍实测

    simd指令集优化适合处理大规模并行计算任务,通过单指令多数据的方式实现性能提升。1. 确认代码中存在大量可并行操作的同类型计算,如图像或音频处理;2. 选择与目标平台和编译器兼容的指令集,如sse、avx或neon;3. 确保数据内存对齐以避免性能下降或崩溃;4. 使用intrinsic函数或手写…

    2026年5月10日 用户投稿
    000
  • C++ 框架如何支持人工智能模型的持续改进和维护?

    C++ 框架助力持续改进和维护 AI 模型 简介 训练和部署 AI 模型是一项持续的过程,需要不断改进和维护。C++ 框架提供了强大的工具和特性,以支持这些活动。 持续改进 立即学习“C++免费学习笔记(深入)”; 数据收集和特 征工 程 C++ 框架如 TensorFlow 和 PyTorch 提…

    2026年5月10日
    000
  • Python字典数据结构优化与值提取教程

    本文旨在指导python初学者如何优化字典数据结构,以避免不必要的嵌套,并实现高效的值提取与数据处理。通过分析常见的数据结构设计误区,我们将展示如何构建简洁且功能强大的字典,从而简化后续的数据操作,如排序,并提升代码的可读性和维护性。 在Python编程中,字典(Dictionary)是一种非常灵活…

    2026年5月10日
    000
  • C++框架在人工智能领域的应用

    c++++ 框架在 ai 领域应用广泛,提供速度、效率和灵活性的优势。流行的 ai c++ 框架包括 tensorflow、pytorch、caffe2、mxnet 和 theano。这些框架用于开发图像分类、自然语言处理和机器学习等应用程序。 C++ 框架在人工智能领域的应用 C++ 以其速度、效…

    2026年5月10日
    000
  • 人工智能助力 C 代码集成和 DevOps实践

    通过将人工智能 (ai) 集成到 c 代码集成和 devops 实践中,可以提高效率和质量:代码审查: ai 工具可以分析代码并识别潜在问题,评估质量指标,例如可读性、可维护性和安全风险。(实战案例:codescene)测试自动化: ai 算法可以生成测试用例并执行测试,提高测试覆盖率。(实战案例:…

    2026年5月10日
    000
  • 即将上线的Gata(GATA币)是什么?怎么样?GATA币技术路径和代币经济学概述

    目录 什么是 Gata:定位和产品边界应用程序/入口点和“可验证数据表面”架构:执行网络 × 数据与数据挖掘 × 应用协同工作应用层数据和存储层执行和 DA 层代币经济学:供应、分配和效用代币效用生态系统伙伴关系和外部信号近期进展和路线图常问问题关键要点 gata 同时构建了“应用程序可用性”和“去…

    2026年5月10日
    100
  • 怎样用Golang实现高效文件压缩传输 集成zstd与snappy流式压缩

    怎样用Golang实现高效文件压缩传输 集成zstd与snappy流式压缩怎样用Golang实现高效文件压缩传输 集成zstd与snappy流式压缩怎样用Golang实现高效文件压缩传输 集成zstd与snappy流式压缩怎样用Golang实现高效文件压缩传输 集成zstd与snappy流式压缩

    在golang中实现高效的文件压缩传输,核心是利用io.reader和io.writer接口结合zstd或snappy进行流式压缩与解压缩。发送端通过打开文件reader并将数据写入连接网络的压缩器writer,接收端从网络reader读取压缩数据并通过解压器写入目标文件,形成管道模式。选择压缩算法…

    2026年5月10日 用户投稿
    100
  • C#项目结构如何组织?DDD(领域驱动设计)分层架构在C#中的最佳实践

    采用DDD时应分Domain、Application、Infrastructure、Presentation四层,每层职责分明且仅依赖下层。Domain包含实体、值对象、聚合根及领域事件,不依赖其他层;Application协调业务用例,调用领域对象但不含业务规则;Infrastructure实现仓…

    2026年5月10日
    100

发表回复

登录后才能评论
关注微信