北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

未来,移动通信网络支撑下的网联具身智能体将深度融入经济社会,推动各行业与日常生活的革命性变革。针对当前网联具身智能体上通信与多模态感知相互分立、各自为政,进而制约其智能能力的科学问题,%ignore_a_1%电子学院程翔教授团队首次提出并系统论述了机器联觉(synesthesia of machines,som)的架构与概念,即面向通用任务的ai原生通信与多模态感知智能融合,利用大模型/无线基座模型,突破多模态通感智能融合的核心技术,提供网联智能发展新路径。由于通信与多模态感知智能融合数据集的体量和质量在训练阶段从根本上决定了未来ai原生的多模态通感系统的性能上限,海量、高质量的通信与多模态感知智能融合数据集至关重要。然而,现阶段的通信与多模态感知数据集(如图1所示)存在缺少完备的通信与多模态感知信息、场景简单单一以及数据集的可信度和可用性未得到充分验证等不足,难以满足未来ai原生系统对于数据集体量和质量的要求。因此,亟需开展海量、高质量的通信与多模态感知智能融合数据集构建研究,作为ai原生的多模态通感系统设计的核心数据基础,支撑机器联觉研究,赋能未来网联智能深度快速发展。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图1 现有典型的通信与多模态感知数据集

然而,构建海量、高质量的通信与多模态感知智能融合数据集极具挑战。首先,实测多模态通感数据采集所需设备繁多且需严格时空同步,从而导致实测数据成本极高、复杂度极高、场景受限且不可控性强。其次,现阶段没有一个仿真平台能直接生成和采集通信与多模态感知仿真数据。为填补上述空白和克服上述挑战,程翔团队创新性地采用机器联觉架构,搭建了首个实测注入的通信与多模态感知仿真数据生成与采集平台,并基于此构建了海量、高质量的通信与多模态感知智能融合数据集SynthSoM: A Synthetic Intelligent Multi-Modal Sensing-Communication Dataset for Synesthesia of Machines (SoM),从根本上提升了AI原生多模态通感系统的性能上限。SynthSoM数据集的构建汇集了3个高可靠仿真软件AirSim、WaveFarer和Wireless InSite,包含4个步骤:高保真场景构建、完备场景条件仿真、动态场景生成、数据采集与导出,以及对SynthSoM数据集可信度和可用性的进一步验证,总体架构如图2所示。

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图2 SynthSoM数据集的构建架构

该工作的主要亮点如下:

(1) 平台层面:搭建了首个实测注入的通信与多模态感知仿真数据生成与采集平台,汇集了3个高可靠仿真软件AirSim、WaveFarer和Wireless InSite,实现了3个仿真软件的深度融合与精准匹配。

(2) 数据层面:包含144万张RGB图、289万张深度图、144万组激光雷达点云、49万组雷达波形、70万组信道矩阵和10万组路径损耗,总计共700万组以上的通信与多模态感知数据,是现有多模态通感数据量的5倍以上。

(3) 场景层面:包含空地多路协同网联具身智能场景(网联智能无人车、低空经济无人机)下城镇、郊区、乡村(如图3所示),具有多时段、多天气、多视角、多车流量密度、多频段、多种天线阵列等丰富场景条件,并在不同场景和条件设置过程中采用了多种先进技术和算法,包括射线追踪、激光雷达光散射增强(LISA)算法、协同自适应巡航控制(CACC)汽车跟随模型用于防碰撞检测等。

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图3 SynthSoM涵盖的五类空地协同场景:(a) 城镇十字路口 (b) 城镇超宽车道 (c) 城镇高架立交桥 (d) 郊区分岔路口 (e) 乡村山区公路

(4) 验证层面:为全面验证构建的仿真SynthSoM数据集的可信度和可用性,首次开展对于SynthSoM数据集的基于统计的定性分析以及实测注入的性能扩展性测试。针对基于统计的定性分析,结果表明在不同场景和条件下所采集的仿真数据与实测数据展现出一致的电磁传播机制;针对实测注入的性能扩展性测试,基于数字孪生技术,在北京大学校园场景搭建精准匹配的实测与仿真场景(如图4所示),采集时空一致的实测与仿真多模态通感数据。基于此,进一步开展在仿真数据训练,在实测数据测试(TSTR)以及在实测数据训练和测试(TRTR),如图5所示。测试结果表明TSTR和TRTR的精度分别为89.28%和90.35%,证明了仿真数据与实测数据的高吻合度使得简单深度学习小模型也有能力实现零样本泛化。

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图4 精准匹配的实测场景与仿真场景

北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限

图5 实测注入的性能扩展性测试

(5) 开源层面:构建的海量、高质量的通信与多模态感知智能融合数据集SynthSoM和代码完全开源,可支撑不同多模态通感智能融合算法的交叉验证、模型校准和基线实现,从根本上提升AI原生多模态通感系统性能上限,支撑未来网联智能深度快速发展。

该研究成果以“SynthSoM: A synthetic intelligent multi-modal sensing-communication dataset for Synesthesia of Machines (SoM)”为题于5月20日正式发表于Nature子刊Scientific Data。北京大学为该研究工作的第一完成单位,合作单位包括山东大学。程翔和山东大学白露教授为该论文的共同通讯作者,程翔、博雅博士后黄子蔚和博士生于勇为共同第一作者,其他作者包括北京大学电子学院博士生孙铭然、韩增瑞、张瑞德和李思江。这项工作得到了国家自然科学基金委杰出青年科学基金、新基石科学基金会科学探索奖、中国博士后科学基金会博士后创新人才支持计划等的支持。

以上就是北京大学程翔团队构建首个实测注入的通信与多模态感知智能融合数据集SynthSoM,从根本上提升AI原生多模态通感系统性能上限的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/120424.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月26日 00:16:52
下一篇 2025年11月26日 00:21:54

相关推荐

  • 币安PC版下载及交易指南 币安交易所app最新下载

    币安(Binance)是全球领先的加密货币交易平台之一,提供比特币、以太坊等多种数字货币的交易服务。币安PC版客户端为用户提供了更稳定、更专业的交易体验,包括实时行情、K线图、深度图以及多种交易工具。本文将为用户提供官方币安PC版下载链接,点击本文提供的链接即可下载并安装。 币安注册官网一键直达: …

    2025年12月11日
    000
  • 比特币巨鲸抛售11.5万枚BTC,创2022年中期以来最大抛售潮

    目录 巨鲸余额变化放缓结构性对冲长期表现更为健康‍ 比特币巨鲸上个月出售了约127亿美元的比特币,给价格带来压力,并“表明大型投资者中存在强烈的风险规避情绪。” 分析师指出,比特币巨鲸在过去一个月内累计抛售了高达127亿美元的比特币(BTC),持续的抛售有可能在接下来的几周继续对价格构成压力。 Cr…

    2025年12月11日
    000
  • 隐私计算代币:数据安全与价值流转

    随着数字化浪潮的汹涌向前,数据已成为驱动现代社会发展的核心引擎。然而,数据的巨大价值也伴随着日益严峻的挑战——如何在利用数据价值的同时,确保其隐私与安全?这正是隐私计算代币所要解决的核心问题。这些代币不仅仅是数字资产,它们更是隐私计算技术在区块链上应用的具象化体现,旨在通过加密、零知识证明、联邦学习…

    好文分享 2025年12月11日
    000
  • 比特币突破10万美元:牛市行情再燃

    比特币突破10万美元是多重因素推动的历史性里程碑,包括机构资金涌入、通胀担忧、现货ETF获批、减半效应、技术创新及地缘政治不确定性;投资者应通过多元化配置、风险管理、长持与波段结合策略参与牛市,选择安全、高流动性、合规的交易所如Binance、OKX、火币进行交易,并警惕市场投机、回调、诈骗、监管与…

    2025年12月11日
    000
  • Hyperliquid稳定币竞标战打响,谁会成为USDH的发行人?一文介绍

    目录 @Paxos@Frax@fiege_max@withAUSD一些思考 随着 @HyperliquidX 宣布即将推出 USDH,各大竞争者已纷纷入场争夺发行权,甚至承诺将高达100%的储备收益和利息回馈给 Hyperliquid 社区。 简单回顾一下背景,方便不熟悉的朋友了解: 稳定币是 Hy…

    2025年12月11日
    000
  • 区块链游戏资产代币化:开启数字所有权时代

    区块链技术与游戏行业的深度融合,正在催生一场深刻的数字所有权革命。传统游戏世界里,玩家投入大量时间和金钱获取的道具、装备和角色,其所有权往往仅限于游戏公司内部数据库的一个记录,玩家并不真正拥有这些虚拟资产。一旦游戏服务器关闭,或者玩家违反了服务条款,这些资产就可能灰飞烟灭。然而,通过区块链技术对游戏…

    好文分享 2025年12月11日
    000
  • 比特币BTC和以太坊ETH的长期价格预测

    目录 1 比特币BTC基本面分析1.1 经济因素与货币政策1.2 公司新闻与机构吸纳ETF1.3 全球和地缘政治事件1.4 区块链创新与应用2 比特币BTC的技术分析2.1 支撑位和阻力位2.2 移动平均线2.3 MACD指标2.4 相对强弱指数(RSI)2.5 价格模式2.6 即将到来的场景3 以…

    2025年12月11日
    000
  • SatLayer(SLAY)币是什么?怎么买?SLAY币价格预测及未来展望

    目录 SLAY币最新新闻和价格动态SatLayer(SLAY)是什么?SatLayer 开发团队和融资SatLayer是如何运作的?SLAY币是什么?SLAY代币经济学SLAY币价格走势分析SatLayer(SLAY)未来展望SatLayer(SLAY)币价格预测SLAY币怎么买?常见问题FAQ总结…

    2025年12月11日 好文分享
    000
  • 巨鲸悄悄建仓 散户还在观望:一文了解山寨币即将爆发?

    目录 四年的周期节奏:这次为何姗姗来迟?山寨币市场的信号宏观因素为何压住市场?为何这轮周期感觉不同?起步更晚,舞台更大选择性山寨币季节全市场的压缩投资者行为演化为何感觉如此缓慢?导火索燃烧时的观察要点总结 一位朋友最近把当前的加密货币市场形容为“坏掉的唱片”——比特币和以太坊横盘整理,山寨币敲击阻力…

    2025年12月11日
    000
  • OpenLedger(OPEN)币价格预测:2025、2026、2027-2030年

    目录 什么是 OpenLedger?OpenLedger 的主要特点为什么 OpenLedger 很重要OpenLedger 可支付 AIOpenLedger 可支付 AI 基础设施可支付 AI 模型数据网络 (Datanet) 层区块链层OpenLedger 如何实现模型可支付OpenLedger…

    2025年12月11日 好文分享
    000
  • 什么是Black Mirror(MIRROR)币?值得有投资吗?MIRROR代币经济学和未来展望

    目录 什么是Black Mirror体验(Mirror Crypto)?Mirror令牌与Black Mirror体验的主要区别加密货币旨在解决的问题1. 数字身份碎片化的挑战2. 信任与验证差距3. 低效的注意力经济4. 解决方案:游戏化声誉基础设施Black Mirror体验背后的故事Black…

    2025年12月11日
    000
  • MYX币暴涨百倍,究竟是什么原因?一文探索

    目录 项目背景生态现状历史争议与补偿方案社区热议 「5 月 6 日,币安 alpha 发放了 1667 个 myx 空投,如今价值已经飙到 11139 美元。而你,我的朋友,当时开盘只拿着 85 美元就忍不住卖掉了。」 「币安送了你一辆车,你就卖了个轮胎钱。」这是近期圈内很火的一个段子,如今空投价值…

    2025年12月11日 好文分享
    000
  • 2025年9月AI代币暴涨55%,如何在行情网站上发现机会?

    要在行情网站上发现ai代币暴涨55%之类的机会,核心在于利用网站的分类追踪、数据筛选器和成交量异动监测功能。您需要长期关注人工智能板块,并设置针对该板块内代币的特定指标警报,例如24小时成交量增幅超过特定百分比或价格突破关键阻力位,从而在市场普遍察觉前捕捉到早期信号。 2025年虚拟货币官网app地…

    2025年12月11日
    000
  • OpenLedger(OPEN)币是什么?值得投资吗?OPEN币项目概述及未来展望

    目录 摘要框(简要事实)什么是 OpenLedger?有多少个OPEN?OPEN 做什么?OpenLedger 与以太坊OPEN背后的技术团队与起源重要新闻与事件OPEN 是一项好的投资吗?如何在币安购买OPEN常见问题解答 摘要框(简要事实) 股票代码:开放Chain:构建为以太坊Layer-2流…

    2025年12月11日 好文分享
    000
  • Hyperliquid 稳定币 USDH 成“行业香饽饽”,巨头打响分发权乱战

    目录 USDH 成稳定币发行商必争之地,Paxos、Agora 等巨头入局参赛选手:3 大稳定币发行商+2 个项目方各显神通Hyperliquid 生态项目态度不一:有人大喊不公,有人直接弃权USDH 即将上线,USDC 背后的 Circle 先坐不住了稳定币发行商乱战:只为抢占分发与市场份额 US…

    2025年12月11日 好文分享
    000
  • 纸币与传统货币:2025 年的 USDT、USDC 和 DAI,一文介绍

    目录 关键要点为什么 Pepedollar 将在 2025 年成为 USDT、USDC 和 DAI 的挑战者传统稳定币:DeFi 的支柱下面我们来简单了解一下这三位传统领袖:  Pepedollar:MemeFi 的挑战者Pepedollar 的主要特点虚拟美元与传统稳定币 为什么美元在 2025 …

    2025年12月11日
    000
  • 什么是 StarryNift (SNIFT) 币?功能作用、投资潜力以及未来介绍

    目录 SNIFT 代币的起源与发展什么是 Starry Nift(SNIFT)?谁创建了 Starry Nift (SNIFT)?哪些风险投资公司支持 Starry Nift (SNIFT)?Starry Nift(SNIFT)的工作原理星空人工智能StarryAI SDKDID 公民身份Starr…

    2025年12月11日
    000
  • Chainlink(LINK)币是什么?LINK未来展望及价格预测2025-2030年

    目录 Chainlink(LINK)币是什么历史价格、价格历史和价格分析Chainlink价格波动的因素是什么市场需求和供应技术发展和创新市场情绪和投资者行为宏观经济因素链上数据和活动整体加密货币市场走势Chainlink 2025年价格预测Chainlink 2026 年价格预测Chainlink…

    2025年12月11日 好文分享
    000
  • 易欧交易所是干嘛的,易欧交易所是正规的吗?

    Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: 安卓安装包下载: Huobi火币️ 官网直达: 安卓安装包下载: 易欧交易所(OKX)是一个面向全球用户的数字资产交易平台,主要功能是让用户买卖各种加密货币,比如比特币(BTC)、以太坊(ETH)、泰达币(USDT)、狗狗…

    2025年12月11日
    000
  • 区块链领域常识有哪些 区块链领域常识大全

    本文旨在为初学者梳理区块链技术的核心常识,通过通俗易懂的语言解释关键概念。掌握这些基础知识,是您理解并探索这个数字新世界的关键第一步。 区块链全球主流交易平台推荐 1、欧易okx 官网入口: APP下载链接: 2、币安Binance 官网入口: APP下载链接: 3、火币HTX 官网入口: APP下…

    2025年12月11日
    000

发表回复

登录后才能评论
关注微信