『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

协同感知技术在解决自动驾驶车辆感知问题方面具有重要意义。然而,现有研究往往忽视了智能体之间可能存在的异构性,即传感器和感知模型的多样性。实际应用中,智能体之间的模态和模型可能会存在显著的差异,这导致了域差异的出现,使得协同感知变得困难。因此,未来的研究需要考虑如何有效地处理智能体之间的异构性,以实现更加有效的协作感知。这将需要开发新的方法和算法,以适应不同智能体之间的差异性,并确保它们能够协同工作,实现更高效的自动驾驶系统

为了解决这一实际挑战,ICLR 2024的最新研究文章 《An Extensible Framework for Open Heterogeneous Collaborative Perception》定义了开放异构协作感知问题(Open Heterogeneous Collaborative Perception):如何将不断出现的新异构智能体类型加入已有协作感知系统,同时确保高感知性能和低加入成本?来自上海交通大学、南加州大学和上海人工智能实验室的研究者们在本文中提出了HEAL(HEterogeneous ALliance):一种可扩展的异构智能体协作框架,有效解决了开放异构协作感知问题的两大痛点。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

他们创建了一个包含多个协作感知数据集、多个协作感知算法以及支持多模态的代码框架,目前已完全开源。作者认为这是目前最完善的协作感知代码框架,有望帮助更多人轻松进入多模态、异构的协作感知研究领域。

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

论文链接:https://arxiv.org/abs/2401.13964代码链接:https://github.com/yifanlu0227/HEAL

研究背景和意义

近年来,自动驾驶技术备受学术界和工业界关注。然而,实际道路条件复杂多变,而单一车辆的传感器可能会受到其他车辆的遮挡,给自动驾驶系统的感知能力带来挑战。为了解决这些问题,多智能体之间的协作感知成为一种解决方案。随着通信技术的进步,智能体之间可以共享感知信息,结合自身传感器数据和其他智能体的信息,从而提高对周围环境的感知能力。通过协作,每个智能体能够获取自身视野之外的信息,这有助于提升感知和决策能力。

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

图 1. 视线遮挡造成的“鬼探头”问题,单车感知受限

在当前研究领域中,大部分工作都基于一个可能过于简化的假设:所有智能体必须具有相同的结构;也就是说,它们的感知系统都使用相同的传感器,并且共享相同的检测模型。然而,在现实世界中,不同智能体的模式和模型可能是不同的,而且新的模式和模型可能会不断涌现。由于传感器技术和算法的快速发展,最初就确定所有协作智能体的种类(包括模式和模型)是不现实的。当一个从未出现在训练集中的异构智能体希望加入协作时,它必然会遇到与现有智能体之间的领域差异。这种差异会限制其与现有智能体进行特征融合的能力,从而显著限制了协作感知的可扩展性。

因此,开放异构协作感知问题随之而生:如何将不断出现的新智能体类型加入到现有的协作感知系统,同时确保高感知性能和低集成成本?

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

图 2. (a) 同构协作感知 (b) 异构协作感知 (c) 考虑新异构智能体加入的开放异构协作感知 (d) HEAL在使用最少训练成本的同时达到了最佳的协作感知性能

为了解决这个问题,一个可行的解决方案是后融合。通过融合每个智能体的感知输出(如3D包围框),后融合绕过了新智能体和现有智能体之间的异构性,且训练只需要发生在单智能体类别上。然而,后融合的性能并不理想,并被证明特别容易受到定位噪声和通信延迟等干扰因素等影响。另一种潜在的方法是完全集体培训,它汇总了协作中的所有智能体类型进行协作训练,以克服领域差异。然而,每次引入新的智能体类型时,这种方法都需要重新训练所有模型。随着新异构智能体的不断出现,训练的代价急剧上升。HEAL提出了一个全新的开放异构协作框架,同时具有完全集体训练的高性能和后融合的低训练成本。

问题定义

开放异构协作感知问题考虑如下场景:将具有先前未出现的模态或者模型的异构智能体类别加入到已有的协作系统中。不失一般性的,我们考虑场景初始由个同构的智能体组成,他们配备了相同类别的传感器、部署了相同的检测模型,并且都具有相互通信的能力。这些同构的智能体构成了一个已有的协作系统。随后,场景中从未出现过的模态或感知模型的异构智能体加入到协作系统当中。这种动态特性是在现实世界中部署协作感知的一个显著特征:智能体类别不会在开始时被完全确定,其类型数量可能会随着时间的推移而增加。它与先前的异构协作感知问题(其中异构的类别是提前确定好并固定的)也截然不同。

方法介绍

本文提出的开放异构协作感知框架HEAL(HEterogeneous ALliance),设计了两阶段的方法来将新的异构智能体加入到协作中,以实现不断增长的异构联盟:i)协作基类训练,令初始智能体训练一个特征融合协作网络并创建统一的特征空间;ii)新智能体训练,将新智能体的特征与之前建立的统一特征空间对齐,从而允许新智能体和已有智能体进行特征层面的协作。

智谱AI开放平台 智谱AI开放平台

智谱AI大模型开放平台-新一代国产自主通用AI开放平台

智谱AI开放平台 38 查看详情 智谱AI开放平台

对于每个新智能体类型加入协作,只需要第二阶段的训练。值得注意的是,第二阶段的训练可以由智能体所有者独立进行,不涉及与已有智能体的集体训练。这允许新智能体的加入有较低的训练成本,同时还能保护新智能体的模型细节不被暴露。

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

图 3. HEAL的整体框架

一阶段:协作基类训练

我们将场景中一开始存在的个同构智能体作为协作基类,并且训练一个基于特征融合的协作感知网络。我们提出一个新颖的金字塔融合网络来提取并融合多智能体的特征,具体在于:对于每个同构智能体的编码器编码出来的BEV特征,我们让他经过多层不同尺度的ResNeXt网络,以提取粗粒度和细粒度的特征信息。对于不同尺度的特征图,我们都对其应用前景预测器网络,估计BEV每个特征位置存在车辆等前景的概率。在协作者之间,前景的概率图会被归一化,作为将特征图逐像素加权融合的权重分布。获得不同尺度下的融合特征图以后,我们利用一系列上采样网络,将其转化到相同的特征图尺寸,并且得到最终融合的特征图。

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

图 4. 金字塔融合网络

融合后的特征图会经过一个检测头,转为最终的协作检测结果。协作检测结果和前景的概率图都受到ground-truth的监督。经过训练后,协作网络(金字塔融合网络)的参数保存了协作基类的相关特征信息,构建了一个共享的特征空间,用于后续新异构智能体的对齐。

二阶段:新智能体训练

我们考虑加入一种新的异构智能体类型。我们提出一种新颖的后向对齐方法。核心想法是利用上一阶段的金字塔融合网络和检测头作为新智能体的检测器后端,并仅更新前端编码器相关的参数。

值得注意的是,我们对新的异构类别的单个智能体进行单体训练,不涉及智能体之间的协作。因此,金字塔融合网络的输入是单张特征图,而不是一阶段中的多智能体特征图。随着预训练的金字塔融合模块和检测头被确立为后端和固定,训练过程演变为让前端编码器适应后端的参数,从而使新智能体编码的特征与统一特征空间保持一致。由于特征和已有智能体的特征对齐,他们能实现高性能的特征层面的协作。

后向对齐还显示了一个独特的优势:训练仅在新的单个智能体上进行。这大大降低了每次新智能体加入的训练成本和时空同步的数据采集成本。此外,它防止新代理的模型细节暴露给他人,并允许新智能体的所有者使用自己的传感器数据训练模型。这将显著解决汽车公司在部署车辆协作感知技术(V2V)时可能存在的许多顾虑。

实验结果

本文在OPV2V数据集的基础上,提出了一个更加数据异构的OPV2V-H数据集,补充了每辆车辆16线和32线的激光雷达数据,以及4个深度摄像头的数据。在OPV2V-H数据集和真实数据集DAIR-V2X上的实验结果表明,HEAL显著地降低了异构智能体加入协作的一系列训练成本(训练参数,FLOPs,训练时间等等),还保持了极高的协作检测性能。

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

图 5. HEAL同时拥有高性能和低训练成本

存在定位噪声和特征压缩的情况下,HEAL依然保持了最佳的检测性能,展示了在更加接近现实的设定下,HEAL是目前最有效的协作感知算法。

『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架

以上就是『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/426410.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 11:55:55
下一篇 2025年11月7日 11:58:56

相关推荐

  • 揭示粘性定位的关键要素是什么?揭示达到粘性定位的关键要点

    研究粘性定位的关键因素是什么?探索粘性定位的要点 粘性定位(stickiness positioning)是指在市场营销中,企业通过创造和维护与消费者之间的积极、持久的关系,使其成为消费者心中的首选品牌。在如今竞争激烈且消费者选择众多的市场环境下,粘性定位成为企业获取长期竞争优势的关键要素之一。那么…

    2025年12月24日
    000
  • 了解如何有效学习canvas技术

    如何系统地学习 canvas 技术? 在现代网页开发中,canvas 是一项非常重要的技术,它可以通过 JavaScript 来动态绘制图形,实现丰富的交互效果。想要系统地学习 canvas 技术,以下三个步骤可以帮助你入门。 第一步:了解基础概念和语法在学习任何技术之前,首先需要了解它的基础概念和…

    2025年12月21日
    000
  • 如何利用C++实现一个简单的餐厅点餐系统?

    如何利用C++实现一个简单的餐厅点餐系统? 餐厅点餐系统是现代餐饮行业中非常重要的一环。通过使用计算机程序来管理和处理点餐、结算等操作,可以提高餐厅的效率和服务质量。本文将介绍如何利用C++编程语言实现一个简单的餐厅点餐系统。 首先,我们需要定义一些基本的数据结构来存储菜单信息和订单信息。可以使用类…

    2025年12月17日
    000
  • 解决YOLOv7中’torchvision::nms’ CUDA后端兼容性问题

    本文旨在解决在YOLOv7中运行detect.py时遇到的NotImplementedError: Could not run ‘torchvision::nms’ with arguments from the ‘CUDA’ backend错误。该错…

    2025年12月14日
    000
  • php源码究竟怎么安装_php源码究竟安装依赖与验证法【指南】

    答案:PHP源码安装需先配置系统依赖,再下载解压源码,通过./configure设置编译选项,执行make与make install完成编译安装,最后验证版本与功能。1. 根据系统安装对应开发工具与库;2. 从官方下载指定版本源码并解压;3. 使用./configure设定路径与模块;4. make…

    2025年12月13日
    000
  • 安币交易所官网入口指南 安币Binance官方APP v3.7.4下载注册

    安币交易所官网入口指南是用户安全访问Binance平台的必备资源。本文聚焦安币Binance官方APP v3.7.4的下载、安装与注册流程,帮助新手快速入门。遵循官方渠道,确保账户安全与交易顺畅,助力数字资产管理。 一、官网入口指南 1、打开浏览器,输入Binance官网地址:,确保使用HTTPS协…

    2025年12月11日
    000
  • B安交易所苹果手机版APP官方最新安装链接

    B安交易所无疑是举足轻重的存在。对于使用苹果手机的用户来说,如何安全、便捷地安装B安交易所的APP,是进入这个数字资产大门的关键一步。本文将提供B安交易所苹果手机版APP的官方最新安装链接,并详细指导安装过程,确保您能顺利开启数字货币之旅。请务必仔细阅读以下内容,因为任何疏忽都可能导致安装失败或安全…

    2025年12月8日
    000
  • linux属于什么系统

    linux属于一种类UNIX操作系统。Linux,全称GNU/Linux,是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统。 本文操作环境:red hat enterprise linux 7.4系统、thinkpad t4…

    2025年12月5日
    000
  • win10如何回退到上一个版本_win10系统版本回退操作指南

    可通过系统设置在升级后10天内回退到旧版Windows;2. 确保C盘保留windows.old等关键文件夹以维持回退能力;3. 使用升级前创建的系统还原点可恢复系统状态。 如果您在升级Windows系统后遇到兼容性问题或运行不稳定,可以考虑回退到之前的版本以恢复正常使用。以下是进行系统版本回退的操…

    2025年12月4日
    000
  • linux是一个什么系统

    linux是一个基于POSIX的多用户、多任务并且支持多线程和多CPU的操作系统;linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。 本教程操作环境:linux5.9.8系统、Dell G3电脑。 Linux,全称GNU/Linux,是一种免费使用和自由传播的类UN…

    2025年12月4日
    000
  • 华为EMUI11底部小白条怎么设置_华为EMUI11底部小白条设置教程

    遇到%ignore_a_1%手机emui11底部小白条使用不便的问题了吗?php小编鱼仔这就为大家带来emui11底部小白条的设置方法介绍,以下内容将详细解析小白条的设置教程,帮助大家轻松解决使用困扰。 1、打开手机设置,找到【系统和更新】,并点击打开。 2、进入系统和更新界面后,点击【系统导航方式…

    2025年12月4日 手机教程
    000
  • 华为p20中打开开发人员选项的操作步骤

    华为p20中开启开发人员选项可以让你访问额外的设置和功能,以便进行自定义、调试和性能调整。php小编西瓜今天将为你提供一步一步的指南,让你轻松地启用开发人员选项,释放你的手机的全部潜力。 1、首先点击打开p20手机桌面上的【设置】, 2、点击进入设置菜单下的【系统】。 3、在系统菜单下点击进入【开发…

    2025年12月3日
    000
  • 华为p20pro中设置日期和时间的操作步骤

    %ignore_a_1%手机中如何设置日期和时间?php小编柚子为大家带来华为p20pro中更改日期和时间设置的详细教程。想要了解如何完成这项操作的朋友,快来往下查看具体步骤吧! 1、打开华为p20pro的手机桌面,点击进入桌面上的【设置】。 2、下拉到底栏,点击进入【系统】。 3、在系统菜单下点击…

    2025年12月3日 手机教程
    400
  • 魅族 Note 16 系列新机明日发布,新系统也来了

    目前官方已经对这款新机进行了多次预热,外观设计和部分配置信息已经曝光。 官方预热海报显示,星纪魅族 Note 16 系列历经近 100 万次品质测试、近 100 项实验论证、超 480 小时严苛环境验证。 其中标准版机型采用直角边框设计,机身侧边还配有一枚按键,预计为单独的 AI 按键;后置 Dec…

    2025年12月3日 硬件教程
    100
  • 荣耀手机设置全面屏手势的操作流程

    荣耀手机使用全面屏手势,可以带来更加便捷的操作体验。php小编草莓将为大家详细介绍荣耀手机设置全面屏手势的操作流程,解决您在使用全面屏手机时的操作难题。请继续阅读以下内容,了解如何在荣耀手机上启用和自定义全面屏手势,让您的手机操作更加流畅高效。 第一步:我们点击进入荣耀手机桌面上的【设置】 第二步:…

    2025年12月3日
    000
  • 金明全民经纪系统操作指南

    谁做投资不想迅速获利、收益高又不亏损?然而市场风险无处不在,有没有一套无论行情如何都能稳赚的系统? 1、 第一步,建立个人投资圈,采用高效盈利模式——全民经纪系统,通过三级分销提成,汇聚朋友的力量,共享收益成果。 2、 你的朋友、客户、同事中,可能有渴望赚钱的投资新手,追求稳定回报的老手,或是喜欢分…

    2025年12月3日 软件教程
    000
  • 校管家学校管理软件:学习秀操作流程指南

    老师如何在手机端一次性选择多个班级发送通知?学员信息管理模块如何增加批量删除功能?排课记录是否支持多种导出方式? 1、 首先登录校管家手机客户端,进入师生信家长端个人主页。在学习秀页面中,点击右上角的分享图标,可以将内容分享给朋友或发布到朋友圈。 2、 有报名意向的人可通过分享链接进行提交,相关信息…

    2025年12月3日 软件教程
    000
  • 如何登录个人公积金查询系统

    1、 null 2、 登录支付宝界面,找到入口位置。 3、 接下来,选择相关选项。 4、 然后点击对应的选项。 快剪辑 国内⼀体化视频⽣产平台 54 查看详情 5、 随后,点击指定的按钮。 6、 完成点击操作后,登录成功。 以上就是如何登录个人公积金查询系统的详细内容,更多请关注创想鸟其它相关文章!

    2025年12月3日 软件教程
    000
  • 一建注册查询系统平台:轻松掌握注册动态

    一建注册查询平台,以下经验希望能帮到大家,接下来详细讲解具体的操作流程,一起了解下吧。 1、 登录注册建筑师管理系统官网,选择一级建筑师相关栏目。 2、 跳转页面后,点击个人入口按键。 3、 进入新界面,找到并点击人员资格查询功能。 快剪辑 国内⼀体化视频⽣产平台 54 查看详情 4、 填写相关信息…

    2025年12月3日 软件教程
    000
  • 华为p20中关闭后台应用的详细方法

    对于华为 p20 用户来说,关闭后台应用是一个常见的问题,它可以帮助释放内存并延长电池续航。php小编香蕉将介绍华为 p20 中关闭后台应用的详细方法,包括通过任务管理器和应用程序设置进行关闭。了解这些方法,您将能够有效地管理后台应用,优化手机性能,继续阅读以获取详细指南。 1、打开【设置】。 2、…

    2025年12月3日 手机教程
    000

发表回复

登录后才能评论
关注微信