《汽车工程》2025年第9期发表了上海交通大学研究成果“基于跨域时空特征匹配的路端3D目标检测无监督学习方法研究”一文。路端3D目标检测能提供广域交通参与者信息,可有效赋能单车自动驾驶。一般而言,在新的路口部署感知系统耗时长且成本高。论文提出了一种面向路侧端的无监督域自适应算法,通过现有高质量标注路端数据与未知路端场景数据的跨域时空特征匹配,实现高效网络知识迁移与高准确率3D目标检测。测试结果显示,无监督域适应算法相较于目前最新方法的平均精度提升了24. 2%和8. 0%,有效增强了路端感知中目标检测模型的泛化性与可靠性。
一、研究背景
单车自动驾驶方案具有易被遮挡、感知范围受限、计算单元要求高等缺点。路端3D目标高精度感知不仅可以有效弥补单车感知范围的不足,还可以降低单车智能对于感知和定位的计算负载。其中,激光雷达能提供精确的三维空间坐标信息,在路侧高精感知中发挥着重要作用。尽管目前基于激光雷达的目标检测算法发展迅速,但直接将现有的路侧模型应用到新的场景中会出现严重的性能下降。直接对未知数据进行标注可以解决上述问题,但是需要花费大量时间和资金成本,严重限制了路端感知的发展。因此,高效的迁移学习算法对实现激光雷达感知的多场景泛化性具有重要意义。
二、研究内容
1. 建立基于跨域时空特征匹配的路端无监督跨域3D目标检测框架:提出基于跨域时空特征匹配的路端3D目标检测无监督学习方法 ,并基于DAIRV2X、V2X-Seq、RCooper 3个数据集的路端数据对提出方法进行测试。
图1 基于跨域时空特征匹配的路端无监督跨域3D目标检测框架流程
2. 进行考虑路端域差异的泛化模型训练:在网络中嵌入特征级降噪等算法调整,搭建面向路侧的预训练网络RoadPillars;从分析交通流在不同路口的点云几何特征差异切入,提出一种量化表征路端不同域偏差的方法。
图2 RoadPillars主干网络特征变换
图3 不同路端视角下的点云形态分类实降雨场景
图4 不同路端数据集的目标点云形态分布
3. 开展实验:采用DAIR-V2X 、V2X-Seq 、RCooper3 个数据集进行测试,以平均精度(average precision)、迁移能效(closed gap)、标签误差密度分布以及计算耗时作为评价指标,并预训练3个模型。
图5 3个路端数据集下不同路口数据对比
表1 不同预训练网络3D检测精度对比
三、研究结果
1. 实验结果显示,直接把源域模型用于目标域,检测精度骤降40%–70%,证实域偏差是阻碍路侧3D预训练模型迁移的核心因素。
表2 两个迁移任务下的无监督域适应测试结果
2. 时空特征匹配无监督方法在两测试场景的多项指标上全面领先,Hard设定下分别超出ReDB达24.2%与8.0%,显著提升了路端3D目标检测的跨场景泛化性能。
图6 V2X-seq到Dair-V2X数据集迁移对比结果可视化
图7 V2X-Seq(左)与RCooper(右)背景分离
3. 论文提出方法误差集中于0–0.8,显著小于对比方法,且伪标签误差分布与最终结果一致,表明提升伪标签质量是实现高精度迁移的关键。
图8 检测结果(左)与伪标签(右)的误差分布
四、创新点与意义