您的位置：经济财融网 > 热点 > BEV感知与智驾方案-上｜盖世大学堂舱驾、行泊一体系列知识讲解

BEV感知与智驾方案-上｜盖世大学堂舱驾、行泊一体系列知识讲解

来源：盖世汽车

浏览量：6845

时间：2025-02-18 05:09

阅读量：7076

自2020年开始，BEV感知技术在自动驾驶领域崭露头角，其核心优势在于实现全方位环境感知，有效弥补了传统单目摄像头的局限，通过多传感器融合与高级算法，显著提升了车辆在复杂路况下的感知精度与安全性。

一、BEV感知的业界现状智驾方案的发展与BEV感知的兴起

自动驾驶技术不断发展，BEV感知在其中扮演着愈发重要的角色。在2020年之前，L2辅助驾驶系统主导着自动驾驶市场，其功能主要包括自适应巡航、自动紧急刹车(AEB)和车道保持辅助(LKA)等。这些功能主要聚焦于车辆前方的感知，通过单颗前置摄像头即可满足需求，此时对车辆周身360度感知的需求并不强烈，BEV感知的应用场景较少。

随着技术的进步，高速NOA和城区NOA等具备更高级功能的系统逐渐出现，这些系统增加了自主超车、无保护左转等功能，对车辆的纵向和横向控制提出了更高要求。为实现这些功能，传感器布局从单一的前视摄像头转变为360度环视布局，以获取车辆周身的动静态信息，满足复杂场景下的感知需求，这推动了BEV感知的发展。

BEV感知的技术演进

在BEV感知概念明确之前，从2D图像感知结果转换到3D空间的过程主要基于规则或半规则的方法。这些方法依赖平面假设、相机内外参以及相机之间的匹配关联关系，将车道线或动态物体转换到车辆坐标系空间，但存在诸多问题。例如，平面假设在上下坡等场景中不成立，导致测距误差；相机抖动会影响转换的准确性；跨视角检测的一致性差，给下游应用带来困难。

在泊车场景中，早期采用IPM全融合方案，基于平面假设将图像逆投影到地面并拼接成2D图进行感知，但该方案对车辆抖动敏感，依赖后处理。而BEV中融合方案则在特征层面进行融合，输出直接在3D空间，具有更好的一致性，但网络学习难度较大。

特斯拉是BEV感知的重要推动者，其坚持纯视觉路线，硬件配置多年未变，如Hardware 3.0升级到4.0，摄像头配置基本稳定。特斯拉的BEV感知网络效果出色，关键在于其强大的数据闭环能力。其网络结构包含backbone、空间融合模块、时序融合模块和任务head，采用transformer结构进行空间融合，利用Spatial RNN进行时序融合，并通过Rectify层对相机外参归一化，提升感知性能。

数据标注与行业差距

数据标注是BEV感知发展中的关键环节。在传统感知中，标注在图像空间进行，简单且成本低。但BEV感知的输出在3D空间，标注难度显著增加，尤其是动态重建，纯视觉方案下的难度更高。

特斯拉采用自动标注为主、数据仿真为辅的标注方式，利用庞大的车队构建影子模式，收集车辆与驾驶员操作的差异数据，实现高效的数据采集和闭环。相比之下，国内主机厂和软硬件供应商虽也在积极开展BEV感知模型和数据闭环系统的研发，但在基础设施等方面与特斯拉仍存在较大差距，整体处于追赶阶段。

二、关键的BEV感知任务BEV感知网络的基础模块

BEV感知网络主要包含空间融合和时序融合两个关键模块。空间融合负责将2D图像像素空间的检测结果转换到VCS空间，保证测距精度；时序融合则融合前后的持续信息特征，对静态物体的重建进行增强，为动态物体的跟踪、预测等任务提供基础，还能利用历史信息进行补遮挡操作，实现类似基于AI的slam建图功能。

BEV空间融合的方法

1. IPM方法:IPM方法假设地面是平面，基于底层几何的可逆性，将图像上的像素点对应到平面上，计算效率较高。然而，该方法存在明显局限性，它对地面平坦和目标接地有严格要求，一旦不满足，如遇到非平面地面或空中目标，畸变会很严重，远距离感知效果也较差，有效范围通常在三五十米左右，因此更适用于泊车等近距离场景。

2. Depth方法:Depth方案是一种自底向上的方法，通过预测每个像素的深度或深度分布，将图像特征反投到3D空间，从而获得3D特征和BEV空间的feature。这种方法能得到稠密的BEV表达，但在3D检测时通常需要NMS后处理，存在超参数优化困难和无法端到端的问题。此外，其基于单目深度估计的泛化性和性能有限，有效距离也在50米左右，计算量较大，目前应用相对较少。

3. Transformer方法:Transformer方法是当前的主流方案，它是一种自顶向上的方案，通过query和attention机制直接从全局信息预测动态或静态结果。该方法具有诸多优势，如易于实现端到端、便于多传感器融合、可将地图信息融入网络以扩大感知范围和精度等。

Transformer方法根据query的密集程度分为sparse query和dense query两种。sparse query计算量较小、效率高，适合检测类的稀疏任务，如动态物体检测；dense query有稠密的中间态表示，可进一步进行特征提取和数据增强，更适合语义分割等任务，但计算量较大，受感知范围限制。在实际应用中，dense query方法更为通用，但在平衡感知距离和精度时面临挑战，需要谨慎选择BEV空间的分辨率。

BEV时序融合的方法与作用

BEV时序融合最初用于解决遮挡问题，通过利用历史信息，使网络能够判断被遮挡物体的存在。在端到端的自动驾驶系统中，不同阶段都需要时序信息。例如，tracking需要时序上的关联来跟踪目标物体，prediction则依赖当前及历史信息预测未来物体的轨迹和状态。

实现BEV时序融合的主流方法主要有三类。Dense BEV方法，如BEVFormer中的方案，根据车辆不同时刻的pose，利用内外参直接将feature投影过去并累积；Perspective方法会在每个cell中取点，将其投影到历史帧中，获取采样点的feature并拼接；Object-centric方法以物体为中心，预测物体上的点，采用物体跟踪的方式融合feature。从Dense BEV方法到Perspective方法再到Object-centric方法，处理的点逐渐减少，处理效率逐渐提高。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

分享到微信

曾毓群再度参加“重量级”民企座谈会，宁德时代已从A股新兵变成万亿“宁

2月17日，一场重磅的民营企业座谈会在北京召开。据央视新闻视频报道画面，参加座谈会的民营企业家包括:宁德时代董事长曾毓群、阿里巴巴创始人马云、飞鹤乳业董事长冷友斌、正泰集团董...
2025-02-18 01:46
教育板块迎“AI革命”！投资逻辑重构？

教育板块集体上涨！ 2月17日，A股市场飘红。受AI概念辐射，教育板块集体上扬，Wind教育指数收涨5.74%，领跑大盘，板块内多股涨停或大幅收涨。券商中国记者注意到，近期，多...
2025-02-18 00:58
多股放量巨震！

2月17日，市场主要指数小幅收涨，沪指上涨0.27%，A股全天成交额1.97万亿元，较上一日放量2270亿元。盘面上，农机、人形机器人概念表现强势，教育、智能医疗、腾讯概念等AI...
2025-02-18 00:07
瑞新康达RESCOND与沃尔沃AED道路使者联盟携手，助力上海体博会

2024年11月28日，2024上海体博会盛大开幕。上海体博会也是国内首个将体育产业、体育消费、体育赛事、体育文化四者融合的大型体育博览会。活动期间，来自全球200多家汇集经典与...
2025-02-17 23:38
生态为基清华“凌云沪上”支队开拓低空经济新航道

:近日，清华大学水利系、航天航空学院、教育研究院成立的“凌云沪上低空探航”联合实践支队，以“低空经济建设与空天地一体化在生态领域的建设进展”为主题，先后在隧道股份城建设计集团、华...
2025-02-17 22:36

头条

46.1万公里国家公路网规划将燃爆3

成品油市场新风口！华为已入场

图文

拥抱标准化，卤巧儿弄潮卤味市场

政策红利提振汽车消费长安汽车销量实