随着自动驾驶技术的快速发展,越来越多的车企开始应用端到端大模型的技术路线。
在端到端的感知方案中,主要有两类技术路线:
我们认为,纯视觉方案更适配端到端模型的需求。
1
纯视觉 vs. 激光雷达比较一:迭代效率
与激光雷达相比,纯视觉方案的响应速度更快,算法迭代周期较短。
例如,小鹏P7+作为国内首款摒弃激光雷达的纯视觉端到端智驾车型,在上市首月即实现了0速激活、环岛通行、紧急转向辅助、拥堵换道等功能。
相比之下,华为ADS方案在经历了多次优化迭代后,才实现类似的功能。
2
纯视觉 vs. 激光雷达比较二:成本优势
纯视觉方案的成本大幅低于激光雷达方案。
根据小鹏管理层的指引,XNGP智驾系统(摒弃激光雷达)的成本预计下降50%。
在小鹏P7+的案例中,智驾传感器BOM成本仅约1.5万元,而搭载激光雷达的小鹏P7i的成本显著较高。
得益于更低的成本,P7+的售价降至20万元以下,使其在市场上更具竞争力。
纯视觉方案在中低端市场的竞争力更强,尤其是在毛利率方面,因其较低的硬件成本能够提供更高的利润空间。
随着激光雷达成本逐渐占据智能驾驶硬件总成本的10%以上,摒弃激光雷达的纯视觉方案逐渐成为首选的优选方案。
3
纯视觉 vs. 激光雷达比较三:激光雷达的盲区问题
目前,很多搭载激光雷达的智驾车型仅配备1颗FOV水平视角120°、垂直视角25°的激光雷达,无法实现360度全景感知。
相比之下,L4级Robotaxi需要至少5颗激光雷达以实现全面的感知。
大多数25-30万元及以上定价的激光雷达+大模型方案仍存在感知盲区,传感器数量、硬件算力以及算法能力仍有待提升。
4
摒弃激光雷达的关键:车端算力和算法突破
当前大多数汽车厂商采用后融合或特征级融合方案,将不同传感器(如摄像头、雷达、激光雷达等)的数据融合进行感知。
然而,这种后融合方案可能会带来信息延迟和丢失的问题,尤其当依赖激光雷达时,可能导致感知的准确性不足。
相比之下,前融合方案能够确保信息完整输入,但在算力和算法上要求极高,因此仍然是端到端技术应用的主要挑战之一。
前融合方案的车端算力需求通常在500-1,000TOPS之间,而后融合和特征级融合的算力需求则分别低于100TOPS和300-400TOPS。
因此,纯视觉+端到端的技术路线在算力需求上相对较低,而通过算法优化,仍能实现高效的感知和决策处理。
最终,突破端到端技术路线的关键在于算法的优化与迭代。
通过持续提升车端算力和优化感知算法,纯视觉系统能够在性能上逐步接近甚至超过传统激光雷达系统,特别是在动态、复杂环境下的表现。