特斯拉FSD能像人一样开车了,上下班通勤,人坐着就行?
路咖汽车 | 01-27
23924
特斯拉刚刚大面积推送的FSD V12,可能就是纯视觉感知方案的大招。坚持纯视觉快2年左右的特斯拉,在激光雷达价格大缩水的前提下依旧坚持着做纯视觉感知的高阶智能驾驶,在FSD V12正式推推送之前,已经有很多人开始期待着这次更新。
最为重要的原因是,特斯拉反复强调FSD V12将实现全新的“端到端自动驾驶”,第一次开始使用神经网络进行车辆控制,包括控制转向、加速和制动。不像之前的FSD功能,已经不需要超过30万行的代码,而是进一步提高对神经网络的依赖度,减少了对编程代码的依赖。也正像马斯克之前所说,这次的更新,自动驾驶系统将会实现从头到尾都是AI来实现的。
视线拉回到国内,从去年就已经传出来FSD在国内市场落地的可能性,而且已经开始了一定区域内的实车测试。这也意味,更新的FSD V12版本,我们也很有可能体验到。
FSD V12,有何不一样?
从FSD V11.4.9更新到FSD V12,这套智能驾驶系统其实发生了很大的变化,可以说是底层逻辑上进行了非常大的调整与升级。虽然马斯克之前就预告过FSD V12改变了技术路线,但,特斯拉其实去年初才开始训练这个基于神经网络的智能驾驶算法。然后,一年左右的时间,全新的FSD V12已经在美国市场开启了大面积推送。整体来说,特斯拉FSD V12这次更新的核心只有一个,没有规则代码,只有神经网络。
这是什么意思?
市面上最常见的自动驾驶系统,大部分仍然采用分模块的设计,把感知层、决策层以及控制层,分为三个模块,各个模块内采用各自的算法模型来完成设计需求。在这其中,AI算法主要是应用在感知模块中,决策层和控制层面还是常规的代码逻辑,也就是算法工程师编写的代码,会给自动驾驶系统建立一套规则,例如红灯停车、绿灯通行、保持在车道线中间行驶这些规则来维持整个智能驾驶的行车边界。
这么看,这套系统以及代码编制的规则,中规中矩,挑不出问题。但,实则是有一定缺陷,规则的设定是由工程师设定,驾驶风格很容易和驾驶员习惯不想匹配,所以也就有了我们在使用高阶辅助驾驶时候的不适感,很多人觉得大部分工况下不如自己开着顺手。
而特斯拉FSD V12只有神经网络的加入,逻辑是对以往的感知层、决策层以及控制层这三大模块统统打开之间的权限。只要确定神经网络架构,然后输入采集到的数据训练就行。
简单理解,是FSD V12把摄像头收集到的图像数据,输入到神经网络中,神经网络能够直接输出车辆控制的指令,比如转向、加速、刹车等,更像是一个人类的大脑,90%以上的决策都是由神经网络发送的。
逻辑就是依靠车身的摄像头视觉输入,就能分析思考,输出控制策略;这么来看,确实不再需要高精地图、激光雷达这些软/硬件的加入。从分模块设计,到端到端,这背后其实是一条技术路线的改变,从规则驱动,到数据驱动。
用起来及格,但优化容易了
在大面积推送之前,在海外市场先发了一波Beta版本的FSD V12,并且有部分车主已经使用过很长一段时间。
在FSD V12的实际应用过程中,视频信息显示能顺滑的完成避开车道内停止的车辆、能左转/右转后变道、能按停止标识刹停、在斑马线前礼让行人,如果车辆行驶目的地在单行道左侧,车辆可以直接靠左停车;路测停着的车突然并线,可以完成躲避并超越突然出现的车辆,在夜间也能完成如此操作;还有,在红绿灯路口能够顺畅的无保护左转;绕行路上施工标识。
即便能够完成诸多操作,并且能够顺利完成,但体验过FSD V12的驾驶者对此给出的结论,是相比于FSD V11.4.9更新后的V12.1.2需要更频繁的驾驶员接管。如交叉路口,如雨雪天气下等条件这套算法的能力还需要进一步的加强。之前马斯克实机演示直播的时候,19分钟的红绿灯接管,就用的FSD V12版(Beat)。
但其实优化起来只要用模型堆量就好,值得注意的是由于端到端技术在架构上的简洁,使得FSD系统变得空前的干练,比之前传统智驾系统模减少了30万行的C++代码量,可维护性更强,而且优化起来更加方便。
对于特斯拉智能驾驶的逻辑切换,V12版本在实际应用阶段仍然存在不足,但我们看到的是在纯视觉感知方案下,能做到不错的城市NOA实际工况已经是一个不小的突破了。
如何看待,适合其他品牌吗?
其实早在特斯拉宣布FSD V12变为端到端技术路线之前,类似的概念,已经被提及过了。原因是端到端的方案,相比其之前的各个层面模块化的组合,不需要海量的代码来设计行驶规则。只要不断输入人类的驾驶车辆数据,系统自己学习就可以。
但是,看似简单的入门条件,其实对数据要求非常高。
虽然不用海量代码,但需要输入质量相当高的驾驶数据,才能更好的帮助系统学习。在去年年初,特斯拉已经向这套神经中枢系统里输入了1000万个人类驾驶视频,而这些视频数据都是经过筛选的,而且都采集于那些驾驶技术不错的驾驶员。
对于海量的数据、数据标注、算力来说,都是非常大的挑战,这条路能走通的话也不适用于小型企业,需要投入非常庞大的人力。另外一个核心问题,端到端的技术没大规模普及开来,是自动驾驶系统的不可解释性。
例如在模型训练当中,出现不好的驾驶习惯或者测试时出现系统处理不好的路况下,没人能解释清楚问题的根本原因。现在特斯拉的解决方案,只能是针对性的多喂同类的数据,例如之前测试中路口停止标识之前是车辆停止的距离路口过远,就多投喂这类数据来进行学习。
从而诞生了一个新的问题,系统的学习是好的、坏的驾驶习惯都会学习,可能会学到不符合规则的驾驶行为。这目前还是一个有待干预或者规范的问题,应该是从学习数据上着手干预;但培养一个模型的学习能力,应该是按月或按年来算,这点应该很好避免。
总之,特斯拉FSD V12的面世对于自动驾驶来说确实意义重大,尤其是纯视觉感知方案。但是特斯拉的作业其实并不好抄,门槛低但技术壁垒极高,尤其是隐性成本。我们看到的显性成本是传感器、芯片便宜,但拿掉激光雷达之后,算法、路测、大量数据收集与标注、云计算、仿真训练等,这些都是成本投入的入口,算下来可能并不比激光雷达省钱。
现阶段FSD V12版本做到的效果,并不是一两年内达成的,而是长达十多年左右的研发与训练才“喂养”出来的产物。特斯拉坚决走纯视觉路线,企业规模能承担以上所有成本,规模化量产省成本拿掉激光雷达做高阶智能驾驶没有任何问题,但其他车企是否都要走特斯拉的纯视觉方案,最终要量力而为。
至少从现阶段看,激光雷达是城市NOA落地的加速器,对于其他车企更合适。而且特斯拉FSD这种视觉+神经网络的智驾模式,到了国内,可能还得需要从零开始学习,路况复杂性、标志物等信息,都是与美国市场完全不一样的。