转自:特斯拉
自特斯拉CEO马斯克访华后,特斯拉FSD(完全自动驾驶)有望落地中国的声音就不断传来。
马斯克近期对FSD即将发布的三大版本进行预热,其中,几乎完全重新训练了模型从而改进了舒适性的V12.4版本将在本周发布。马斯克称这些版本更新“令人震撼”。
回顾特斯拉自2021年发布FSD Beta版本(测试版本)至2024年发布FSD V12(Supervised)版本(受监管版本)以来走过的3年路程,马斯克把FSD的30多万行代码删到只剩下2000多行。而这背后,是FSD“端到端”的全新升级。
也正因如此,“端到端”“BEV”“Transformer”成为了智能驾驶圈中的热词,引发车企的争相研究,华为、小鹏、理想、蔚来等车厂均确立了BEV方案。
与此同时,已经有多家车企敢于向FSD挑衅。此前,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东就公开表示,智界S7的智能驾驶系统与特斯拉FSD相比仍然是全世界最好的。有分析师向记者表示,特斯拉FSD需要依靠大量图像信息升级,就中国某些独有工况而言,确实短期内可能无法与本土车企相媲美。
特斯拉公开表示,未来自动驾驶功能将无需人类监督即可实现,但这需要数十亿英里的行驶里程的验证,以达到远超人类驾驶员的可靠性。而在特斯拉升级的爬坡路上,国内车企能否借助本土优势超越甚至围剿,仍值得期待。
删除30万行代码 给AI装上神经网络
诞生三年,FSD早已今非昔比。今年3月,特斯拉FSD进行了全新升级,实现了“端到端”神经网络技术。
此前,“有多少人工,就有多少智能”这句话一度在智驾圈广为流传,这背后的意思是人工智能需要人类工程师发现并筛选问题后,将问题喂给智能去处理,工程师编写规则的速度决定了人工智能的处理速度,特斯拉为此写了高达30多万行C++代码。
但如今,特斯拉不再将AI分为一个个模块,而是给了它一个神经网络。采用BEV(Bird's Eye View,鸟瞰模式)、Transformer(一种新型神经网络架构)的技术架构,特斯拉实现了“端到端”。
简而言之,特斯拉仅仅依靠摄像头获取图像数据后,可以自己输入进算法,再自己输出加速、减速等指令。由此,AI可以进行感知并模拟人类的驾驶决策,按照人类的方式控制车辆。
马斯克在2023年7月提到,特斯拉在一个季度内向FSD输入了上千万条人类驾驶视频,而且不断从车上获取新的视频来训练,“它的表现变得令人难以置信”。
从好的一面来看,马斯克宣布特斯拉把这30多万行删除到只剩下2000多行,FSD从某种意义上更接近人类大脑了。
这是一种更精简的算法。主机厂硬件工程师梦威举例说,同样是在闹市区进行自动驾驶,激光雷达的方案是将人扫描出来,同时依靠视觉来捕捉动态和距离,最后由芯片进行计算。在这个过程中,车辆既使用了激光雷达,又用视觉算法来进行比对,有了冗余设置、双重确认。而FSD基于纯视觉也能达成同样的目的。
而从困难的一面来看,这种方法依旧对车企的算力提出了极大要求。特斯拉背靠Dojo超级计算机,但国内车企能否复制经验还很难说。
2023年7月,Dojo超级计算机正式投产,FSD拥有了更强算力支撑。特斯拉方面称,Dojo的启动并运行让FSD Beta呈现“指数级提升”。
这个算力有多强?特斯拉当时预计2024年2月公司算力规模将进入全球前五,10月算力将达到100 E FLOPS。相比于国内厂商,特斯拉的目标高得让人惊讶。
E FLOPS是指每秒百亿亿次浮点运算次数。与之相对应的是,华为在去年12月云端算力为2.8E FLOPS,今年4月上升到3.3E FLOPS。蔚来与阿里云、英伟达合作,算力在1.4E FLOPS左右。理想汽车和火山引擎合作,算力为1.2E FLOPS。小鹏与阿里云合作,算力为0.6E FLOPS。
此外,中泰证券还提到,目前国内大部分玩家的BEV+Transformer仍处于落地初期,数据收集和模型算法迭代尚未成熟,仍需高精地图辅助,但高精地图短板明显,采购成本、维护成本高。BEV+Transformer的优势以及高精地图的固有短板决定了“轻地图/去地图”是车企加速推广城市NOA(Navigate on Autopilot,领航辅助功能)的必选项。
激光雷达成本不断下探 技术路线之争一触即发
在车企争相研究“端到端”的背后,纯视觉方案与激光雷达之争由来已久,此次特斯拉FSD若能入华,比拼一触即发。
特斯拉采用的纯视觉方案依靠多颗高清摄像头采集信息,纯视觉方案核心优势在于成本低、量产更快,但缺点在于更难掌握障碍物的三维位置信息,在雪天等光照不佳的情况下识别物体,对白云、白色货车等物体识别效果也一般。
国内车企多采用激光雷达、摄像头、毫米波雷达、超声波雷达的融合方案实现智能驾驶。
激光雷达通过发射激光束并接收反射回来的信号来测量物体与车辆之间的距离、速度和角度等信息。而超声波雷达主要用于车辆短距离测量,如泊车引导等。
如今,国内市场不仅卷价格,更在卷配置,甚至出现了部分“饱和式配置”,一辆车可以搭载8个甚至12个超声波雷达。
麦肯锡此前数据显示,随着智能车从L2发展到L4,车载传感器的数量将从平均8个上升到平均24个,其中激光雷达搭载数量将上升到平均4个。
主机厂硬件工程师梦威向贝壳财经记者表示,从成本的角度来说,国内车企可能会为一辆车配备短距雷达、长距雷达,甚至为部分高端车型专门配备零部件,成本非常高。余承东就在今年提到,现在搭载华为高阶智能驾驶系统的车,售价低于30万元都是亏损的。
不过目前激光雷达的价格也确实呈现出了明显下降趋势,曾经每颗价格上万元,如今较为便宜的型号降到了3000元左右,随着装车率的不断提升,未来价格还有下降空间。
由此,激光雷达不再是高端车型标配,智己L7、极氪001、理想MEGA等价格区间在20万元的车型也纷纷装备了激光雷达。甚至于在今年3月,小鹏汽车董事长、CEO何小鹏就提到,小鹏将在一个月内面向全球推出10万至15万元新品牌A级产品,将搭载小鹏高等级智能驾驶系统。
不过特斯拉纯视觉方案的成本更低,单个摄像头成本大约300元,摄像头总成本不到2000元。
本土化适应尚需时间
特斯拉FSD此前迟迟未能进入国内市场的原因之一,在于纯视觉方案需要通过摄像头采集道路标志和信息,这些数据传回数据中心后,会让算法进行筛选、纠正和学习,也就是说,全世界行驶的特斯拉都会将数据传回中心,让AI学习后再进一步升级。
举例来说,在一个特定的路口,每天都会开过几辆特斯拉。在雨天时特斯拉摄像头可能有雨滴,拍出来的限速指示牌不清晰,在大雾天摄像头可能在一定距离外拍不出指示牌,也有可能在开过指示牌时恰好有人经过挡住了指示牌。
但是只要有特斯拉在晴天视野良好时清清楚楚拍到过指示牌的正面,这些数据都会被一起上传到数据中心,从而帮助其他未能拍清的特斯拉驾驶。
同理,正在行走的人、坐在轮椅上的人、骑着自行车的人,都需要特斯拉在后台不断学习与分辨。“全世界的特斯拉都在‘喂养’FSD,都在给FSD源源不断收集海量数据,这也是特斯拉独有的优势,依靠全球销量优势来建立巨大的数据库,从而应对复杂环境”。
但是出于数据安全问题,特斯拉FSD进入国内的脚步较为缓慢,而这也为国内厂商带来了发展机会。
目前,特斯拉FSD收集到的更多信息来自于海外市场,尚未在国内收集足够的道路信息,主要依靠传感器融合来应对道路问题,视觉储备方案较少。
4月23日,余承东公开表示,智界S7团队专门前往美国,将智界S7的智能驾驶系统与特斯拉FSD相比,“在经过测试后,我们有信心,智界S7的智能驾驶系统仍然是全世界最好的”。
对于余承东此前在发布会上的“宣战”,梦威分析称,目前华为已经实现脱离高精地图的NOP方案,之所以可以在公开场合叫板特斯拉,华为必定是到美国进行了针对性测试,发现在某一些工况下,FSD还没办法与华为鸿蒙智驾相媲美。
梦威举例说,特斯拉FSD的主要数据来源还是在海外,而海外的停车场车位更大、人员更加稀少,可能系统处理大量人群的复杂情况、极窄车位没有太多经验。鸿蒙配备多个超声波雷达、激光雷达、摄像头,非常窄的车位也能完美处理,那在这个领域其确实可以说自己的方案是最强的。也有可能在大量人群交汇时,特斯拉FSD更加倾向于停车等待人群通过,而鸿蒙变道超车更加灵活。
梦威分析称,随着特斯拉采用端到端技术,我国车企已经显露出强化视觉的趋势,而目前FSD在本地经验还不足,未来能否与国内车企在智能驾驶上一战,主要看FSD的进化速度。
实际上,特斯拉曾提到,FSD需要数十亿英里的行驶里程验证其达到了远超人类驾驶员的可靠性。今年4月,特斯拉宣布FSD已经行驶了超过十亿英里,相比于2023年底的不到一千英里有了大幅提升。马斯克当即宣布,特斯拉FSD不久后将行驶超过百亿英里。
在FSD仍在进化的当下,我国车企能否赶上特斯拉脚步,甚至不再被动接招,而是超越、围剿,仍值得期待。
新京报贝壳财经记者 林子
编辑 岳彩周
校对 刘军
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)