奇点汽车黄浴：将在近期内实现L2落地两年内实现L3|高交会_新浪财经

奇点汽车美国研究与创新中心首席科学家兼奇点汽车美国公司总裁黄浴

　　新浪财经讯 “第二十届高交会-中国高新技术论坛”于2018年11月14日-16日在深圳举行，本次论坛的主题为“坚持新发展理念、推动高质量发展”，奇点汽车美国研究与创新中心首席科学家兼奇点汽车美国公司总裁黄浴出席“科技引领美好生活”主题论坛并演讲。

　　黄浴介绍，奇点汽车的自动驾驶理念是通过强大的计算平台和灵活的感知能力，以及先进的车体控制各方面来实现自动驾驶。通过云计算和大数据处理能力，逐渐将自动驾驶从L2升级到L4，使我们的汽车能够变成真正的“轮式机器人“。短期目标是以L2为落地，两年之内的目标是实现L3，更长远的目标是实现L4功能。

　　以下为演讲实录：

　　黄浴：大家好，我今天来给大家介绍一下奇点汽车自动驾驶方面的工作。主要分两部分，第一，我想介绍一下竞争对手或者是行业上的相关工作，第二，回顾一下奇点汽车目前所做的一些工作。

　　先看一下半年内都发生了什么，首先Nvidia刚刚发布了新的安全报告，Nvidia并不是一个做自动驾驶直接商业落地的公司，而是通过销售自己的计算平台或者说解决方案。另外，它最近刚刚推出了drive 1.0，供用户测试；同时优步也公布了最新的无人驾驶安全报告，在此基础上它向加州重新递交了无人驾驶测试许可。也就是上个月，Nvidia已经在销售L3计算平台Xavier，这个月应该销售L4计算平台Pegasus。

　　深度学习在自动驾驶方面不断有新的模型推出，这半年内深度学习在继续往前发展，尤其是自动驾驶领域。谷歌以前提出了一个BN功能（Batch Normalization），已经是深度学习训练的标配，而最近商汤科技提出了IBN网络，这个网络相当可以，我们发现它的功能使以前的深度学习的训练性能得到了进一步提升；还有一个，Lanenet，用于车道线检测的新模型，它的代码已经开源；另外一个是Yolo3出现，当之前大家都在纠结目标检测是一步法还是两步法的问题，Facebook当时有一个著名科学家何凯明提出了一个新的方法RetinaNet，利用Focal loss改进了算法，这个创新解决了一步法和二步法之间的纠结；但Yolo3出现告诉大家，一步法一样可以做到很好的检测性能，而速度也相当快。另外一个是CornerNet，把对bounding box的位置大小估计变成其两个角点位置的估计，实验验证这个思路能更加提高检测性能。

　　最近半年内对高清地图的研发和市场反应增热非常，刚才周光也讲了他们roadstar最近这个方面的新工作。高清地图的发展一直存在两条路，一条是高成本的激光雷达方法，还有一个是低成本的摄像头之路。谷歌和一些大的地图厂商，像高德，四维和百度他们都在走激光雷达高清地图制图方法，而Mobileye和Tesla走的是低成本的地图制图方法。至于这两条路，选择哪条路更合适也没有定论。从奇点汽车来说，我们作为量产汽车角度来看，而且我们并不是地图制造商，但我们更加倾向于能够寻找一个成本合理的地图制造方法。

　　这半年也出现了更多的开源数据库，对于小公司来说标注数据是一个非常大的开销，研发机构推出来的开源数据库，其实对于小公司来说是非常好的事情。最近5G标准已经出来了，车联网变成一个马上可以付诸于实施的东西，车联网的出现让车路协同成为可能，可以降低我们感知的难度，会成为辅助自动驾驶研发的热点。

　　在自动驾驶商业化道路上，最成功的典范应该是特斯拉，但最近的消息有两个需要注意的：一是特斯拉刚刚下线了“完全自动驾驶”；前一段时间他们的Autopilot总监Andrej Karpathy在一次演讲中提到自动驾驶软件2.0思路，完全是采用端到端的机器学习方法解决自动驾驶的众多难题；这里我们可以猜测，感觉Tesla端到端的机器学习方法在自动驾驶实现还是有一定难度；其实更多自动驾驶研发工作还是采用模块化方法，如从环境感知，地图定位以及规划控制决策，这样把自动驾驶变成一个个模块研究问题，并且给出针对各个模块的最优解；二是特斯拉又发布了新的Autopilot版本，称为Navigate on Autopilot；它加上了GPS导航实现点到点的路径规划，同时加上了高速进出闸道的自动控制能力；按照这个公司以往的做法，我们可以认为特斯拉很有可能把这个作为其L4级自动驾驶的雏形。

　　我想说的是，在我上次（半年前）讨论的基础上，现在我们认为感知仍然非常重要，虽然现在的感知工作出现了一些清晰的结果展示（如检测识别），同时有一些人甚至认为真正挑战性的东西在决策和规划上面，但我们的判断是感知问题还是远远没有彻底解决，因为需要环境感知的很多细节没有暴露出来，比如我们不仅仅对一个车定位，我们更加关心对这个车运动的倾向性。对于行人的倾向性，我们也可以看到，行人的任何肢体动作，表情动作都会带来对其行为的预测。这些是非常细的感知信息，而这种信息都需要感知算法提供解决方案。

　　对于规划控制来说，我们需要很多决策模型，而这种决策模型的产生仍然需要大量数据学习得到，这种模型不是那种简单的rule-based模型，而是数据驱动的更深层模型，它能够描述更复杂的主客体行为，包括车的行为模型或者行人的行为模型。

　　下面介绍一下奇点汽车目前的自动驾驶所做的工作，首先我们采用了中美两地共同开发的开模式。现在我们有一个团队已经在L2即ADAS方向工作了好几年，即将在我们量产车上得到展示；我们的X-lab主要放在苏州研发中心，和美国研发中心同时开发更加高级的L3-L4自动驾驶功能。

　　现有的自动驾驶组成员在系统架构，环境感知，规划控制，仿真模拟，机器学习，地图定位，软硬件开发等方面从事自动驾驶工作，这些成员的工作背景来自于以下的著名公司，如百度，华为，联想，博世，宝马，百利得，英特尔，三星，现代，ABB，Civil Maps等等。

　　打一个小广告，明年3月份在IEEE多媒体信息处理和检索的会议上我会主持一个自动驾驶研讨会，邀请了几位专家，包括刚才路星自动驾驶公司CEO佟显乔，微软主任研究员和主任经理姜浩（姜博士曾是自动驾驶公司AutoX的第一号员工，之前是Boston College的副教授），最近刚刚融了3000万美金投资的做激光雷达的创业公司Innovation CEO鲍君威，百度高清地图主任架构师宋适宇，还有Foresight AI创业公司的CEO袁昌（他创业之前是苹果无人驾驶组的资深研发经理，也是亚马逊无人商店项目AmazonGo的研发经理）等专家，我邀请的这几个专家会坐在一起探讨目前自动驾驶面临的挑战和问题。

　　奇点选择自研和第三方合作的方式推进商业落地，另外我们奇点汽车选择Nvidia自动驾驶平台，而没有选择市场上普遍采用的Mobileye平台，是因为Nvidia平台更加开放，可以为用户提供灵活的合作方式，我们可以在不同层次和它进行合作，随着这个平台硬件的升级，我们也可以提高自动驾驶的计算能力，所以这就是为什么我们选择了Nvidia的自动驾驶平台。

　　我在半年前报告中也提到自动驾驶的研究方式基本是分为两派，一派是谷歌模式，是互联网公司的研发模式，其实很多公司都走这种模式，就是直接进入L4开发自己的自动驾驶系统，相对来说这条路成本会高一些，另外对地图的依赖也更高一些；另外一派是尽快商业落地的特斯拉模式，包括Mobileye，它们都是比较轻看地图，主要以低成本解决方案为主，会采取摄像头和雷达的组合解决目前自动驾驶面临的问题。

　　应该说高清地图确实给我们提供了先验知识，在自动驾驶领域某种程度上降低了车在定位和环境感知的困难，但是我要说，实际上高清地图仍然是一种过渡存在方式，并不是终极方式。我们需要高清地图完全是因为感知方法不太好，当我们学一个老司机的驾驶，而老司机对很多细节的把握，目前的计算机算法还做不到，所以我们需要高清地图的配合，使某些场景可以被定义以实现自动化驾驶。

　　这个ppt展示的是我们奇点汽车的自动驾驶理念，通过强大的计算平台和灵活的感知能力，以及先进的车体控制各方面来实现自动驾驶。通过云计算和大数据处理能力，逐渐将自动驾驶从L2升级到L4，使我们的汽车能够变成真正的“轮式机器人“。我们是从用户刚需方面入手，最后完成自动驾驶的场景落地。

　　我们的短期目标是以L2为落地，两年之内的目标是实现L3，更长远的目标是实现L4功能。我们的配置，计算平台，硬件基本能够满足L4开发的需求，其中包括和Nvidia计算平台的合作，我们的研发是通过算法的更新和软件的更新即OTA，实现整个自动驾驶系统的迭代升级。

　　这是我们在L3、L4、L5的布局图，2019年底的时候我们会研发完成L3的解决方案，其中落地场景就是高速巡航和自动泊车，从低速和高速两方面寻找用户所需场景。对于L4的实现我们是分布做的，首先会引用地图的方式提高高速巡航的能力，同时在泊车方面会从自动泊车升级为自主剖车，这里只有一字之差其实主要是附加地图的原因：一个车可以自动在停车场搜寻停车位这是有地图导引的，这是和自动泊车是不一样的，这是定义在L4级别的。同时还有城市拥挤交通的自动巡航，L4级别自动驾驶方面需要不少其他模块的配合，包括交通符号识别，交通红绿灯的识别以及对车道线，道路标志的准确识别，这样可以真正实现拥挤城市交通状况下的L4，这里我们把研发的落地场景限制在以上这几个方面。

　　刚才宋先生也提到了L5的时间表，我也认为会晚一些，可能在2030年以后。同时，它需要5G支持整个车联网基础设施建设，包括强大的云计算和边缘计算的硬件支持，能够实现中央化调度管理，这些都是要整个政府的支持，以及在通讯和计算，包括物联网等服务设施的完备，这样才能实现我们期待的完全自动驾驶L5。

　　这是一个示意图，展示传感器的高度冗余和融合，包括摄像头，毫米波雷达和超声波，以实现系统从感知到定位，从路径规划到到决策控制的流水线。

　　我稍微介绍一下，奇点美研办公室其实主要在提供关键算法，包括基于深度学习的目标检测识别，还有关于自动驾驶的地图和定位，以及仿真环境的构建。这是一个结果图，上面行展示的是关于障碍物识别和交通标志检测的结果，下面行是对车道线的检测；这是一个摄像头做自动驾驶地图的结果展示；最后一个是仿真环境的一个结果展示。

　　奇点汽车开发自动驾驶的不同，在于我们互联网的背景更加重视用户体验，由此定义了一些自动驾驶用户刚需的场景，如高速高架，低速泊车，手机召唤，远程调度，友善的人机交互和多风格的驾驶行为选择。再一次重申，我们下一步的目标是，2019年实现L3级别的自动驾驶！

　　谢谢大家！

　　新浪声明：所有会议实录均为现场速记整理，未经演讲者审阅，新浪网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

责任编辑：谢长杉

文章关键词：高交会科技峰会人工智能

我要反馈

相关专题： 2018中国高新技术论坛专题