撰文 / 张霖郁
编辑 / 涂彦平
设计 / 赵昊然
种种迹象都在表明,除了电池技术以及成本控制外,自动驾驶是未来车企一决高低的重要战场。
小米近期大规模地招聘自动驾驶人才,另外,在大家对Robotaxi开始保持冷静时,6月16日,Waymo宣布,在第二轮外部融资中筹集了25亿美元,Waymo曾在2020年筹集了32.5亿美元资金,这显示了投资者在自动驾驶技术商业化方面的耐心。
为期三天的中国汽车蓝皮书论坛,唯独自动驾驶这个话题设置了专场,6月10日的分论坛,整个下午,从单人的演讲嘉宾到圆桌论坛都在讨论自动驾驶,共有15位来自整车厂和自动驾驶科技公司的负责人贡献了真知灼见。
目前,自动驾驶行业大家似乎达成的一个共识是认为场景的打通是最重要的,至于L2+,还是L2++,L3或L4并不是当务之急最重要区分和解决的事,事实上,因为法规、安全等因素的限制,主机厂很难笃定官宣自己的高阶自动驾驶功能。“L4的体验,L2功能,或者预埋L4的硬件”,这是中国蓝皮书论坛反复听到嘉宾们的说法。
“什么叫场景打通呢?大家都知道,过去的辅助驾驶,很多车上都有,ACC这样的功能,但问题是很多的功能都是一些非常割裂的,大家要去判断,我什么时候这个功能可以开始用,什么时候那个功能开始使用,用户体验并不好。” 禾多科技创始人CEO倪凯说。
他认为自动驾驶功能广泛运行比小范围的无人化运行在现在这个阶段更重要。
“为什么呢?我们认为更广泛的运行,才能够真正的有更多的数据迭代出真正逼近无人驾驶的算法。可能大家要问,怎么去实现这样广泛的运行?也就是所谓的大规模的搭载。优秀的体验其实非常重要,这样的体验体现在我们整个场景的打通,也体现在很多用户的一些痛点的场景的问题的解决。”
以下是倪凯的演讲内容。
大家好,我是禾多科技的创始人倪凯,今天我给大家分享的题目是“自动驾驶全场景的量产落地”。
我们先来看一下什么是我们所说的全场景的自动驾驶?大家都知道,Waymo是最早做城市无人驾驶的公司,去年晚些时候,特斯拉开始在城区释放FSD的功能。很多人都在问,为什么Waymo都在城区做了十年的无人驾驶了,特斯拉还要在这样一个时间点上去往城区的自动驾驶做?
场景打通更重要
今天我汇报的前半部分来解释一下我们理解的未来自动驾驶的一些方向和背后的逻辑。
首先我觉得有一点可能行业里面越来越形成共识的就是所谓的场景打通比级别更重要。什么叫场景打通呢?大家都知道,过去的辅助驾驶,很多车上都有,ACC这样的功能,但问题是很多的功能都是一些非常割裂的,大家要去判断,我什么时候这个功能可以开始用,什么时候那个功能开始使用,用户体验并不好。
我记得第一次开特斯拉的时候,有一点印象非常深刻,甭管是高速还是城区,可能城区差一些,但是这个功能还可以开起来,当然这个背后我觉得是需要自动驾驶技术真正支撑全场景,但是反映用户体验上的一点非常关键,就是用户其实不喜欢一个割裂的自动驾驶的感受,所以我们认为全场景的打通非常重要。
第二点,我们认为广泛运行比小范围的无人化运行在现在这个阶段对于未来的自动驾驶、迭代更重要。为什么呢?我们认为更广泛的运行,才能够真正的有更多的数据迭代出真正逼近无人驾驶的算法。
可能大家要问,怎么去实现这样广泛的运行?也就是所谓的大规模的搭载。优秀的体验其实非常重要,这样的体验体现在我们整个场景的打通,也体现在很多用户的一些痛点的场景的问题的解决。
例如这边统计了一些消费者认为无人驾驶最需要攻克的一些场景,包括有一些泊车的场景,一些城市,拥堵、高速这样的场景。只有通过去把所有的这些场景打通,去把体验提高,用户才会有动力去购买我们这样的智能汽车,用户才会有动力去使用这样的功能,不然的话,这个功能可能放在车上也是用户永远不会开启的功能。
所以可以简单来说,我认为有时候可能慢其实就是快,怎么说呢?因为通过数据迭代升级,其实是一种相对来说比较慢的过程,我如果用Waymo的模式,装很多激光雷达。
我记得当时2013年的时候,百度做自动驾驶也是装很多激光雷达,很快就可以把一个小样跑出来,但是如果要实现真正的广泛运行,其实你是需要用一个相对慢的方式去实现大规模的搭载,而且更难的地方是在大规模搭载的同时,帮助用户创造价值,又能够保证用户的安全。
所以我们看到特斯拉现在的数据在L4上,领头的Waymo数据,不管是车的数量还是积累的里程数量,我们都看到了,通过这两年已经有了质的拉开的差距,这种差距最后会体现在所有自动驾驶演进的速度上。
全场景落地的挑战
做自动驾驶全场景量产落地,我认为还是非常有挑战的事情,尤其是大规模的运行。有几件事情是需要保证的:
第一件事情是怎么做一个安全可信任的系统?这个系统不是说自动驾驶厂商或者车厂来说就是安全可信的,整个市场端要反映你这个系统是一个安全的系统,可能政府也会有相应的对高阶层自动驾驶的规定、政策出台,判断这样的系统是不是安全可信任的系统?
第二个是可量产。
第三个就是商业模式的成立,因为我们在讨论百万量级,甚至是全行业千万量级的交付,必须有一个可以交付的商业模式。
自动驾驶领域,我们认为可量产是什么?不同的领域,可量产定义不一样。我们认为在乘用车市场上,可量产一定是能够通过未来五到十年,实现百万台级别的交付,能够覆盖百万平方公里级别全场景数据的回传。
这里面有两个关键点:第一个,需要有合理的商业模式,必须是赚钱的事,或者不是大规模亏钱的事,才能支持全场景大规模的交付;第二个是这个系统必须给用户产生足够多的价值,这样你的车才能卖出去,你也能够让用户支撑在大范围上开启功能。这两点都是非常重要的,对于可量产的定义。
禾多现在关注的就是全场景量产的自动驾驶企业,禾多的名字也是来自于移动的移,我们希望通过全场景量产的路径实现最后的无人驾驶。
打造本土数据驱动的自动驾驶量产解决方案,禾多是怎么思考的?我们大概会把我们的整个系统分成两部分。一部分是行车系统,还有一部分是专门解决停车场,或者最后一公里的系统。
这边也有一些简单的视频来展示我们之前做的一些高速,包括城区以及泊车。我们想法是在相对固定的量产配置上,给用户提供一个完整的、可以让绝大部分用户覆盖到的场景和体验。
禾多科技能做什么
具体禾多在哪些方面有一些思考?或者我们主要做什么工作呢?
第一个方面,我们聚焦在整个系统开发流程、功能安全、预期功能安全,这三个在行业里不是新的事情,但我相信等到这些事情会应用在自动驾驶系统里或者开发的过程里面,其实还是有很多挑战的。
那为什么我们要做?除了我们需要关注内因,也要关注外因。具体我们在很多的系统设计上,禾多也在做很多方面的思考。
从功能安全的角度来说,我们更多的会从顶层设计去实现各种安全状态的转移,包括各种失效状态我们如何进行降级,如何确保整个自动驾驶系统仍然处在安全的状态中。第二个是预期功能安全,预期功能安全最核心的是建立整套的场景库。
第二个方面,是整个车规级硬件的配置。硬件方面,和自动驾驶相关联的是两个部分,第一个是传感器。对于禾多来说,是以集成为主,传感器像毫米波雷达、相机、GNSS、IMU、超声波雷达这样已有的传感器。
第二个是整个车规级域控,禾多现在有两个方案,一个是几百T的大算力的方案,不仅支持L4,未来还可以支持全场景;第二个是几十T算力的性价比方案,而且短时间内迅速扩大用户使用量的方案。尤其是在真正要走量的方案上,几十T的方案上,甚至10T以下方案上,很多时候针对像素优化变成关键的一点,从这一点上,硬件转向软件开发如何与之相对应。
接下来就是我们有了这么多的传感器,我们的软件怎么做?软件名称叫法不同,可能有的叫多传感器融合算法,但其实我们看到最核心的就是我们所说的狭义的感知。
对于现阶段量产最关键的还是多源融合能力,因为我们现在传感器很多,如何把这些信息有效的结合起来?第二个是算法能力边界,这可能又回到了刚才说的广泛运行的概念上,如果我们不能做广泛运行,不能明确知道算法能力的边界,你简简单单跑几条街道,或者跑一个城市或几个城区,我认为相对来说还是比较容易的。
大家知道,最早为什么做视觉的Mobileye这么成功?本质上,我想是它向行业证明了在这么广泛的一个范围内实现了一些功能和产出。所以,基于一个已有的硬件探索算法极限,是整个关系到安全的长尾问题。
第3个是新型硬件的适配,包括4D的毫米波雷达,激光雷达,包括相机阵列。新的传感器不仅仅是做加法,它可能会进入下一个阶段。
除了狭义的感知以外,更重要的是广义的感知。包括地图一直是感知的一部分,如果你把车辆的位置信息和姿态信息也认为是感知信息的话,那定位也是一种感知,本质上它也是多传感器融合之后处理的一个结果。
第三就是预测,因为我们的世界是动态的世界,尤其自动驾驶从停车场、城区进军整个城市以后,运动的轨迹会越来越复杂。其实人开车也是衡量一个驾驶员是新司机还是老司机的核心的事情。
解决方案
下面是我总结的一句话,就是自动驾驶的一切Hack,本质上都是广义的感知能力不足。
后面简单展示几个视频,刚才也提到整个嵌入式平台的重要性,禾多我们也花了很多力气在车规级线路平台上布局自动驾驶整个感知的算法。这样一套系统能够在非常有竞争力的性价比方案上实现主机厂需要的自动驾驶功能。
第二个就是基于因子图的紧耦合的定位方案。我们和Frank Dellaert合作,最近他也刚获得世界级机器人协会RSS颁发的奖。我们希望通过能真正在工况下实现高精定位的一套系统。
第三个视频是我们关于整个泊车场景下的众包建图和动态更新。行业里面一个特点,就是泊车上的地图并不如高速公路或者城区道路的地图商业化做得那么快,在这样大的市场背景下,有非常好的众包建图能力在泊车场景上是优先于其他行车的场景。基于车上的环视,通过这样的建图,也能够实现我们停车场相对来说环境比较拥挤、比较复杂的地图更新的工作。
除了现在一些已经量产的技术之外,我们正在和清华大学在视觉感知领域也有非常深的合作,现在做的其中一个项目是我们用多孔径的相机阵列做的下一代智能视觉雷达的工作,因为大家知道我们现在相机虽然在迭代,像素从100万到200万到800万,其实这样的迭代时间都是相对比较长的。
我们希望通过多孔径相机阵列的工作,能够真正地将现有的相机技术进一步升级,让相机阵列能够传回非常稳定、高清的信息,进一步增强我们整个车辆的自动驾驶系统安全性。
最后一部分说一说我们在做的一些算法验证上的工作。
我们自己的整个验证平台,我们称之为holoX,是我们自主研发的自动驾驶仿真验证平台,很多朋友会问我,为什么不买一个商用的仿真软件?
原因很简单:第一个是商用仿真软件比较慢;第二个,大家可以从下面列的功能里面可以看到,仿真只是我们想做的这个平台里面非常小的一部分功能,具体包括高精度地图,可视化,包括预期功能安全的场景库,包括随即交通流,那些场景并不能被仿真软件所替代,所以我们必须要打造自有知识产权,或者快速迭代的holoX平台的一个基本的原因。
我们认为这其中最核心的还是场景库验证这一块,我们基于不同的维度,包括天气、道路、交通参与者,驾驶行为,甚至包括我们的一些硬件的状态去建立我们整个的自动驾驶,仿真和测试的场景库,能够真正和路测数据匹配,一起共同服务一个高维度的,覆盖尽可能多的场景。
除了刚才说的这种仿真、场景库以外,我们也通过不断的全国范围内的大规模的真实路测去积累这样的数据,当然我认为本质上这样的数据,在车辆的搭载能够进行百万辆级别的交付,这才是最后进入到真正的无人驾驶所必须的门槛,但是通过这样的门槛中,我相信每一步的自动驾驶的功能都是通过每一个阶段的自动驾驶的验证能够慢慢实现的。可能我们测一个ACC需要几十万公里,测一个更高级别功能需要几百万公里、甚至几千万公里这样的数据。
最后就是数据闭环。禾多这边的思考数据闭环的思考主要有两块:
第一个闭环是禾多现在主要以自己为主来做的,就是整个云端的模型到自动驾驶的模型更新、云端模型训练。
第二个闭环是右边的闭环,更多的是和行业合作伙伴一起来做的,更多的是包括众包地图、数据融合,这块可能又会从停车场地图开始,慢慢的延展到更多的场景,实现未来的全场景高精度地图一个相对及时、实时、低成本的更新。
最后我也简单的做一个小小的彩蛋,博世中国ADAS事业部的负责人未来一两周时间内会加入禾多。