特斯拉为什么不用高精地图

13 评论 4748 浏览 12 收藏 14 分钟

编辑导语:国内外自动驾驶厂商几乎都在高精地图上有所投入,但是特斯拉却是例外,这背后的原因是什么?也许,我们可以从高精地图本身的特性、以及国内外的道路环境等各个方面着手分析。本篇文章里,作者就特斯拉为何不使用高精地图一事做了解读,一起来看。

我们可以看到国内外的自动驾驶厂商(尤其是国内的图商)都在布局高精地图,而特斯拉表示并不感冒,完全摒弃掉激光雷达、毫米波雷达等非摄像头传感器,仅采用摄像头进行感知,在自动驾驶领域独树一帜。

这引起了我和领导的讨论,我回去梳理了一下,把思考记录在这里。

一、高精地图可以做什么

高精地图可以看成一个道路环境的模型,记录了道路的三维特征、行车辅助信息(如车道线等)和丰富的语意信息(如交通灯的类型等),通过成为高精定位底图、提供规划素材、强化感知的能力,提高了自动驾驶效果的“上限”。

1)提高定位精度(感知系统的参照物)

通过对比车载定位模块和感知模块的识别结果,确认自己的当前的位置。

2)提供超视距的道路信息,规划素材(提高决策距离上限,解放算力,驾驶体验更平滑)

  • 视觉/感知系统探测距离有限,尤其是车速快时,留给车载电脑的反应时间短。
  • 云端可以基于高精地图对动线规划进行预处理,节省车载电脑的算力。
  • 即使本地算力足够,短时间内及时纠偏,也会牺牲乘坐体验(看见要停再停车,和提前知道要停车提前减速,体验差异)。
  • 视觉范围有限,结合超视距信息,减少局部最优决策。

3)帮助无人车识别车辆、行人位置及障碍物、路牌(给感知质量兜底,让决策更合理)

  • 视觉方案会因为光线明暗、物体颜色等产生误识别,雷达受雾雨(空气中的颗粒)影响产生噪声,高精地图没有,但是传感器发现了,大概率是活动的物体。
  • 与感知“看到的”路牌标线做对比校验,减少误识别。

可以看到,高精地图主要是为感知、决策模块提供“增益”提高系统的安全、舒适性。

就像一场考试,不押题的这方,不依赖高精地图、甚至仅使用纯视觉的方案的无人车也许只能答60分,或者拼命学习拿到80分。请了家教拿到考纲的这边,借助高精地图,通过其他方式绕过视觉的死点、难点,拿到90分。

二、不想用OR不能用?

特斯拉选择了这条比较激进的路线,完全摒弃掉激光雷达、毫米波雷达等非摄像头传感器,仅采用摄像头进行感知,在自动驾驶领域独树一帜。

从“第一性原理”的角度来说,即使没有高精地图,高度成熟的感知“视觉”,无人车可以像人类驾驶一样仅用“眼睛”去做出驾驶决策。

我倾向于认为,特斯拉不是“不想”使用高精地图,而是“不能”使用高精地图(也不划算)。

1)面向全球市场的特斯拉,高精地图的制作和维护成本高,效果还不好

高精地图的制作大体上包括采集 → 数据处理 → 人工验证 → 发布等一系列数据制作流程。

① 采集范围大:采集需要带着设备的车在路面上跑,铺满目标市场的主要道路。

② 数据处理和人工验证:均需要根据不同地区的情况,制定工艺,需要模型甚至需要人工标注。

③ 数据更新效果无法保证:

  1. 地图不是绘制完了就一劳永逸,在大量无人车投放市场后,可以回传用户车传感器途径道路的最新的数据,保证地图鲜度。
  2. 地图后续人工/自动更新的维护和迭代,也会产生大量成本。

2)国内是大体量、统一的市场,制图边际成本低,更新频率有保证

我们可以看到国内的厂商都会选择高精地图的自动驾驶方案。

① 制图边际成本低:全国的主要干道规格统一“一个标志牌、一种标线,全国通用”。

② 国内的车流密度也保证了足够的路网覆盖,在达到一定渗透率,不同车厂的传感器信号都汇总给图商/自动驾驶运营商,可以做到高频度的道路刷新。

③ 地图产业涉及到国家机密,精地图的行业准入门槛很高

  1. 目前国内拥有“导航电子地图制作甲级测绘资质”的企业较少。但是也正因为政治壁垒的因素,限制了国外竞争者的加入,这也让国内企业具有一定的优势。
  2. 为了避免相关问题,特斯拉用作仿真训练的“短时路网”会被保存在国内的服务器上。

3)相较国外,国内的道路环境更复杂,对安全的要求更高

  1. 国外地广人稀,道路环境相对简单;
  2. 国内道路车流人流密集,有中国特色的交通参与者(如电瓶车、行人)。

也许你会说,同样是面向全球市场Uber、Waymo、Mobileye、英伟达,都会选用高精地图,市场也许不是主要原因。

是的,Uber的出租车模式意味着车辆调度的自控,只需要满足有大量用户的、主要路线的诉求,Waymo的高精地图基础由谷歌地图发展而来,Mobileye、英伟达为大量的车厂提供软硬件(也许意味着有大量的数据回收)。

而特斯拉作为独立厂商,除了马斯克奉为圭臬的“第一性原理”外,也许彼此之间都不愿意分享自动驾驶的“灵魂”(自动驾驶能力和用户数据),也许他已经选择了足以弥补高精地图缺失的技术方案。

三、特斯拉的纯视觉方案:MIND OF CAR

如果特斯拉有且仅有摄像头,那么他的视觉方案必须是业界水平最高的。

特斯拉思路是:开车的是人,道路是为人类设计的,如果拥有和人类一样的感知和处理信息的能力,机器可以无缝过渡到自动驾驶,经济&高级。

在特斯拉2021年的AIDAY上,马斯克分享了纯视觉自动驾驶方案和能力:

1)硬件:8个360°,120w像素摄像头,在效果上需要能替代替代激光雷达、毫米波雷达和声呐。

2)感知:1000人的标注团队,150w辆在路特斯拉,保证了为视觉算法训练的大量的数据集合。

① 同大多数的自动驾驶的感知方案一样,特斯拉的视觉方案在做以下几件事:图像校准 → 物体识别 → 深度感知 → 创建四维向量空间。

② 只是,特斯拉选择通过视觉模拟雷达,准确率基本接近真实雷达。

  • 通过有雷达的路测车在路上跑,获取真值。经过大量训练,算法可以得到视觉和模拟雷达的换算关系,摆脱用户车对雷达的依赖。
  • 通过视觉同样可以通过对陌生道路建模,进行感知和预测(基于大量道路数据的视觉算法学习,获得超视距的预测信息),生成短时高精地图。

3)规划与控制

  • 特斯拉在规划架上和业界基本没有什么太大的区别,基本上都是先求解出可行空间,然后利用优化的方法在可行空间内优化求解,输出最终轨迹。
  • 特斯拉的轨迹动线规划,可以简单理解为基于搜索的方法生成大量的轨迹,综合评价安全、舒适、效率选择最优动线,在技术能力上的优化可以让他们减少搜索次数,提高效率。
  • 它也实现了通过视觉跟踪,以及衍生的预测能力,可以学习不同物体的性质,区分人/动物/车,以及预测其未来的走向,做出决策和避让。

4)计算能力

云端Dojo超算力:现有特斯拉车端FSD芯片算力主要依靠两块SoC芯片,算力为144TOPS,并不高,但是,基于帧检测的摄像头需要依赖高算力,其核心诉求是高带宽和低延迟。

5)仿真能力

  • 这块是特斯拉能实现视觉算法高效迭代关键,通过视觉生成实时高精地图,制作虚拟仿真地图,还原现实环境的基础上,创造有更多边界场景的虚拟环境,在虚拟世界完成打怪升级(神经网络渲染)。
  • 每辆在路的特斯拉回传的地图数据,都可以成为仿真地图的原本,可以看到,其对静态、动态环境的构建效果逼真,并且可以通过AI能力进行模型再创造和组合。这提供了大量的边界场景,减少了标注的工作量。
  • 在路上跑的车辆越多,收集到的数据越多,仿真场景库的数据也会指数倍增。

四、At last

不可否认特斯拉有很强的技术能力,在算法能力上有着行业顶尖的水平。但特斯拉的方案是国内厂商选择的高精地图+多传感器的技术路径的子集,如果视觉方案发展得足够成熟,国内厂商也可以随时“向左转”。

运输工具不一定要造“腿”、也可以造轮子,同理,机器人不一定长得像“人”。纯视觉方案不一定最高效的方法。即使自动驾驶最后走向了“像人一样驾驶”,在自动驾驶发展初期、“学走路”的过程中,短期内借助高精地图和其他传感器作为“辅助走路的支具”,快速实现自动驾驶的安全普及,也无伤大雅。

参考资料:

  • 《第一本无人驾驶技术书》作者:刘少山
  • 《自动驾驶仿真蓝皮书》
  • 自动驾驶基础知识系列-高精地图@少隆 https://>ata.alibaba-inc.com/articles/192451?spm=ata.23639746.0.0.3c0c4ddfCx53C1
  • 行业前沿:自动驾驶之“高精地图”篇 – PLUGANDPLAY的文章 – 知乎 https://>zhuanlan.zhihu.com/p/486988101
  • 高精地图,公认的自动驾驶标配,但特斯拉并不care – https://>baijiahao.baidu.com/s?id=1685063016792310360&wfr=spider&for=pc
  • 自动驾驶之高精度地图(八)国内外高精度地图发展现状 – 阿宝说车的文章 – 知乎 https://>zhuanlan.zhihu.com/p/369259860
  • 超长延迟的特斯拉AI Day解析:讲明白FSD车端感知 – EatElephant的文章 – 知乎 https://>zhuanlan.zhihu.com/p/458076977
  • 特斯拉AI Day决策规划技术解析 – 自动驾驶拖拉机的文章 – 知乎 https://>zhuanlan.zhihu.com/p/402442178
  • 如何赋予机器思维?解密特斯拉人工智能自动驾驶下集!超乎你的想象https://www.>bilibili.com/video/BV1uU4y1u7JY/?spm_id_from=autoNext

 

本文由 @阿白 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash ,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 自动驾驶/辅助驾驶的终点肯定是雷达+视觉算法;
    设想这样的场景:
    1、大雨天气,激光雷达精度受影响
    2、大雪天气,视觉算法受影响

    来自香港 回复
    1. 嗯,高精地图也可以对感知模块进行兜底作用~

      来自北京 回复
    2. 外企在国内搞高精度问题,少补注意就会触碰到国家红线,汽车作为一个实时运动的物体,运动范围广、覆盖面积大、管理难度大,如果涉及到国家政府、涉密单位、军事单位位置的泄露,外企很可能会被直接干掉。
      所以我猜测,不是外企不想做高精度地图,特斯拉可能也想做,但是为了吃这口饭他不得不放弃做高精度地图。
      高精度地图在体验上肯定是优于目前特斯拉的半图形化半抽象化的地图的

      来自广东 回复
    3. 嗯嗯是的,有看到一些机关单位的门岗,蓝底白字标识特斯拉不能进

      来自北京 回复
  2. 高精地图作用只是标记位置上会有优势,辅助驾驶还需要考大量的ai数据

    回复
    1. 嗯嗯,高精地图也可以为辅助驾驶提供超视距的二维底图,同样都是算法,有100m内决策范围和1km内决策范围,哪个体验上限高不言而喻了吧~

      来自北京 回复
    2. 辅助驾驶不是取代驾驶员,高精度地图的体验毫无疑问是更优的

      来自广东 回复
  3. 啊,为啥不能使用高精地图,仅采用摄像头有点类似人眼的操作

    回复
    1. 主要是三个,全球市场上看更新成本高,低鲜度数据不如不做,国内也不让特斯拉做高精地图

      来自北京 回复
    2. 受教了

      来自广东 回复
  4. 高精地图并不一定适用于所有场景,所有人,不同的方式有不同的优点吧

    回复
  5. 又学到了新知识,虽然用不上,并且跟我关系不太大。

    来自河南 回复
    1. 哈哈哈哈

      来自北京 回复