纯视觉or重感知?特斯拉动作不断,自动驾驶将走向何方
深圳特区报记者 熊子恒
05-08 10:14

深圳特区报

深圳市委机关报,改革开放的窗口

近日,特斯拉CEO马斯克不到24小时的“闪电访华”引起广泛关注,有消息称其目的在于推动完全自动驾驶(FSD)系统在华落地。这次短暂的访华让马斯克收获颇丰,特斯拉通过了中国汽车数据安全4项全部要求,成为其中唯一一家符合合规要求的外资企业。

今年来,特斯拉动作不断,从推送基于端到端神经网络的新一代FSD,到宣布8月份发布Robotaxi完全摆脱驾驶员的出租车,无一不在彰显其在自动驾驶里的领军地位。在汽车智能化的大潮之下,自动驾驶已成为车企和各路资本争相布局的重点领域。结合当下火爆的人工智能深度学习技术,头部玩家尝试“设备上做减法,算法上做加法”,“重感知”还是“纯视觉”,自动驾驶的实现方式受到越来越多的关注。

AI技术赋能

“纯视觉”方案有了落地基


在汽车电动化浪潮下,车企之间加速“内卷”,车型不断推陈出新,更长的续航、更“壕”的内饰、更低的价格……但仅仅做到增配减价似乎不足以打动消费者,越来越多的主机厂以及技术服务商着力在自动驾驶技术上做文章。

当下,实现自动驾驶出现了两条路径:特斯拉选择彻底放弃激光雷达,选择依赖摄像头的“纯视觉”自动驾驶方案;不少车企则坚持配置雷达设备,选择“重感知”的多设备融合自动驾驶路径。

今年3月,特斯拉在北美推送了FSD软件更新,马斯克称其是一次大版本更新的“重磅发布”。据悉,新版本在算法层面做了较大改动,全程使用端到端神经网络,无需任何人工程序规则介入,汽车的自动驾驶能力有了明显进步。

在自动驾驶技术上,特斯拉无疑扮演着领头羊角色。正是基于神经网络应用深度学习算法,特斯拉才有了抛弃雷达设备的底气,成为“纯视觉”驾驶方案的坚定拥护者。

南方科技大学教授、无人驾驶专家郝祁表示,自动驾驶企业普遍采用了基于程序规则的算法体系,汽车在行驶中根据既有程序命令去执行相关操作,这需要多传感器合作为汽车提供准确的环境信息。当前,基于人工智能技术的应用,端到端模型正在改变自动驾驶传统模块化的实现方式,无需冗长的代码来制定规则,而是利用海量数据进行训练,让汽车拥有自主学习的能力以应对复杂的驾驶场景。“人工智能算法能力提升,自动驾驶中对于行驶场景的解析能力更强,因此,通过硬件设备获取信息需求就自然而然降低了。”他说。

如果说算法是“纯视觉”方案实现的基础,低成本则是推动其商业化背后的动力。

郝祁指出,在自动驾驶的传感器设备中,激光雷达虽然近几年价格下降很快,但与摄像头相比,仍然是成本较高的设备。激光雷达的成本可以分为设备成本与开发成本两部分,其应用的激光线束越多价格就会越高,开发与之相适应的算法数据集也是一笔不小的支出。

感知融合视觉

多传感器协作仍是行业主流

当下,采用感知融合视觉的多传感器协作方式实现自动驾驶依然是主流选择。

近年来,国内以“蔚小理”为代表的造车新势力、传统主机厂以及百度、华为等科技大厂纷纷布局自动驾驶,并且不断有新的自动驾驶初创公司参与其中。它们大多主张通过搭载激光雷达、毫米波雷达、摄像头等方式来增强单车感知能力,从而实现快速量产,完成商业化落地。

与人类驾驶员开车的方式类似,自动驾驶的核心系统由三部分构成:感知系统、决策系统与执行系统。

郝祁表示,车辆需要通过传感器感知分析行使环境与交通标识,并对周围运动目标的轨迹进行预测,根据机动协议进行路径规划和运动规划形成决策,再按照实际道路情况做出加油、刹车或者转向变道的操作。在实现自动驾驶的过程中,感知是先决条件,这就类似于驾驶员的眼睛,对路况信息进行捕获之后才能做出准确的驾驶操作。

“采用多传感器融合的方式,可以让设备功能取长补短,最终形成一个综合解决方案。”深圳清华大学研究院无人驾驶智慧城服研发中心主任陆有源指出,在自动驾驶中,摄像头和激光雷达的分工不同,摄像头像素高主要用于图像信息的采集,实现精细化识别,例如各类车道线、交通标志、行人、障碍物等。激光雷达的作用则在于精准测算距离,且不受光照影响白天和晚上都能照常工作,但无法对障碍物的语义、材质软硬进行精确描述。

“激光雷达属于探测环境信息的主动传感器,通过发射激光束的往返时间来精准测算汽车与前方障碍物的距离,而摄像头属于被动传感器,容易受到天气与光照的影响。单纯从技术的角度出发,多融合方案一定具备优势,感知设备哪怕只是作为辅助做出很小的纠正,汽车的安全性能也能提升一大截。”郝祁说。

技术日新月异

自动驾驶将走向何方?

依托摄像头的“纯视觉”与多设备融合的“重感知”,两种方案各有所长,哪一种才是自动驾驶最佳的实现方式?

“我比较看好‘纯视觉’自动驾驶方案,特斯拉采用的端到端神经网络实际是从仿生学的角度让机器模仿人类开车,人类驾驶员只用眼睛就足以识别周围的驾驶环境,而摄像头充当的就是眼睛的功能。普及‘纯视觉’方案取决于两个因素,一是摄像头硬件技术的迭代升级,二是人工智能算法体系的先进性。”陆有源说。

陆有源表示,摄像头技术的升级让汽车具备识别更多复杂环境的能力。当前,人工智能算法正越来越多地应用到自动驾驶中,“纯视觉”方案推广的关键还在于能否进行充分的模型训练,数据基础是否牢固,只要有海量丰富的数据积累,摄像头就足以应对各种场景。

根据特斯拉描绘的蓝图,利用神经网络深度学习,降低了汽车对于雷达感知类传感器设备的依赖度,汽车还能越开越智能,自动驾驶越用越流畅,这看起来的确令人兴奋,但落地实施并不容易。

算法开发的投入就是一笔不小的开支,足以让后来者望而却步。根据马斯克的计划,特斯拉今年将在训练和推理人工智能方面投入约100亿美元。早在今年1月,特斯拉还追加了5亿美元新投资,购买约1万个英伟达GPU芯片。可见,没有持续的真金白银投入,用AI赋能自动驾驶难有保障。

郝祁认为,用单一视觉传感器就实现自动驾驶,需要引入人工智能通用大模型,让自动驾驶的汽车形成足够丰富的“知识库”,而不是只进行驾驶技能单项训练,知识结构越丰富,驾驶中出现问题的可能性就会越小,但大模型训练的能耗和成本十分高昂。

在自动驾驶落地验证的过程中,驾驶安全始终是绕不开的领域。郝祁还表示,人工智能技术目前还在发展初期尚存短板,比方说,自动驾驶中如果出现事故,神经网络不具备追溯性,无法找到问题的来源,在安全性问题上算法本身还有很大的优化空间。

自动驾驶仍然处于发展初期,市场各方都在争抢这块大蛋糕。站在创新大变革的时代,技术路径到底如何选择,且让我们拭目以待。

特斯拉:完全自动驾驶落地仅“一步之遥”

特斯拉首席执行官埃隆·马斯克最近表示,我强烈建议你一定要试用FSD,不了解FSD的话你很难说自己了解特斯拉。现阶段业内对特斯拉FSD V12都比较期待,对其是否能进入中国市场也充满想象。那么特斯拉FSD有何神奇?

特斯拉FSD全称为Full-Self Driving(全自动驾驶),是特斯拉研发的一套智能驾驶系统。基于大规模行驶里程、自研运算平台、巨大算力的布局,目前FSD已进入V12.3阶段。特斯拉方面表示,完全自动驾驶距离走入现实仅“一步之遥”,其大规模商用一旦落地,将成为特斯拉利润丰厚的“现金奶牛”。

FSD V12的工作原理很简单。系统通过车辆摄像头拍摄画面,跟特斯拉积累的近万亿公里的历史行程数据进行比对,筛选出一些与当下场景很接近的场景数据。根据驾驶员之前怎么操作的,FSD就怎么操作。

值得一提的是,现在FSD没有任何预设条件,也没有对应规矩,FSD完全根据学习人类的经验来做判断。这个AI程序的工作变得非常简单,对硬件、算法要求直线下降,而且功耗也变低,但从实际的开车效果来看,已经非常接近于人类司机的驾驶效果。

今年开始,特斯拉的智能驾驶软件FSD V12版本已经在北美加速落地,同时,特斯拉已经将FSD从测试版本的“FSD Beta”更名为“FSD Supervised”,业内认为,这意味着FSD已经结束公测,进入规模商业化的环节。

编辑 吴诗敏 审读 张雪松 二审 党毅浩 三审 潘未末
(作者:深圳特区报记者 熊子恒)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页