贾浩楠 发自 副驾寺,智能车参考 | 公众号 AI4Auto
大家有没有发现,这几个月所有主机厂、自动驾驶公司做技术宣传时,不约而同提到一个新名词:OCC,或者说占用网络。
这是深度学习算法领域在自动驾驶的新应用,2023年10月,极越汽车首次在国内将OCC引入量产车。
而这项技术,也被认为是自动驾驶纯视觉路线的一个重大进展,被解读为“替代激光雷达”的最强杀手锏。
于是如今,不管理解没理解,上车没上车,搞自动驾驶的言必称占用网络。
而率先引入这个概念的极越汽车,刚刚把应用OCC的智驾方案推送给用户,成为国内首个。
各家都在吹的OCC,极越已经上车了
2月23日,极越正式向全量用户OTA推送V1.3.1版本软件。
这其中最种亮点最大的,就是的OCC占用网络正式“上车”。极越也成为国内首个全量推送OCC占用网络的车企。
之前,极越还有一个第一,就是国内首个实现“纯视觉”技术方案量产的玩家,也是国内第一个明确走纯视觉智能驾驶方案的车企。
还秀出了上海核心城区高峰期一镜到底不接管的实测:
CEO夏一平,也在不久前亲自上路直播展示了纯视觉“点到点”的量产高阶智驾能力:
这次的OCC上车,也是极越在纯视觉技术路线上的一个超级重要的进展。
最具变革意义的是感知识别能力的提升,能够对障碍物进行3D精细刻画,模型精度可达厘米级,比肩甚至超越激光雷达。
同时,OCC占用网络对于运动障碍物的速度识别精度能达到0.1米/秒误差范围。大幅提升了对于栅栏、护栏、水马和施工隔离栏等有一定长度的通用障碍物边界的识别能力,有效进行避让、刹停等,留出更多安全行车距离。
OCC上车极越,对于用户最直接的体验提升,是城市、高速NOA功能更安全:
什么是OCC?上车有什么用?
OCC即Occupancy Network(占用网络),最早由特斯拉提出。
系统的主要感知识别数据仍然是视觉图像,摄像头采集的数据通过基于Transformer的BEV网络,应用自注意力机制进行特征提取,获得当前场景各个目标的语义分割信息,并加入时序特征。
OCC的作用,是在传统3D目标识别能力之上,通过体素(Voxel)化的方式理解和处理空间信息。
可以简单理解为将场景空间分割成单位化的“方块”,感知系统可以对3D空间的可通行区域进行高保真度还原。不需要考虑物体是什么,只考虑当下这个“方块”是否被占用。
OCC除了替代激光雷达外,因为系统不需要识别出物体具体是什么,只需要知道自己是不是被阻挡了,所以也就不再像过去那样依赖于训练集。
实际其实占用网络上车的一个初衷,是替代激光雷达。OCC带来的“轻雷达”甚至是“去雷达”趋势,可以使量产智驾系统的硬件成本降到极低,理论上能更快大规模普及。
视角再扩大一些,智能驾驶的成熟,解放用户更多负担,车上的自由时间和娱乐休闲办公需求会爆发,从而更加推动智能座舱技术、生态的发展。
可以做一个大胆的语言:
如果智能汽车、自动驾驶也存在“技术爆炸”的话,那么BEV、Transformer就是一直积蓄的能量,OCC可能就是引燃的“火种”。
极越走在了行业最前端,同时揭示了2024智能汽车内卷方向和主题。
智能车今年卷什么?
当然,OCC只是一个算法模块,属于极越“B.O.T三向箔”智驾技术体系的一部分。
B.O.T的意思是“BEV+OCC+Transformer”。这其中,Transformer是深度学习算法的基础架构模型,尤其擅长处理自动驾驶连续图像数据这样的超大规模数据。
BEV也是一种数据处理算法,即在前端就利用环视摄像头的数据连续生成车辆周围360°的鸟瞰视角图。
BEV图像数据是带有3D位置关系和时序因果关系的,这就从本质上改变了以往利用单帧图像数据做训练和感知的自动驾驶技术。
Transformer和BEV,最早由特斯拉提出,去年逐渐被国内玩家完全理解吸收,并且成为席卷自动驾驶业界、重构技术体系的浪潮。
比如华为ADS,从1.0的马马虎虎到2.0的“遥遥领先”,其实背后就是用BEV+Transformer重构了所有代码。
毫无疑问,OCC是在Transformer和BEV之外,今年自动驾驶、智能汽车内卷的一个重要方向。
其他还有什么?
极越CEO夏一平和百度IDG技术委员会主席王亮给出了最新判断。
首先是最近爆火的SORA,文生视频的能力震撼所有人,是大模型威力从NLP向CV领域快速延伸的里程碑。
而作为CV领域应用最成熟、市场最广阔的自动驾驶/智能汽车,自然要问:SORA会带来什么样的影响?
王亮认为,SORA本质是transformer机器学习的工具加上diffusion的技术。对自动驾驶的颠覆,可能是从预测的角度。
自动驾驶系统感知环境并构建,其实决策规划不是建立在当下,而是对未来预判,可能是3秒可能是8秒。对未来预判越准,做的规划就越合理。
SORA可以比较好预测未来60秒可能发生的事情。如果用SORA生成式技术,那么对未来的预测,包括决策规划的影响会很巨大。
第三个重要趋势,或者说是自动驾驶内卷方向,是预训练模型。
自动驾驶的很多任务,检测红绿灯,检测车道线,可分为两个部分,backbone(提取特征),以及HED(解决具体任务)。
backbone很重要,但算力是有限的,且每个backbone能分配到的算力是平均的。
所以对感知来说需要有更强的视觉底座基础模型,放到车上合并小模型,让算力加大,从这个平台上分出多个任务,让每个任务解决的更好。
总结一下,极越或者说背后的百度Apollo,对于自动驾驶技术段内卷做出了预判。
首先是量产上车的层面,OCC成必争之地,因为它是开启智驾技术、体验爆炸的钥匙。
研发端的基础设施——预训练模型,成为一个玩家在这样的内卷中能不能持续发力的关键。
而对于可能潜在的颠覆性SORA大模型,对自动驾驶的意义可能最先在“预测”这个模块生效。
极越为什么能成?
百度是极越汽车背后的两大“支柱”之一,这不是什么秘密。另一个是自主龙头之一,也是目前国内最大的汽车集团吉利。
从极越新年首次OTA的内容中,就能看出极越为何能把智能汽车做到如此极致。
智驾方面,百度自动驾驶业务Apollo全力支持极越,IDG技术委员会主席王亮的团队,不光把最强技术给了极越,还几乎做到了两个团队“同吃同住同劳动”的高效率协作。
资源上,百度云业务给了极越自动驾驶开发的启动算力1.8-2.2Eflops,上不封顶(特斯拉dojo发布时候的启动算力1.1Eflops)。
另外智舱的文心一言大模型、百度地图都给了极越100%支持。
极越的城市高阶智驾功能,也马上能做到“全国都能开”。背后是百度地图革命性的升级。按照夏一平的说法,未来只要百度地图能覆盖的地方,极越PPA都能开。
当然还有吉利,现在也有迹象显示出加大对极越的支持。
除了极越本身采用吉利浩瀚架构造车,在补能和用户体验上,现在也直接无缝对接吉利的资源。
比如今年3月,极越将打通共享极氪所有自建超充站,全国900多座,而且是800V。这会给极越所用用户带来出行体验的质变。
智能汽车创业,或者是车企智能化转型,极越也走出一条独特的公式:
必须有AI科技基因、能快速适应GPT,Sora等潮流,有自研、独立开发能力;然后是汽车公司从制造方式创新,材料创新,平台创新等一样有不断突破能力。
两者加起来的车企,能脱颖而出。
极越就是这样“AI头部+创新型汽车集团支持”的企业。一直以来,定位都是最强AI技术(百度Apollo、文心一言),落在最强电动车平台(吉利浩瀚SEA)。
现在极越展现出的趋势,是技术越来越领先,体验越来越靠谱。极越背后百度和吉利的支持,也越来越藏不住了。
而且这样的支持,还有一个想象空间更大的观察角度:
路特斯代表了吉利豪华品牌特性,极氪代表了吉利性能特性,而极越就是智能天花板特性的代表。
路特斯和极氪,相继都实现了战略目标,开始IPO进程,路特斯已经成了,极氪马上。
已经实现智能战略目标的极越,或许也快了…