最近,智能驾驶行业有一个热词——端到端。
从字面意义上来说,这是一个以一整个链路为整体处理的训练/呈现方式。
对于AI行业的从业者而言,这不算是一个什么新鲜的词汇。端到端从来指的是一种模型的训练方法——传统的AI训练,实际上是由无数个训练模型子系统组成的,比如自然语言处理,通常需要实现语言识别、字句分析、推理和表达等多个阶段,在这样的架构中,通常就包含了三到四个训练子系统,进行模型训练时,其实是从前到后分别调优,也因此就加入一些规则和被动人工调整的过程。
但端的端的训练,其实是——从一开始的语音输入开始,将所有子系统结合在一起,直接输出最后的结果。整个过程从输入到输出,不明确模型的具体功能,降低子系统的可解释性,也不对其中的环节进行干预,最后通过不断的数据优化,实现“端-端”的“输入-输出”模式。
可能有一些非行业人士不太好理解,其实换算到智驾行业,那也就意味着——从车辆传感器(看到)的数据到最后汽车智驾的自主决策实现完全的智能驾驶。
而这个过程,工程师开始消除大量的算法代码,不设规则算法,字面意义上的完全没有兜底策略,直接让车辆学习视觉图像,最后学会自己开车。
自从特斯拉FSD的新版本宣布将采用这种技术以来,行业内立刻卷起了巨大的风暴。原因在于,自古以来,依赖着高精地图,甚至是激光雷达的,以及被动算法规则式的技术形式全部被颠覆了,转而迁移到了一种机器视觉和模型主动的时代。
于是,连带着很多公司的研发架构被否定了。
就好比一栋已经盖了五层的楼,有人说你完全盖错了,现在得像我这样盖,你要去改一改地基和一层。
直接改可以吗?谁也说不好。但端到端技术是不是一个已经确定的未来?也不好说。
不过在中国市场,却也有着一个坚定的AI智驾信徒。
2024年7月30日,在“小鹏汽车AI智驾技术发布会”上,小鹏汽车董事长CEO何小鹏,宣布小鹏汽车将向全球用户全量推送AI天玑系统XOS5.2.0版本,带来覆盖智能驾驶和智能座舱的484项功能升级。
自从今年上半年宣布自己成为“全球唯二实现端到端大模型量产落地的车企”后,何小鹏称这次XNGP从“全国都能开”将全面升级为“全国都好用”,并率先提出“全国都好用”的三大标准:不限城市、不限路线、不限路况。
何小鹏,显然还是要做中国AI智驾的端到端技术的布道者。而这三大标准,简单被解释为了一个更好理解的新词:门到门。
在智驾开城这个话题上,何小鹏提到了行业内的“黑白名单”之分,白名单的全国都能开是指,测试和开放了一个城市的部分道路和部分用户。而黑名单的全国都能开是指,不特定限定路段和城市,只按照国家安全政策要求对不支持路段进行黑名单限定约束,其他城市和道路均可开的模式。
最终,小鹏汽车率先实现了黑名单模式。门到门,则意味着在中国的很多特色场景:
自动过公路上的ETC收费站;
2024Q4打通停车场闸机;
2024Q4打通包括园区内部道路的全国范围内行驶道路;
也包括道路上的各种掉头和环岛;
一个技术,通常需要一个更场景化的解释。特斯拉的端到端,普及的更像是技术底层的执行方法,而何小鹏的门到门像是把一个典型的场景具像化了。
比如何小鹏还说,中国有近万种红绿灯,真的测起来会吐血——这一定程度也回应了行业内对于特斯拉“端到端”原教旨主义的推崇。对于红绿灯这种现成的规则,基于安全的考虑,往往在大模型内也会采用基本的兜底政策。也就是说,行业所推崇的端到端,目前并非完全是自主决策。
“但我非常相信端到端是未来,不仅把L2干出来,何小鹏还是想试试能不能干掉特斯拉将来还要把L4干出来。”何小鹏称最近和很多个L4公司的老大去做过PK,他们都不相信(完全的端到端),因为他们觉得端到端有很多虚幻的问题、抖动的问题、各种黑盒的问题等等。“我认为这些只是今天的问题,解决的速度可能会超乎想象。”
这两年的智驾行业的发展,何小鹏分为了四个阶段——
第一阶段:2022年10月开通个别城市,所有主干道和红绿灯转弯;第二阶段:2023年11月开通数百个城市,所有主干道和红绿灯转弯;第三阶段:2024年7月所有城市,所有公开道路和环岛/掉头/施工;第四阶段:2024年12月开通门到门,打通园区内部道路/高速ETC等。
以上的几个阶段和场景,还不是何小鹏心目中,AI智驾“好用”的部分。他认为,到2025年,AI智驾才会来到“体验流畅”的时代,真正帮助用户,帮助用户心智从“不用接管”,到“不想接管”,最后到“一直想用”。
这依然有大量的工作要做:智驾的架构模式要改、逻辑要变,视觉感知处理的方式和数据量也要变,对算力的要求也要调整,何小鹏说“这和以前完全不一样”。但他坚定地认为小鹏汽车的技术方向和积累是同行中走在最靠前的一个。
对于特斯拉FSD即将入华的消息,何小鹏依然表现地很谦虚:特斯拉FSD,在中国(PK)可能小鹏能够战胜,但是特斯拉(整体)能力肯定在小鹏前面。他很兴奋今年年底特斯拉FSD与小鹏XNGP的实测表现。
在真正的落地比试之前,这种PK在代码世界也在以另外一种形式呈现,“如果用规则写程序,超前不多的话,中国企业效率高,而且努力,会追赶得快。但这个时代是算力 模型 数据 大模型的时代,用以前的逻辑就不一定OK了。”