笔者在整理资料时发现,2023年中国汽车软件大会上,同济大学汽车学院教授朱西产的一篇讲演内容,非常有意思。特将这篇遗珠整理出来,以飨读者。
以下内容为现场演讲实录:
电动化之后我们在谈智能化,智能化所有的功能几乎都要靠软件实现,软件里有一个分支是AI,是用人工智能的,是训练出来的,不一定是程序员编出来的。那么我们来看看AI赋能下智能汽车的趋势。汽车数据在当前经济下变得更靓丽了,比原来那个超万亿的产业—房地产产业健康得多,也赋予了新经济更好的趋势。
从上面数据看,以为汽车日子很好过,但其实也不好过,也面临着转型痛点,“关停并转”也是行业面临的一种行业态势,但是至少希望是有的,向电动化和智能化革命两个大方向发展。
电动化的好处是我们已经成功走出了一条中国之路,电动化之后怎么走好智能化,在今天电动化和智能化革命的时候难点,我找到这样一本书提到“跨越鸿沟”。
我们为什么要开电动车,我们曾经纠结过,现在还纠结吗?好像不纠结了,电动已经跨过了鸿沟,因为这些技术非常炫酷,但是其实已经超出了用户的基本需求,在产品的初期还是存在很多纠结的,那么过去的5年我们一直在纠结,用户真的会接受一台不好用,又贵又不好用的电动车吗,那电动车终于跨过鸿沟了。
那么在今天我们又问用户真的会接受自动驾驶汽车吗,现在大量第一代的这种L2+的车落地了,其实卖的并不算太好,又出现了一个鸿沟。
大家要知道的是到底用户能接受自动化程度到什么程度的一辆车,对一辆智能汽车,尤其以自动驾驶为卖点的智能汽车又出现在鸿沟这里。有没有人能接受,要到16%的市占率才能跨过鸿沟,而且这个鸿沟是要主机厂自己想办法跨越的,左边的用户影响不了右边的用户,因为左边的用户被右边的用户认为是“烧包”,右边的用户认为左边的用户是“土老冒”,鸿沟两边的用户没有办法对话的,对话就会吵起来的,所以汽车厂家一手托两家,又要照顾这帮“烧包”,又要把这帮“土老冒”拉过来享受自己的新技术。
所以电动车可以看到,最早特斯拉出来的时候用零百破三炫酷吗?炫酷!但是零百破三真的有用吗,其实没有用。你仔细看看百公里加速时间在5-6秒的车开起来是比较好的,零百破三,一脚油门下去1.9秒到100公里的车,反正我的胃,踩三脚下去就吐了,有的人能力稍微强点五脚也吐了,其实吃不消,所以其实零百破三不是很好的体验。
传统的内燃机汽车零百在9秒10秒,动力差一点的车零百到11秒、12秒,这些车的确很差,给我感觉零百在5-6秒是比较好的,所以零百破三很炫。的确很炫,特斯拉用很酷炫的,加速能力强作为最好的亮点,这群烧包的人会使用。
这张图最左边的那批人被割了韭菜的,最早的2.5是烧包里的韭菜包,这批人影响不了右边,所以汽车厂推新技术的时候不仅要找到这帮“烧包”的用户,还要想办法找到相对比较保守的用户,按照这张图来看16%左右会是一个跨越点,现在电动汽车我们可以看到用零百破三的炫酷能力获得了第一批用户,这群“烧包”用户有了。现在用造型时尚,动力好,续驶里程,现在的电池技术续驶里程达到500,600公里。可以了,快充五六百公里使用起来也很好了,也开始打动了这群用户。
之前中国市场达到了26%,16%大概是这批鸿沟的跨越点,中国电动车和新能源车处于热点。也许电动汽车会迎来全球的热销,这是有可能存在的,从统计规律上是有可能存在的。
第二块看看智能,在智能赋能下汽车有可能呈现制造业和IT业的双重属性,制造业是销量排名的,IT业是市值排名,前三家是特斯拉,丰田,比亚迪,销量排名第一的丰田现在的市值排名在第二,2022年销量排在15的特斯拉市值在第一,比亚迪销量排名13,市值第3,呈现了双重属性。
这里IT的部分,高科技的部分现在主要看它的智能化能力,智能化能力从用户角度来说智能座舱和智能生活空间,智能驾驶三个领域。
谈到智能重要的事情你可以说软件定义汽车,这是一个词,第二个软件里有非常大的一块东西是AI软件,AI在智能汽车里所占的比例越来越重。
我们看到目前在车端使用的应该预测式AI模型,2023年在卷大模型,我们说生成式AI,生成式AI现在在车端算力平台还是run不动的,还是在云端。但是大模型也开始赋能智能驾驶这块,但是什么时候到车端这块还是要看车端算力的提升情况,所以我们说AI已经发展到预测式AI模型,专业模型和生成式AI模型的大模型两块。
我们来看看汽车行业的智能汽车的大发展趋势,看看特斯拉的颠覆到底会把这辆车变成什么。
当然特斯拉现在Modle3和ModleY是上量的汽车,车身结构也有巨大的变化。从商业模式可以看到特斯拉充电是它的很大的一块盈利方向,从车之外去年开始其实在做储能,因为做不好储能充电业务的盈利会受到一定影响,所以他靠充电挣钱。
第二个靠卖软件挣钱,FSD成为它很大一块收入来源。
第三个,特斯拉也靠卖保险挣钱,这也是被逼上梁山的。保险业认为铝做车身,维修费用奇高,要增加保费。在美国被AAA提高了30%的保费。保险费用一高在美国车卖不好,在国内用户对保险费还不太敏感,铝车身的车保费提高了100%,好像也没影响卖车。在美国提高30%,车就卖不出去。特斯拉做保险是被逼上梁山。
做下来之后,在FSD辅助下,明显赔钱的保险也被他做盈利了。所以靠保险卖钱也是一个趋势。很多主机厂买了保险公司,或者自建保险公司,或者收购保险公司。下一步最大的可能性保险是主机长自己营销的。
所以从特斯拉对汽车产业的颠覆来看,从卖车挣钱,可能后面会靠数据和软件挣钱,商业模式也在向这个方向转,特斯拉现在已经非常明显看到是这样的趋势,卖车也挣钱,靠保险也挣钱,靠卖FSD也挣钱,靠充电也挣钱,盈利模式发生了改变。
电动化和智能化改变的不只是技术形态在变,商业模式也在变。
靠卖软件挣钱,做到什么样的软件用户会掏钱买?FSD在美国已经有接近40万人的用户,就是FSD做到这个程度,当然这样的能力我相信华为系的车也能做到,问界也应该能做到,小鹏的车应该也能做到,在高速上蔚来、理想的车应该也能做到,但是在国内这样的视频发不出来的,我们的网管比较严,双手完全脱离方向盘,这样的视频根本发不出来,这样的视频发出来警察会找上门罚款,这样的驾驶能力可以达到卖钱的程度,就是订阅模式。
这个东西是不是L3,现在主机厂不愿意用这个名字,还叫L2,或者是叫L2+。这个功能接管率已经从传统的L2百公里20多次降到近千公里只有一次左右,这是很强的,也可以看到它的能力的确非常强,无论从显示还是它实际的表现,做到现在能不能叫自动驾驶,这个介于L2和L3之间的状态,这是智能驾驶达到的程度。
存在的问题是FSD11版本2023年2月份也被召回一次,在封闭道路没有问题,在城市道路还有一定难度。
智能驾驶难就难在这里,还有安全的长尾难题,未知的不安全场景,这个未知的不安全场景现在预测式AI,要标签导致的,我们能不能做出来一个完备的标签,这是一个难题。
现在装车的AI软件部分,AI模型基本上预测式AI,预测式AI强烈依赖标签,标签缺失就会有问题,标签识别错误也会有问题,这代产品感知部分是AI模型,轨迹预测和运动规划一般还是准则模型,这两个东西都依赖标签,一旦标签错误就会出问题。
这是典型的标签匹配错误而导致。
这个车长这样子以后,没能认出来,这是典型的匹配错误导致的。
这个轻轨不知道被他标记成什么东西了,导致目标物的运动预测的错误而导致运动规划的错误,刚刚叫做自动驾驶如果发生左转是会发生碰撞的。
All know all safe所以这样的问题还是存在的。
在AI的加持下,智能驾驶下L2+的这些车接管次数从百公里20+,已经降到千公里1次2次,但是恐怖谷,百公里20次接管反而没有安全问题,不会误认为是自动驾驶。
但是1000公里才需要1次介入,用户就会放松警惕,会把它当自动驾驶使用,就会分心,就会玩手机,甚至躺下睡着了,这是最危险的时候,所以L2+其实自动驾驶的能力大大提升了,但是就是一瓶子不满,半瓶子晃荡的时候才是最容易发生事情的。
现在就是这个时候,激进型的用户会把他当做自动驾驶。
智能驾驶这块到L2+的时候还是很纠结的,其实这些装了高算力且非常贵的英伟达ORIN芯片,但这车卖的并不好,算力成本与用户体验不成正比。
但是这样的自动驾驶我们肯定有需求,这里AI部分是要用数据驱动的,要做数据闭环,现在我们可以看到基本上各个企业都在建场景库,数据集,大概采到100万公里,100万公里再采集下去这个采集和标注等成本太高了,对弥补前面漏洞用处不大。所以很多企业用“影子驾驶”构建用户数据闭环。
AI就是要用数据驱动,这个数据闭环现在基本上企业开发采集100万公里左右的数据,然后用影子驾驶把这个车卖出去,从用户那边采集数据,有了足够量用户以后,特斯拉一个季度可以刷到1.5亿英里左右。前段时间听到理想L8、L7刷到9亿公里。
用10亿公里,100亿公里,用户数据闭环来找到这些算法的漏洞。
自动驾驶的鸿沟现在还没有跨过去。
如果跨过这个鸿沟靠炫酷是不够的,重要的是要实用,电动汽车已经跨过了鸿沟,2022年电动汽车我们说新能源汽车的市占率高达26%,2023年应该超过30%是没有问题的;像上海、深圳、广州这种可能是新能源汽车在新车销量里是半壁江山,超过60的市占率了。
L2+或者是自动驾驶这个市占率什么时候上来?这个跨越鸿沟的时间要吸引右边的比较务实的用户靠炫酷不行的,一个城市的NOA非常有用,第二个怎么解决安全问题,L3认证欧洲已经出来了ECER157,国内工信部L3高等级自动驾驶的认证工作正在推进中,不远的将来国内也会发布。
现在国检中心在做这方面的工作,用“三支柱法”,用道路测试、场地地测试和仿真测试,对一辆自动驾驶汽车进行测评。
现在用数据闭环,可以看到现在企业的开发三支柱里虽然仿真也在做,试车场实验也在做,道路也在做。但是三支柱有点儿脱节。
虽然看上去三支柱都在做但是有点脱节,数据闭环只完成了两支柱,道路+数据仿真。
离开试车场数据之后,形成两支柱有这个难题,无法实现全覆盖,一是危险程度无法全覆盖,第二个遮挡程度无法全覆盖,第三个是目标物的种类无法全覆盖,第四是恶劣天气无法全覆盖。
第二个数据闭环不走用户数据闭环采集的费用很高,尤其是数据标记的费用很高,所以近期在学会这边组织,怎么能够完成自动驾驶汽车的认可认证,其中场景库是一个共识,怎么建造一个能够支持自动汽车驾驶汽车开发的场景库。
如何用场景库的数据打通三支柱,AI是数据驱动的,这是近期由学会的战略规划部组织,怎么做好自动驾驶,它的认可认证,其中场景库这块是我做了一个引导,做过几次研讨会,我们提出来一个场景库的数据应该从数据上来体现“三支柱”,数据驱动,这个数据除了道路采集以外,试车场能不能成为数据来源,仿真能不能成为数据来源。
需要做好3个事情。道路采集数据标记成本居高不下,怎么降低成本;第二个实验场的测试怎么提高保真度;第三个是仿真平台怎么提升自信度。
这是我们近期做的工作,做好三支柱里用数据怎么打通三支柱。
第一是降低道路采集数据标准场景,这是必须要做的,AI大模型现在正在发挥着的作用。第二个,有了这个以后,通过数据回灌,来测试说明试车场测试的保真度。
仿真行不行?刚刚做自动驾驶的时候,谷歌招了大量的游戏的团队,这些场景,尤其是前面提到的四类场景,这些边缘场景在道路上很少碰到,能不能像玩游戏,像动画一样把它做出来,游戏团队做的这个方式一开始寄予厚望,后来慢慢这个热情降下来了,发现不行。
随着大模型绘图的出现,又重新燃起了希望,近期有很多做大模型绘图的来生产场景。这是2023年7月21号华为在乌兰察布华为云为汽车行业做的数据中心开业的时候他们的报告,盘古大模型来做场景生成,当时这个报告在介绍的时候由毫末智行做背书,毫末智行盘古大模型绘出来的这个图现在来做AI识别是有帮助的,所以我们希望这个新的场景在道路上如果很难采集到这些场景,能不能用AI大模型画出来,这也是在尝试。
数据是智能化的核心,它是数据驱动的。现在来看,智能驾驶汽车今年面临着几个变革,一个摄像头从200万像素到800万像素,200万像素的摄像头搞不定道路上的一些小目标,今年大概可以看到新出来的大部分都是800万像素。
800万像素的摄像头现在缺少数据集,4D毫米波雷达2023年脱颖而出。激光雷达,大家还是觉得它贵,所以2023年大家关注的是800万像素的摄像头+4D毫米波雷达。他们是不是可以承担起自动驾驶汽车的环境感知,所以我们几家联合起来做了这样的事情,用800万的摄像头和4D毫米波雷达和一个128线的激光雷达,采集车在长沙做了数据采集,这样形成了数据集。
做AI没有数据集什么都做不成,现在200万像素的摄像头,传统毫米波雷达和激光雷达这样的数据集,已经做得非常好了,但是800万像素的摄像头4D毫米波雷达+激光雷达,这样的数据集还没有。
后面有人谈操作系统,我们试图用操作系统解决软硬解耦问题,但是不幸的是,现在的AI还做不到软硬解耦,200万像素摄像头数据集对800万像素的摄像头和传统毫米波雷达和4D毫米波雷达,互相之间还是没有通用性。所以既然新一代自动驾驶汽车的环境感知,传感器发生改变,为了AI开发的话,就需要新的数据集,这是2023年我们在做这一块,有了数据集AI大模型才能做下去。
所以这是近期由学会的战略规划部组织讨论L3的认证到底需要打通哪些环节,对场景库这块。这里面对场景接下来我们会做一个闭门会,形成的共识需要形成一个联盟,AI算法探索依赖开放式数据集。
现在新的感知环境传感器突出表现是800万像素摄像头、4D毫米波雷达,当然激光雷达作为一个标准传感器是需要的,就是需要这样一个全新的开放数据集。第二个是两个创新方法,除了道路采集数据以外,三支柱中,试车场的数据怎么用,仿真平台的数据怎么用,希望用三支柱,对每类场景积累一个我们既有道路采集数据,又有试车场采集数据,又有仿真平台数据,来看道路采集数据是真值,试车场保真度怎么样,仿真平台自信度如何,这样才有可能打通三支柱。
第三个要关注的是接管,L3跟L4不一样,L3驾驶员在车上允许接管,做好接管,一个ODD边界接管现在做得蛮好,关键是这两个危险场景,一个是安全冗余度不足的,或是已知风险的接管怎么做好?再一个是环境感自信度不足的位置,未知危险场景,你搞不定,你觉得是自信度不够高,你不妨把驾驶员喊过来,因为L2+、L3的驾驶员还是在的,所以接管是L3重要的一环。
第二个FSD,特斯拉的12版本在技术路线上也引起了全行业震动,它是AI端到端。AI端到端到底是不是大模型,现在来说不是,是BEV Transfomer+Occupacy+GNN(制图网络),这样的组合。从特斯拉的一些情况来看,特斯拉显然是在做端到端的大模型,用大模型的确可以做到端到端,这方面国内我看华为发明的GOD应该就是占用网络,RCR应该就是制图网络,所以在这块国内跟特斯拉在很多技术路线上没有什么大的变化。
从特斯拉Dojo的建设来看,特斯拉显然在做大模型。
大模型是可以真正做到甩脱这个标签,我们说边缘场景其实就是标签所赐,你没法保证标签是完备的,如果能甩脱标签的话,这个边缘场景可能能够解除。
从特斯拉Dojo算力建设来看,它到后面就要干到100EFLOPS,相当于30万张A100的算力,这个算力显然不是现在的预测式AI所需要的,预测式AI有几百个PFLOPS,甚至1000PFLOPS是足够的,用不着这么高的算力。
从它做这个算力来看,特斯拉应该在做大模型,特斯拉是一家在做,我们如果每个汽车厂都去做,是做不动的。群智来对特斯拉。每个企业都去对特斯拉,当特斯拉做成大模型的时候,我相信国内任何一个汽车厂独立做,做不出动。
因为像刚才看,特斯拉2024年10月份是100E的算力,100EFLOPS的算力是什么概念?我查了一下我们计算规划我们到2025年全国的算力也就是300EFLOPS,特斯拉到明年做100EFLOPS,所以我们每个汽车都要建这样的算力,都要做大模型我想是没戏的。像今年这种“百模”大战,肯定是走不下去的,我们还是要发挥群智的作用才有可能。
今天的技术革命,新能源革命中国已经走到了世界前沿,我们做得非常好。
接下来5年内以L3为标志的智能化革命即将到来,《不颠覆就会被淘汰》这本书看完也是很有感触的,我们的盛况即将到来,所以现在看来也是很有感触的,我们打胜了第一仗,接下来马上要打第二仗——智能化战争。