[汽車之家 行業(yè)] 11月15日,第二十二屆廣州國際汽車展覽會正式開幕。在本屆車展中,汽車之家邀請了極氪智能科技產(chǎn)品管理部部長石穿空展開深入交流,共話車市風(fēng)云、聚力行業(yè)未來。
在此次交流中,石穿空向汽車之家表示:“此次車展,我們發(fā)布了面向未來的技術(shù)架構(gòu),引入了端到端Plus的概念。Plus是什么呢?就是我們的數(shù)字先覺網(wǎng)絡(luò)。數(shù)字先覺網(wǎng)絡(luò)不是一個圖,它更多是本地司機的長期記憶,就和大腦的海馬體有點像的,短期的記憶。它每天都在發(fā)生,又很重要,轉(zhuǎn)化成長期記憶存儲起來給大腦調(diào)用,跟海馬體的功能很像。有它的加持,可以做到?jīng)Q策的提前,規(guī)避潛在的風(fēng)險!
以下為對話實錄:
汽車之家:目前無圖智駕大概量產(chǎn)上車的情況怎么樣?
石穿空:我們現(xiàn)在包括無圖城市NZP10月份開始大規(guī)模公測,到今天為止我們進(jìn)一步擴大公測規(guī)模,預(yù)計可以達(dá)到萬人的規(guī)模。到今年年底整個無圖NZP就會釋放給全量的用戶。本身我們?nèi)珖f人用戶可以到處都能用,到年底所有用戶都可以放給他們,包括搭載“浩瀚智駕2.0”的幾個車型都會開放出去。
汽車之家:我們的無圖智駕在今年年底可以全國開通,全國跑了?
石穿空:全國和全量搭載浩瀚智駕2.0系統(tǒng)車型的用戶。
汽車之家:如何理解我們的數(shù)字先覺網(wǎng)絡(luò),端到端架構(gòu)是怎么應(yīng)用?
石穿空:因為極氪相對來說起步比其他新勢力,一些頭部友商起步比較晚,所以我們在整個技術(shù)的規(guī)劃,尤其是技術(shù)架構(gòu)的規(guī)劃上面,寧愿在開始的時候想的清楚一點,這樣避免在后面少走彎路。我們一開始就做了很多思考,端到端是行業(yè)都比較認(rèn)同的技術(shù),本身這個事情是確定要去做的。
從去年12月第一代發(fā)布的時候,我們已經(jīng)在做。包括近期友商在做的視覺大語言模型,我們阿爾法實驗室也在做這個研究,同步我們在明年上半年,甚至可能會更早,類似于視覺語言大模型也會上車。
在這個基礎(chǔ)上我們也會思考,汽車的傳感器不只是視覺,還有激光,還有毫米波雷達(dá),甚至將來還包括聲音,因為人開車時都有各方面的思路,這些信息都是對于自動駕駛來說,我們將來不僅會搞視覺語言大模型,還會做多模態(tài)的語言大模型,MLM的大模型。這是行業(yè)在走的方向,我們也是提前去思考的,并且端到端已經(jīng)在今年8月正式落地了。
我們同時在思考另外一個問題,比如我經(jīng)常在杭州灣和上海待的時間比較多,開車去上海和杭州灣,用句夸張的話說,我閉著眼睛都知道上下班的路是怎么樣,相當(dāng)于是本地老司機。其實我們會發(fā)現(xiàn),包括落地端到端之后,整個無圖NZP我們做了很多測試,本身它實際的體驗已經(jīng)非常好了,相信整個行業(yè)也是一樣的。包括路口的通行,類人性已經(jīng)非常好了。但我們發(fā)現(xiàn)一些問題是端到端和VLM,甚至將來的MLM可能解決不了的。我們思考一個問題,為什么一個本地老司機在本地開的很好,但到了外地他就會謹(jǐn)慎很多。因為我們想不通,你的駕駛技巧也在,駕駛經(jīng)驗也在,該學(xué)的這些知識也都學(xué)過,為什么到陌生的地方就是變謹(jǐn)慎了,開的慢了,所以我們帶著這個疑問也在目前技術(shù)架構(gòu)上思考這些問題。
這就是今天我們帶來思考的結(jié)果,也是跟行業(yè)分享一下我們思考探索的情況,今天上午我們發(fā)布了面向未來的技術(shù)架構(gòu),在端到端+MLM,以及有一個安全底線基礎(chǔ)模型上,我們引入了端到端Plus的概念。Plus是什么呢?就是我們的數(shù)字先覺網(wǎng)絡(luò)。舉個例子,比如說你看到前面某一個車,可能是三車道的路,其中一個車道前面有一個深坑。人開呢,這個深坑會繞開,或者實在繞不開,可能會減速。端到端Plus大模型如果這種場景學(xué)習(xí)過,它在光照條件比較好的情況也能去處理的。有可能在五六十米、七八十米之外看見之后,它學(xué)過了,周邊的交通環(huán)境也比較好,可能會繞開,當(dāng)它繞不開也會減速通行。但這里仍然存在一個問題,有些場景下,比如說逆光或者黑夜,有可能整個光照條件也不好,等它到七八十米時并不能很好地實時識別,可能要等到更近了,包括大燈照的更清楚了,才能識別準(zhǔn)確,更可信任了。那時候已經(jīng)是二三十米了,等它識別出來,一個80碼的速度去過,它可能來不及響應(yīng)。識別之后有可能不得不來個急減速,體感就很不好。急減速之后還得壓過去,這個坑如果深的話,有可能胎或者輪轂都會受到傷害。甚至更嚴(yán)重的,還會影響方向盤,還會導(dǎo)致事故。
也有些人會說不一定減速,周邊沒有障礙的話可以發(fā)起急的轉(zhuǎn)向,但要在二三十米發(fā)起急轉(zhuǎn)向,后方有來車也是很危險的。不管怎么樣,這種情況就會導(dǎo)致潛在風(fēng)險的可能。你有數(shù)字先覺網(wǎng)絡(luò),因為這條路假設(shè)是陌生的,沒有辦法。這條路你是每天上下班都會開的,我不一定要看見,我在1公里之外,甚至200米開外就知道前面是有個坑的,我沒必要等到看到再去做響應(yīng),可能會提前去做一些響應(yīng),是表達(dá)這個意思。數(shù)字先覺網(wǎng)絡(luò)可以做到?jīng)Q策的提前,規(guī)避潛在的風(fēng)險。
舉個例子,比如他們都說扁鵲治病很厲害,但真正厲害的是扁鵲治未病之病,生小病時已經(jīng)治好了,其實先覺網(wǎng)絡(luò)就是這樣一個思考!
汽車之家:比如我們很多車在路上跑會收集很多數(shù)據(jù),把實時數(shù)據(jù),比如路況信息,一些障礙信息提前輸入到端到端Plus網(wǎng)絡(luò)之中,同樣路況下我知道前面有一定障礙風(fēng)險了,提前減速,做提前的準(zhǔn)備,再結(jié)合端到端更好地去過這個路口或路段。
石穿空:對,我們說本地老司機。
汽車之家:極氪車主都可以共享數(shù)據(jù)。
石穿空:現(xiàn)在我們剛起步,將來我們規(guī)劃當(dāng)中你開的本地化信息也可以共享。我這邊要強調(diào)數(shù)字先覺網(wǎng)絡(luò)不是一個圖,這次我們的無圖NZP只用了SD的導(dǎo)航信息,任何高清地圖我們都沒有用。數(shù)字先覺更多是本地司機的長期記憶,就和大腦的海馬體有點像的,短期的記憶。它每天都在發(fā)生,又很重要,然后會轉(zhuǎn)化成長期記憶存儲起來給大腦調(diào)用,跟海馬體的功能很像。我們起了一個名字叫“數(shù)字先覺網(wǎng)絡(luò)”,幫助大家更好的理解,它不只是一個圖。圖里可能是一些車道級信息,然后停止線,拓?fù)渥龅煤芗?xì),但你會發(fā)現(xiàn)坑不能算作傳統(tǒng)意義上的高精地圖。還有小區(qū)路口,經(jīng)常有車躥出來,這不是高清地圖能標(biāo)識的。還有紅綠燈被樹葉遮擋,這種是動態(tài)的時空環(huán)境的信息。
我們把數(shù)據(jù)先覺網(wǎng)絡(luò)歸納兩部分:1.信息先覺,有道路先覺、行為先覺、時空先覺。2.經(jīng)驗先覺,我們將來會利用數(shù)字先覺網(wǎng)絡(luò)去把人駕的經(jīng)驗和信息進(jìn)一步學(xué)習(xí)和提煉,實現(xiàn)駕駛經(jīng)驗的先覺。我們知道上海司機開車的風(fēng)格和武漢司機,成都、重慶、廣州的開車風(fēng)格都不一樣,不僅每個地方司機開車風(fēng)格不一樣,甚至每個人開車風(fēng)格也不一樣。這里把人開車的風(fēng)格,將來也可以丟到數(shù)字先覺網(wǎng)絡(luò)里訓(xùn)練,可以實現(xiàn)千城千面,更遠(yuǎn)的將來可以實現(xiàn)千人千面,因為只有自己的開車風(fēng)格是最習(xí)慣的。你把一個上海司機開車風(fēng)格丟到武漢去,他肯定不喜歡的。
端到端比以前規(guī)則時代已經(jīng)好很多了,因為規(guī)則時代可能更像是新手司機,我不知道這樣比喻對不對?赡芾蠋熃踢^的,教練教過的,他知道,他會去開,老師沒有教過的,他不知道怎么辦了,像新手司機。端到端之后,他更像一個開了幾年的老司機,老師教過的東西,他上了路也有沒有遇到的情況,他自己摸索了。就像數(shù)據(jù)給喂了之后,他摸索學(xué)會了,有一些老師沒有教過的也能開。它的泛化性比規(guī)則要好,因為數(shù)據(jù)丟進(jìn)去之后,它不僅遇到的問題知道怎么解,類似的一連串的問題也能解。端到端還是比規(guī)則時代提升了很多。
如果比作駕駛考試的話,相對于原來規(guī)則你考個六七十分,端到端上限能大幅度提升到90分。而VLM/MLM,像人類老司機一樣,我們開車場景不只是車或者人,有一些物理世界通識在里面。比如一個尼龍袋,端到端學(xué)習(xí)后認(rèn)為是一個突出的物體,是個GOD通用障礙物,不能撞。但有了VLM/MLM,它知道是尼龍袋可以壓過去,有更多的知識在里面,不僅是交通知識,會幫助這個司機變成一個人類老司機。
如果說端到端+VLM/MLM,可以做到95分,再進(jìn)一步你要考到99分的話,就需要數(shù)字先覺網(wǎng)絡(luò),將來在更多的情況下體驗會更好。
汽車之家:特斯拉和小鵬已經(jīng)是純視覺,還有激光雷達(dá)的輔助,極氪未來考慮純視覺路線,還是激光雷達(dá)技術(shù)作為保障?
石穿空:在技術(shù)上我們兩條路線都是在做準(zhǔn)備的,為什么都在做準(zhǔn)備呢?其實有一個信息,我不知道你有沒有注意到,我們“浩瀚智駕1.0”發(fā)布之后,我們上線的007既有激光版又有純視覺版的。像其他友商最近在上純視覺的智駕,其實我們?nèi)ツ?2月份時候已經(jīng)上了純視覺版的,那時候只支持高速的能力。我們第一次量產(chǎn)時是同時配置兩個車型,其他廠商要么發(fā)激光的,要么先發(fā)視覺的,沒有兩個配置一塊同時發(fā)的。
對于第二點來說,你的問題更多是純視覺將來要不要去做純視覺版城區(qū)的智駕。技術(shù)上我們會一直準(zhǔn)備的,但用不用,這里有兩個考量,我們本身的觀點認(rèn)為作為將來智駕的發(fā)展,包括現(xiàn)在從安全角度來講,激光也還是有必要的。因為激光本身是主動光的探測,它在整個探測結(jié)果的時延、精度以及測速和測量距離、位置的精度上,其實是有天然不可替代的優(yōu)勢。然后尤其在黑夜或者雨霧、逆光場景,它不像攝像頭會需要ISP做不同的調(diào)校,讓算法去調(diào)優(yōu)。本身算力就會涉及到時延,激光是主動物理的探測,純視覺是基于算法的,時延上本身就會有些影響。還有測量精度,激光是有些優(yōu)勢的。我們認(rèn)為純視覺就像教一個小孩去學(xué)習(xí),他本身學(xué)習(xí)能力要很強,視覺是打底的,是主要的東西。但激光并不是沒有用,激光的優(yōu)勢是顯而易見的。你優(yōu)先把視覺做得很強,再用激光好上加好。
我們認(rèn)為激光將來更多用于安全的冗余、安全的兜底,包括面向?qū)砀唠A的駕駛,怎么去做冗余,傳感器的冗余是很有必要的,這是技術(shù)上的思考。
當(dāng)然,是不是激光或者純視覺,更多是商業(yè)上的思考,成本上去掉激光會更便宜一點。還有車型的定位是怎樣的,其實好多用戶越來越懂智駕了,它的芯片算力大不大,有沒有配置激光,用戶第一印象就是有沒有這個。有了這個,我們會認(rèn)為好,然后再說算法怎么牛,體驗好不好。所以是兩方面,一方面是技術(shù)的,一方面是商業(yè)上的車型定位,以及這個車型將來對應(yīng)的用戶群體怎么樣,這個可能不是技術(shù)上怎么樣,技術(shù)上就做好準(zhǔn)備。
汽車之家:我們現(xiàn)在聽到一些用戶聲音,一種是用純視覺的,覺得算法已經(jīng)特別好了;還有一種認(rèn)為用純視覺就省成本,不給高端硬件。還有的認(rèn)為用激光的更安全更有保證,還有的認(rèn)為用激光的算法不好,用戶也在搖擺之中,這個階段智駕大家還是在選走哪個方向,哪個路走得更順,我們都可以去選擇。
石穿空:這兩個技術(shù)路線,我個人認(rèn)為不是技術(shù)路線之爭,因為帶激光在視覺算法上的技術(shù)儲備我們一直在做的,不會說用激光之后純視覺就不搞了,肯定純視覺基礎(chǔ)上再加入激光,同步在搞,本身不是技術(shù)路線之爭,完全是產(chǎn)品定義的考量。你可以有純視覺,也可以有激光,具體取決于自己車型面向的是什么樣的用戶群體,你的車想賣到什么樣的成本價位,用戶群體是怎樣的,是這個思考,我認(rèn)為不是技術(shù)路線。我不認(rèn)為搞了激光之后,視覺技術(shù)就不搞了。
汽車之家:最后一個問題,剛才聊了這么多智駕方面,極氪除了智駕,在本身產(chǎn)品競爭力上也很強,現(xiàn)在有什么可以分享新技術(shù),以及未來極氪產(chǎn)品的規(guī)劃。
石穿空:面對未來兩三年的技術(shù)架構(gòu),包括我們早上發(fā)布端到端Plus的新技術(shù)架構(gòu)和數(shù)字先覺網(wǎng)絡(luò),技術(shù)方面我就不再重復(fù)了。
產(chǎn)品上最新的規(guī)劃,也是前面陳總介紹過的,除了無圖城市NZP,我在年底會全國全量釋放給搭載“浩瀚智駕2.0”車型,車位到車位的功能,2025年就看車位到車位了,因為2024年大家都在看無圖全國,2025年就在看車位到車位。車位到車位,其實目前為止,但我還沒有看今天廣州車展的情況,反正之前我了解到也就1-2家友商給媒體試駕過,給用戶試駕過,其實沒有幾家。我們極氪是第一批這樣去發(fā),包括10月底我們已經(jīng)給大量媒體真正體驗過端到端,我們地庫的兩個抬桿可以過,還上了高速的ETC,我們的端到端支持一次可以過4個抬桿。
汽車之家:今天友商這些我們在實踐中已經(jīng)可以體驗了。
石穿空:因為我們本身泊車的能力也很強,機械車位也可以支持,因為現(xiàn)在整個行業(yè)支持機械車位的也就一兩家。我們針對無劃線車位,本身泊車就支持。所以端到端我們預(yù)計2025年1月份會分批開始啟動,向用戶推送。我們的目標(biāo)是計劃在2025年年中左右,上半年看能不能更大規(guī)模給用戶推送出去,大概是這樣的。
汽車之家:謝謝,今年極氪是給了我們非常多驚喜的品牌,包括產(chǎn)品,包括技術(shù),包括價格。
石穿空:下半年我們迭代很快,包括無圖智駕方案,用戶反饋說其實他沒有那么急,但極氪是真的快!
汽車之家:以前我們感覺新勢力往前跑得很快,我們這些有傳統(tǒng)車企背景的品牌會比較嚴(yán)謹(jǐn),F(xiàn)在看,極氪不管從嚴(yán)謹(jǐn)角度還是從技術(shù)迭代角度都很快,讓用戶可以持續(xù)體驗,在銷量上勢頭也很猛,包括7X銷量也是能印證的。除了卷價格之外,極氪的產(chǎn)品力也很強。
好評理由:
差評理由: