自2023年8月,特斯拉在美國(guó)推出端到端智駕系統(tǒng)「FSD V12測(cè)試版」后,端到端就成為了汽車行業(yè)最火爆的話題。隨著華為、小鵬、蔚來、理想等企業(yè)的跟進(jìn),國(guó)內(nèi)幾乎每個(gè)廠商都會(huì)在發(fā)布會(huì)上花費(fèi)很大的篇幅來宣傳自家的端到端有多么強(qiáng)大。撇開營(yíng)銷手段不談,“端到端”到底是什么意思?它對(duì)于智駕又有什么意義呢?今天我們就來給大家解讀這個(gè)問題!
在端到端智能駕駛系統(tǒng)還未量產(chǎn)之前,各家的智駕都采用了模塊式方案。簡(jiǎn)單來說,模塊式智駕就是一個(gè)流水線,主要有感知、預(yù)測(cè)、規(guī)劃、控制四個(gè)流程。首先,感知部分的任務(wù)就是把車輛的雷達(dá)、攝像頭等傳感器的數(shù)據(jù)進(jìn)行處理,然后分析車輛周圍物體的具體位置、道路軌跡,以及辨別它們到底是行人、自行車、轎車、還是卡車等。
緊接著,感知模塊就會(huì)把以上的信息傳給預(yù)測(cè)模塊,預(yù)測(cè)模塊會(huì)根據(jù)以上的信息分析周邊交通參與者下一步的運(yùn)動(dòng)狀態(tài),比如周圍的車輛接下來是要轉(zhuǎn)彎、直行、還是停車等。通過進(jìn)一步分析后,預(yù)測(cè)模塊會(huì)提供一條或者多條本車接下來可參考的行駛路徑以及車速。
隨后預(yù)測(cè)模塊又把本車的道路行駛方案發(fā)給規(guī)劃模塊,規(guī)劃模塊會(huì)根據(jù)車輛自身狀態(tài)、導(dǎo)航等信息來決定車輛接下來該具體怎么做。等到規(guī)劃模塊確認(rèn)好行駛路徑和速度后,就將命令傳遞給控制模塊,最后再由控制模塊去計(jì)算和操作車輛的方向盤、剎車以及油門。一個(gè)看似簡(jiǎn)單的智駕功能,就是通過以上步驟實(shí)現(xiàn)的。
通過以上介紹不難看出,模塊式智駕把簡(jiǎn)單的駕駛行為分解為多個(gè)步驟,而且每一步的邏輯都嚴(yán)絲合縫。在車企和供應(yīng)商看來,模塊式智駕本身是個(gè)非常好的方案,因?yàn)椴煌膱F(tuán)隊(duì)可以負(fù)責(zé)相應(yīng)的模塊,發(fā)揮分工合作的優(yōu)勢(shì),從而把智駕從概念迅速變?yōu)檠b車量產(chǎn)狀態(tài)。
其次,模塊式智駕有一套職能和責(zé)任都非常清晰的系統(tǒng)框架,因此當(dāng)智駕系統(tǒng)在使用中發(fā)現(xiàn)BUG的時(shí)候,車企和供應(yīng)商都能立即找到BUG的具體原因,并通過OTA迅速修復(fù)。比如車輛在高速行駛時(shí)出現(xiàn)了誤剎車,那么通過數(shù)據(jù)分析,車企就可以知道故障是因?yàn)楦兄K的數(shù)據(jù)有誤,還是預(yù)測(cè)、規(guī)劃模塊給出了錯(cuò)誤的判斷。
雖然模塊式智駕便于量產(chǎn)和修復(fù)BUG,但是要想讓它能像人一樣控制車輛,就需要學(xué)習(xí)諸多的交通規(guī)則和駕駛經(jīng)驗(yàn),而這一切都要靠工程師們事先去定義規(guī)則,也就是把交通規(guī)則和人的駕駛經(jīng)驗(yàn)變成一行行軟件代碼。
但是光靠工程師寫代碼就能把現(xiàn)實(shí)中所有的駕駛場(chǎng)景都覆蓋嗎?當(dāng)然是不可能的!關(guān)于這個(gè)問題,業(yè)內(nèi)就有一個(gè)經(jīng)典的案例,如果你在兩側(cè)停滿車的狹窄道路駕駛車輛,此時(shí)道路一側(cè)突然飄來一個(gè)氣球,那么一般的邏輯會(huì)認(rèn)為,道路一側(cè)可能會(huì)有小孩躥出來,所以此時(shí)車輛應(yīng)該立即剎車。但同樣的場(chǎng)景放在高速上,如果智駕系統(tǒng)仍舊采取立即剎車的方式控制車輛,那很可能演變?yōu)橐粓?chǎng)追尾事故。換言之,工程師如果沒有針對(duì)這類駕駛場(chǎng)景事先定義好規(guī)則,比如高速檢測(cè)到氣球后系統(tǒng)不剎車,那么智駕系統(tǒng)遇到類似場(chǎng)景就會(huì)產(chǎn)生安全風(fēng)險(xiǎn)。
按照小鵬汽車的說法,一個(gè)比較穩(wěn)定的量產(chǎn)智駕系統(tǒng),大約有10萬條規(guī)則。而如果智駕系統(tǒng)要接近人一樣的水平,大約需要人工編寫10億條規(guī)則。對(duì)于軟件工程開發(fā)來說,這幾乎是一件不可能完成的事情。正因如此,我們可以看到傳統(tǒng)智駕系統(tǒng)在日常使用中或多或少會(huì)出現(xiàn)各種錯(cuò)誤,以至于駕駛者不得不進(jìn)行干預(yù)。
基于以上原因,專注于自動(dòng)駕駛的車企一直在想辦法解決傳統(tǒng)智駕需要預(yù)設(shè)規(guī)則的問題,于是便有了端到端。所謂的端到端,其實(shí)就是將傳統(tǒng)的感知-預(yù)測(cè)-規(guī)劃-控制這些子模塊全部神經(jīng)網(wǎng)絡(luò)化,也就是用先進(jìn)的算法模型取代了傳統(tǒng)的算法和人工編寫的規(guī)則。
因此在工作流程上,端到端與傳統(tǒng)的模塊式有著較大的不同。傳統(tǒng)模塊式的工作順序是感知-預(yù)測(cè)-規(guī)劃-控制依次進(jìn)行的,而端到端的順序是傳感器數(shù)據(jù)(雷達(dá)、攝像頭)-神經(jīng)網(wǎng)絡(luò)-駕駛參數(shù)(方向盤、油門、剎車),也就是說,傳統(tǒng)的感知、預(yù)測(cè)、規(guī)劃、以及控制模塊的工作全部由神經(jīng)網(wǎng)絡(luò)完成。
從工作流程可以看到,端到端中的核心技術(shù)就是神經(jīng)網(wǎng)絡(luò),而與神經(jīng)網(wǎng)絡(luò)最息息相關(guān)的技術(shù)就是AI了。這兩年,AI在語音、文字、圖片、以及視頻領(lǐng)域表現(xiàn)出了強(qiáng)大的性能,大家應(yīng)該也體會(huì)到了。當(dāng)神經(jīng)網(wǎng)絡(luò)應(yīng)用到汽車上之后,就意味著人們可以不斷地訓(xùn)練智駕系統(tǒng),從而使它學(xué)習(xí)適應(yīng)更復(fù)雜的駕駛環(huán)境。
因此在功能層面,端到端最大的變化就是系統(tǒng)具有自主學(xué)習(xí)的能力,這是傳統(tǒng)模塊式智駕不具備的功能。如此一來,在處理各種意想不到的真實(shí)駕駛場(chǎng)景時(shí),端到端可以通過神經(jīng)網(wǎng)絡(luò)計(jì)算得出合適的規(guī)則,而不需要人工事先編寫好規(guī)則,這也就為智駕應(yīng)對(duì)現(xiàn)實(shí)中無窮無盡的駕駛場(chǎng)景提供了解決方案。比如之前不具備端到端功能的特斯拉FSD V11版本,一共編寫了30多萬行代碼,而采用端到端的FSD V12版本,直接把30多萬行代碼刪減到了2000行,但FSD V12的表現(xiàn)卻比V11更接近人類駕駛員。
從理論上看,端到端確實(shí)是一個(gè)非常理想的技術(shù),但是在實(shí)際操作中,端到端也沒有那么可靠。這是因?yàn)楝F(xiàn)階段人們對(duì)神經(jīng)網(wǎng)絡(luò)的理解依舊不夠清晰透徹,因此人們也把神經(jīng)網(wǎng)絡(luò)稱為“黑盒”。如上圖所示,在白盒狀態(tài)下我們非常清楚系統(tǒng)輸入/輸出之間的邏輯因果關(guān)系,但輸入信息經(jīng)過黑盒時(shí),人們無法解釋輸入的信息為什么會(huì)變成輸出的信息。
比如當(dāng)智駕系統(tǒng)出現(xiàn)明顯的邏輯錯(cuò)誤時(shí),在模塊式系統(tǒng)上車企可以非常迅速找到問題出在哪個(gè)模塊,然后人工編寫一個(gè)新的規(guī)則。但在端到端系統(tǒng)上,車企并不知道復(fù)雜的神經(jīng)網(wǎng)絡(luò)中哪一個(gè)參數(shù)或者結(jié)構(gòu)存在問題。
正因如此,基于神經(jīng)網(wǎng)絡(luò)打造的端到端智駕系統(tǒng),有時(shí)候它能在很復(fù)雜的場(chǎng)景中給出合理的規(guī)則,但有時(shí)又會(huì)犯十分低級(jí)的錯(cuò)誤,比如分不清紅綠燈,于是有人就把端到端形容為:“上限很高,下限很低”。考慮到端到端在實(shí)際應(yīng)用中存在一些風(fēng)險(xiǎn),所以華為、小鵬推出的端到端智駕系統(tǒng)并非完全靠自主學(xué)習(xí),二者的端到端系統(tǒng)依然有很多人工編寫的規(guī)則來為智駕系統(tǒng)兜底。
從技術(shù)發(fā)展趨勢(shì)來看,端到端肯定是未來高階智駕的方向,但由于人們對(duì)于神經(jīng)網(wǎng)絡(luò)的了解還不夠透徹,所以現(xiàn)階段各家端到端的表現(xiàn)依舊與理想中的水平有一定差距。另外,相比現(xiàn)有的模塊式智駕系統(tǒng),端到端的神經(jīng)網(wǎng)絡(luò)算法模型的聰明與否,極度依賴海量的真實(shí)數(shù)據(jù)來訓(xùn)練,只有經(jīng)過海量數(shù)據(jù)訓(xùn)練,神經(jīng)網(wǎng)絡(luò)才能從小模型變成好用的大模型,這意味著高階智駕在開發(fā)階段需要巨大的算力和數(shù)據(jù)投入,因此無形中提高了智駕的門檻。正因如此,才會(huì)有車主反饋?zhàn)约旱能嚿?jí)端到端智駕后,反而不如過去好用了,這就是大模型訓(xùn)練的陣痛期。考慮到現(xiàn)實(shí)中各家的端到端在訓(xùn)練上存在較大的差異,這意味著將來不同品牌智駕系統(tǒng)的性能差距可能會(huì)逐漸被拉大。