頭條

何小鵬立“賭約”：明年8月底前達(dá)到特斯拉FSD效果！理想高管回應(yīng)宇樹(shù)王興興質(zhì)疑，多家車(chē)企押注的VLA，靠譜嗎？

每日經(jīng)濟(jì)新聞 2025-12-13 14:25:43

每經(jīng)記者｜孫磊每經(jīng)編輯｜段煉裴健如

12月11日，小鵬汽車(chē)董事長(zhǎng)何小鵬發(fā)文稱(chēng)，小鵬汽車(chē)的VLA 2.0（Vision-Language-Action，視覺(jué)語(yǔ)言動(dòng)作模型）將在下個(gè)季度發(fā)布，“因?yàn)槭堑谝粋€(gè)版本，所以壓力很大”。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtDmNJ2rz0icOXOd0rHl5rFMMuMVkhTaAXmrrYT61ibZlCOvaN6nsy13zA.jpg

圖片來(lái)源：何小鵬微博

此外，何小鵬還與公司自動(dòng)駕駛團(tuán)隊(duì)立下特別“賭約”：若2026年8月30日前，小鵬VLA系統(tǒng)在國(guó)內(nèi)達(dá)到特斯拉FSD V14.2版本在硅谷的整體效果，他將在硅谷籌建特色中國(guó)風(fēng)味食堂。反之，自動(dòng)駕駛負(fù)責(zé)人需在金門(mén)大橋完成裸跑挑戰(zhàn)。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtibTx8jUXNKlNabmWn3uD0gdsTfLuQibMTes3VFW9Vdhial8TY124lseJA.jpg

就在前一天，理想汽車(chē)自動(dòng)駕駛研發(fā)高級(jí)副總裁郎咸朋在社交平臺(tái)發(fā)布長(zhǎng)文，回應(yīng)宇樹(shù)科技創(chuàng)始人王興興此前對(duì)VLA模型的質(zhì)疑。

“我跟王興興觀點(diǎn)最不一樣的地方在于，他認(rèn)為模型架構(gòu)更重要，但我認(rèn)為模型的關(guān)鍵是要與整個(gè)具身智能系統(tǒng)適配。在此基礎(chǔ)上，數(shù)據(jù)是起決定意義的。”郎咸朋認(rèn)為，“VLA就是自動(dòng)駕駛最好的模型方案?！?/span>

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtiaFuZic5FFK7xKbibGvuC3D3duRnNHDJvsaumDWLn7jaosythBF4LTyXA.jpg

近幾年，輔助駕駛行業(yè)經(jīng)歷了多次“技術(shù)底座”的范式遷移——從企業(yè)普遍把激光雷達(dá)+高精地圖奉為“黃金組合”，到引入BEV（鳥(niǎo)瞰圖）+Transformer擺脫高精度地圖，再到端到端將輔助駕駛帶入AI時(shí)代，企業(yè)普遍按照這個(gè)路徑來(lái)推進(jìn)輔助駕駛功能。

但進(jìn)入2025年，行業(yè)在輔助駕駛的發(fā)展方向上出現(xiàn)了VLA與世界模型的“分歧”，而理想與小鵬就是選擇VLA方案的代表。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

兩技術(shù)派別“各執(zhí)一詞”

據(jù)了解，VLA被業(yè)內(nèi)視為端到端方案的“智能增強(qiáng)版”。其名稱(chēng)中的V代表視覺(jué)感知（Vision），A代表動(dòng)作執(zhí)行（Action），而中間的L則是大語(yǔ)言模型（Language Model）。V負(fù)責(zé)實(shí)時(shí)感知環(huán)境，A負(fù)責(zé)輸出具體控制指令，L則像“中臺(tái)”一樣，把感知信息轉(zhuǎn)譯為可供A執(zhí)行的規(guī)劃與決策。

清華大學(xué)車(chē)輛與運(yùn)載學(xué)院助理研究員顏宏偉表示：“VLA是多模態(tài)大模型驅(qū)動(dòng)的智能體架構(gòu)，其核心突破在于引入思維鏈，通過(guò)語(yǔ)言模型實(shí)現(xiàn)對(duì)環(huán)境理解與決策推理的可解釋性?！?/span>

“VLA模型融合了語(yǔ)言模型，具備強(qiáng)大的思維鏈能力，能擺脫傳統(tǒng)端到端模型的黑盒難題，并將信息串聯(lián)、分析，從而推理出因果關(guān)系。此外，它天然集成海量知識(shí)庫(kù)，泛化能力更強(qiáng)，能夠更好地適應(yīng)復(fù)雜多變的真實(shí)道路環(huán)境。”元戎啟行CEO周光認(rèn)為。

不過(guò)，王興興在今年8月的一次演講中則表示：“我個(gè)人對(duì)VLA模型還是保持比較懷疑的態(tài)度。”在他看來(lái)，VLA模型是一個(gè)相對(duì)比較傻瓜式的架構(gòu)，在和真實(shí)世界交互時(shí)，它的數(shù)據(jù)質(zhì)量、能采集的數(shù)據(jù)是不太夠用的。

郎咸朋則認(rèn)為，空談架構(gòu)不如看療效。在自動(dòng)駕駛領(lǐng)域，脫離了海量真實(shí)數(shù)據(jù)談模型架構(gòu)都是空中樓閣，“我們之所以堅(jiān)持VLA，是因?yàn)槲覀儞碛袛?shù)百萬(wàn)輛車(chē)構(gòu)建的數(shù)據(jù)閉環(huán)，這讓我們能在當(dāng)前算力下，把駕駛水平做到接近人類(lèi)”。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtAd6qZUDQKibpVdXibKMMpNgTiaibKdoRY92Jicy7uDmatnq2icKn7bmdODrA.jpg 圖片來(lái)源：理想汽車(chē)官網(wǎng)

郎咸朋稱(chēng)，要想做好自動(dòng)駕駛，必須先把自動(dòng)駕駛當(dāng)作完整的具身智能系統(tǒng)對(duì)待，每一部分在研發(fā)過(guò)程中要相互配合才能將價(jià)值發(fā)揮出來(lái)。此外，他還認(rèn)為，模型的關(guān)鍵是要與整個(gè)具身智能系統(tǒng)適配，在此基礎(chǔ)上，數(shù)據(jù)是起決定意義的。在機(jī)器人領(lǐng)域獲取數(shù)據(jù)相對(duì)困難，但在自動(dòng)駕駛領(lǐng)域，特別是建立起數(shù)據(jù)閉環(huán)能力的車(chē)企來(lái)說(shuō)并不是大問(wèn)題。

盡管郎咸朋表明了機(jī)器人領(lǐng)域與汽車(chē)領(lǐng)域有別，車(chē)企搭建數(shù)據(jù)閉環(huán)并非難事，仍有一些汽車(chē)背景的公司并未踏上VLA這條路徑。比如，華為智能汽車(chē)解決方案BU CEO靳玉志就表示：“我們不會(huì)走向VLA的路徑。這樣的路徑看似取巧，其實(shí)并不是走向真正自動(dòng)駕駛的路徑?！?/span>

“華為更看重WA（世界行為模型），也就是World Action，中間省掉Language這個(gè)環(huán)節(jié)……直接通過(guò)Vision這樣的信息輸入控車(chē)，而不是把各種各樣的信息轉(zhuǎn)成語(yǔ)言，再通過(guò)語(yǔ)言大模型來(lái)控制車(chē)?！苯裰具M(jìn)一步解釋稱(chēng)，華為乾崑自研的WEWA架構(gòu)包含云端的世界引擎（WE）與車(chē)端的世界行為模型（WA）。其中，WE負(fù)責(zé)海量數(shù)據(jù)訓(xùn)練與場(chǎng)景生成，WA則實(shí)現(xiàn)車(chē)端的實(shí)時(shí)環(huán)境推理與擬人化決策。

據(jù)悉，“世界模型”源自人類(lèi)對(duì)環(huán)境的認(rèn)知機(jī)制，指的是AI系統(tǒng)通過(guò)感知數(shù)據(jù)構(gòu)建一個(gè)對(duì)物理世界的內(nèi)部模擬，從而具備預(yù)測(cè)、推理和生成合理行為鏈的能力。在輔助駕駛中，它不再只是“看見(jiàn)”世界，而是理解世界，預(yù)測(cè)未來(lái)可能發(fā)生的情況，并提前做出決策。例如，它不僅能識(shí)別前方有一輛自行車(chē)，還能預(yù)測(cè)它是否會(huì)突然變道，從而提前減速或避讓。

除華為外，蔚來(lái)、商湯等企業(yè)也都在此技術(shù)路線上進(jìn)行布局。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

VLA與世界模型未來(lái)有望深度融合

需要注意的是，盡管不同企業(yè)對(duì)于VLA和世界模型兩種技術(shù)“各執(zhí)一詞”，但兩者并不矛盾。

國(guó)海證券在研報(bào)中表示：“VLA與世界模型在技術(shù)上并非同級(jí)或?qū)α㈥P(guān)系。我們將發(fā)展路徑分為兩派，實(shí)質(zhì)上是產(chǎn)業(yè)玩家在實(shí)現(xiàn)端到端能力之后，在能力優(yōu)化側(cè)重點(diǎn)上出現(xiàn)了分化?！?/span>

“雙方技術(shù)融合趨勢(shì)明顯，雙方均在向?qū)Ψ筋I(lǐng)域滲透。例如，VLA 引入強(qiáng)化學(xué)習(xí)與仿真優(yōu)化動(dòng)作生成?！眹?guó)海證券表示。

理想汽車(chē)董事長(zhǎng)李想在去年底的直播中也提到，VLA可以拆解為預(yù)訓(xùn)練、后訓(xùn)練和強(qiáng)化學(xué)習(xí)三個(gè)層面。強(qiáng)化學(xué)習(xí)中最重要的一步就是在世界模型里閉環(huán)學(xué)習(xí)，引入舒適度、碰撞、交通規(guī)則等規(guī)則來(lái)打磨、反饋，讓VLA比人類(lèi)開(kāi)得更好。

“世界模型的高算力需求（訓(xùn)練和推理都是）決定了它更適合在云端做數(shù)據(jù)生成和極度逼真的仿真測(cè)試和強(qiáng)化訓(xùn)練，這也是理想目前正在做的。”郎咸朋說(shuō)。

小馬智行CTO樓天城則表示：“我了解大部分公司兩種技術(shù)都用，比如Waymo也用了谷歌Gemini大語(yǔ)言模型。世界模型和VLA模型不是一個(gè)維度的東西，而是交錯(cuò)的。這兩個(gè)東西不矛盾、不沖突，機(jī)器人領(lǐng)域非常多。我認(rèn)為想要做百輛無(wú)人車(chē)以上，世界模型最關(guān)鍵。對(duì)其他公司（而言），可能做VLA模型賣(mài)車(chē)最關(guān)鍵。大家選擇不同的路線是因?yàn)槟繕?biāo)不同?！?/span>

值得一提的是，既向C端賣(mài)車(chē)，又計(jì)劃推出Robotaxi的小鵬，有將兩種技術(shù)融合的趨勢(shì)。在11月5日的2025 AI DAY小鵬科技日上，小鵬汽車(chē)正式發(fā)布了第二代VLA。第一代VLA的方案是V到L再到A，第二代VLA是V+L到A，也就是把L轉(zhuǎn)移到了輸入端。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtdp6UpGGoJpJPptE62Xur644icaWTcyUm9fwXGVCa9BGQj3ViaQyaT48A.jpg 圖片來(lái)源：小鵬汽車(chē)官網(wǎng)

“第一代VLA模型中間涉及兩次語(yǔ)言轉(zhuǎn)換，這會(huì)帶來(lái)大量信息損耗，比如一段1200多字的文字描述也無(wú)法精準(zhǔn)地‘翻譯’一個(gè)十幾秒的視頻，而以視覺(jué)為核心，則把模型看到的世界直接轉(zhuǎn)換成運(yùn)動(dòng)軌跡?！焙涡※i說(shuō)。

11月7日的上海進(jìn)博會(huì)上，小鵬汽車(chē)自動(dòng)駕駛產(chǎn)品高級(jí)總監(jiān)袁婷婷分享了她對(duì)小鵬二代VLA架構(gòu)的理解：“小鵬的二代VLA既是VLA模型，也是世界模型。”

在其展示的PPT中，世界模型是作為二代VLA的一個(gè)記錄器存在的：當(dāng)V和L作出車(chē)輛運(yùn)動(dòng)軌跡和動(dòng)作決策時(shí)，這個(gè)決策會(huì)被記錄到世界模型中；同時(shí)，與這個(gè)決策一同被記錄的，還有決策前的車(chē)輛狀態(tài)，即V和L形成的感知信號(hào)。也就是說(shuō)，小鵬二代VLA在用其VLA數(shù)據(jù)訓(xùn)練世界模型。

在小米汽車(chē)主任科學(xué)家陳龍看來(lái)：“一個(gè)管‘抽象思考’，一個(gè)管‘物理感知’，完全沒(méi)必要拉踩！VLA+WM的結(jié)合，才是通往更強(qiáng)通用具身智能。”

對(duì)于輔助駕駛底層技術(shù)的演進(jìn)，國(guó)元證券方面認(rèn)為，未來(lái)，VLA與世界模型的深度融合，有望成為高階智駕系統(tǒng)實(shí)現(xiàn)類(lèi)人駕駛決策能力的關(guān)鍵拐點(diǎn)。

長(zhǎng)安汽車(chē)智能駕駛高級(jí)總工程師則表示，在未來(lái)2至3年內(nèi)，輔助駕駛的技術(shù)架構(gòu)還將迎來(lái)1至2輪迭代，到2028年有望收斂至相對(duì)穩(wěn)定的狀態(tài)。

（聲明：文章內(nèi)容和數(shù)據(jù)僅供參考，不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。）

記者|孫磊

編輯|段煉?裴健如?杜波

校對(duì)|黃博文

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

｜每日經(jīng)濟(jì)新聞 ?nbdnews? 原創(chuàng)文章｜

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

號(hào)稱(chēng)年化4%~5%的“低風(fēng)險(xiǎn)”金融產(chǎn)品突然爆雷，眾多投資者“踩雷”，規(guī)模上百億元！“祥源系”多地項(xiàng)目幾近停工，背后浙商大佬陷危機(jī)

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

2025年電影總票房已破500億元

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

国产精品不卡一区,国产精品一区二区电影,精品日韩免费,91精品国产色综合久久不卡98最新章节,欧美操日本美女,欧美91,日韩激情视频在线播放

何小鵬立“賭約”：明年8月底前達(dá)到特斯拉FSD效果！理想高管回應(yīng)宇樹(shù)王興興質(zhì)疑，多家車(chē)企押注的VLA，靠譜嗎？

何小鵬立“賭約”：明年8月底前達(dá)到特斯拉FSD效果！理想高管回應(yīng)宇樹(shù)王興興質(zhì)疑，多家車(chē)企押注的VLA，靠譜嗎？