深入探討特斯拉 FSD v12.3:馬斯克為什麼強調它是「端到端」?
特斯拉日前在美國擴大推送免費試用一個月「受監督」自動駕駛補助系統 FSD v12.3 之後廣受好評,光跟 v12.2.1 相比,許多人認為電腦決策比之前更靈活、更順暢,也更接近人類,甚至能行車禮儀、禮讓行人的部分都做得唯妙唯肖。
對一般車主來說這是一次「有感升級」,但對整體汽車產業來說,卻是一件不可忽視的事件;這是因為 FSD v12 終於實現了馬斯克(Elon Musk)口中的端到端自動駕駛。遙望整個產業,目前技術力上能讓系統穩定到大規模上路的相關廠商,也只有特斯拉、comma.ai,以及品質沒那麼好,但正在努力追趕的中國廠商。
什麼是端到端自動駕駛?
要了解 FSD v12 首先就得先了解馬斯克口中的端到端,也就是 End-to-End Deep Learning(端到端深度學習),簡言之,它的目標是建立一個完整的學習系統,但可以直接從原始輸入數據中學習,並生成所需的輸出,不需要人為地將任務分解成多個中間步驟。
之前,特斯拉的自動駕駛主要依賴事先定義好的規則判斷。系統先透過鏡辨車道、行人、車輛、標誌等關鍵資訊,再由工程師編寫數十萬行 C++ 程式碼,應對紅燈停、綠燈行等各種場景,任何一個行為都有相對應的規則、條件判斷的程式,但這種做法終究難以涵蓋複雜多變的真實路況。
這也是馬斯克日前說出那句經典名言「傻子才用光達」的主因,馬斯克一部分認為光達會增加車輛硬體成本,另一方面,他認為應該用收集純視覺數據,直接使用端到端深度學習模型來訓練出自動駕駛系統。(雖然最近特斯拉也開始重新擁抱光達了)
如果還要細分 FSD v12 的神經網路,可分為三大部分:感知、決策和輸出控制。感知部分接收攝影機的影像,並從中辨識和理解周遭環境,建立出一個語義模型。這個語義並非人類語言,而是神經網路自行發展出的對世界的理解方式。
決策部分則依據感知得到的世界模型,判斷下一步該採取什麼行動。這包含短期的碰撞避免,以及長期的導航規劃。最後,輸出控制部分負責將決策轉換成實際的駕駛動作,例如轉動方向盤、踩油門或煞車等。過去這部分也是用人工編寫的啟發式(heuristic)程式碼,現在則改用神經網路,讓系統學習如何平順地控制車輛。
要練,也沒你想的那麼簡單
當然收集數據是特斯拉的「天然優勢」,特斯拉全球 200 萬台車每天約可收集 1600 億幀的駕駛影片用於模型訓練。聽起來不難,對把?就連原本特斯拉工程師預估,大概需要 100 萬部駕駛影片就能訓練出初步可用的模型了。
不過在《馬斯克傳》中馬斯克親口解釋,管理如此龐大的數據並非易事,因為絕大多數影片都是無用的,他強調真正寶貴的是那些車流量異常大、或是有眾多行人做出各式各樣的行為,路況極其複雜的畫面,這佔比甚至連 1% 都不到。但不要小看這「1% 都不到」,為了處理這每天 1600 億幀中 1% 的畫面,背後代表有足以應付 1600 億幀的龐大人力、算力、儲存甚至是電力等鉅額成本。
要採用端到端模型還有一個技術難題,那就是它實際上是個黑盒子。就拿 ChatGPT 背後的 GPT 模型簡單舉例,大家應該還記得,ChatGPT 剛推出的時候能力很強但也非常會「胡說八道」,這是因為端到端模型若沒有經過微調,很容易會受異想不到的資料影響。
語言模型還能馬上糾正,但在自動駕駛領域,哪怕是萬中之一的錯誤,一有決策規劃出錯了就有可能是嚴重到危及生命的事故,但就算出錯,「黑盒子」本身也不像 C++ 語言一樣工程師可以馬上 debug,研究人員得在根本不知道差錯原理的前提下,不斷微調、修正、再訓練來提高準確率。
目前還有哪些問題?
就算目前網路上大多都持好評,但不少人發現 FSD v12.3 還是有許多瑕疵,其中最受使用者詬病的是導航品質不穩定。目前 FSD 在美國的導航資訊源主要來自 Google 地圖,再額外輸入神經網路模型中。有專家就推測,FSD v12.3 這套端到端模型在前文提到的「決策過程」 ,在跟 Google 地圖連結這一段可能還沒強化好(因為這些純視覺資料「沒有導航」,所訓練出來的模型理論上不知道 Google 地圖在幹嘛),導致決策過程資訊不連貫,才會出現導航品質不穩定的情形。
另一個常見問題是系統在某些場合表現得過於謹慎,例如在沒有其他車輛的路口,仍會做出完全停車再起步的動作,這可能源於訓練數據中罕見此類場景,或是偏好保守策略所致。
但上述問題「理論上」並不算特別難解決。但行文最後,大家可以看到馬斯克本人在今年特斯拉股價雪崩後,試圖想要透過發表 FSD v12、大規模免費試用、願意對外授權 FSD,以及預告 8/8 號推出無人駕駛計程車 Robotaxi 等一系列操作,引導市場想像「特斯拉是一間科技公司,而不是汽車廠」,來稍稍掩蓋製造量被比亞迪超過、面臨中國車市巨大內卷,以及次世代車款明年上市間巨大空白期等事實。
核稿編輯:Sisley
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!
延伸閱讀:
最新發展: