Tarek El Dokor,汽車司機監(jiān)控系統(tǒng)的視覺公司 EDGE3 Technologies 的 CEO ,此前他是安博瑞德航空大學機器視覺實驗室的教授和負責人。他在此文中闡述了監(jiān)控司機的重要性,認為比起目前已經(jīng)日益完善的自動駕駛系統(tǒng),對司機的視覺監(jiān)控同樣是自動駕駛中不可或缺的一環(huán)。
在車內(nèi)安裝攝像頭,自動駕駛汽車也需要這樣監(jiān)控司機
Elon Musk 在特斯拉官方網(wǎng)站上宣布他的藍圖時表示,他依然支持頗具爭議的 Autopilot ?輔助駕駛模式。他認為,減少或取消特斯拉部分智能功能應(yīng)該受到道德上的譴責。因為總得來說,這些智能功能仍在挽救生命。
毫無疑問,Autopilot ?模式和其他類似的輔助駕駛功能增強了汽車的安全性。但是我作為 EDGE3 Technologies 公司的 CEO(一家開發(fā)汽車司機監(jiān)控系統(tǒng)的視覺公司)和安博瑞德航空大學機器視覺實驗室的前教授和帶頭人,我還有其他建議。換句話說,為了追求全面智能駕駛技術(shù),盯著我們能夠達到目的的必要技術(shù),我們可能會忽略合適的技術(shù)開發(fā)路線。
盡管特斯拉的 Autopilot ?模式非常具有開創(chuàng)性,但實際上它只是一個輔助駕駛功能,不是我們追求的全自動駕駛模式。在技術(shù)層面上講,它是 NHTSA-Level 2 自動駕駛系統(tǒng),即至少有兩個基本的自動化控制功能。這樣的系統(tǒng)要求你的手一直放在方向盤上。
目前自動駕駛的真實狀態(tài)和司機所預(yù)期的狀態(tài)是有明顯區(qū)別的。特斯拉最近發(fā)布的“雙手必須放在方向盤上”的要求和標識并不意味著視線不能離開馬路。即使雙手還握著方向盤,實際上許多特斯拉或者其他汽車的車主可能會眼睛飄忽或者精神放空。他們希望 Autopilot ?模式能達到自動駕駛(Level 3)或者全自動駕駛 (Level 4),然而在現(xiàn)實中,它只達到了 Level 2 ?級別。
如果車主不知道自己的汽車配有自動駕駛系統(tǒng)的級別,也情有可原,因為自動駕駛汽車可以自己在高速上跑幾百英里,司機很容易進入到一種錯誤的安全感中,認為汽車是全自動駕駛的。這就導致了一些問題,比如今年年初開始已經(jīng)有一些輕微的交通事故和至少一起撞擊致死事故發(fā)生,都是由于駕駛者沒有好好看路。Joshua Brown 的特斯拉正在高速公路上以 Autopilot 模式行駛,而他不知道自己已經(jīng)身處險境,有報道稱,這無疑是一個可以避免的悲劇,因為Brown 當時正在 DVD 上看電影。
所以我們?nèi)绾尾拍苓M入自動駕駛的下一階段呢?
NHTSA 指出,Level 3 級別汽車應(yīng)該能了解周圍環(huán)境,明白將要發(fā)生的狀況,并且知道何時以及如何讓司機自己控制汽車。自動駕駛汽車能夠看到并理解周圍環(huán)境,但是這一級別的自動駕駛?cè)匀蝗狈σ粋€重要功能,就是何時以及如何將操控權(quán)交給司機。
現(xiàn)在缺失的技術(shù)是,不僅要確保駕駛員座艙內(nèi)要有司機,還要讓汽車了解司機的認知狀態(tài),清楚他或她對控制汽車的能力。實現(xiàn)這個功能的唯一辦法就是在駕駛艙內(nèi)安裝一個面向駕駛員的攝像頭。
檢測司機的認知狀態(tài)是很微妙且具有挑戰(zhàn)的。不僅要顯示在某一時間點司機在看什么,還要識別、檢測司機的意識狀態(tài)和認知。目前的系統(tǒng)是由許多自動化設(shè)備制造商開發(fā)的,例如一級供應(yīng)商和二級供應(yīng)商,包括 EDGE3,這些系統(tǒng)采用大量軟件技術(shù),但是都表現(xiàn)出一個共性,就是駕駛座內(nèi)一個或多個攝像頭能監(jiān)控司機及其所看到的物體。
圖像會被車載嵌入式處理器處理,獲取傳送的重要信息??梢员O(jiān)控司機且屬于 Level 3 ?的自動駕駛技術(shù)尚未問世,產(chǎn)品方面存在許多技術(shù)競爭,包括立體攝像頭和TOF攝像頭(利用光的飛行時間測量距離)。 哈曼和德爾福今年年初在 CES 表示,領(lǐng)先市場的大部分解決方案似乎都在關(guān)注視覺追蹤。
盡管監(jiān)控眼睛有效,但是將其放大監(jiān)控整個面部、頭部、面部表情和分層的遠程信息處理能更精準地檢測到司機的意識和認知:將駕駛艙內(nèi)攝像頭記錄的圖像、汽車遠程信息處理和高級駕駛員輔助系統(tǒng)(ADAS)獲得的信息結(jié)合起來確定司機的狀態(tài)。
未來的 Level 3 級別自動駕駛汽車會捕捉到司機的駕駛行為、模式。有了這一功能,汽車就可以識別司機的反常行為,認為是司機處在危險狀況或者精力不集中。監(jiān)控司機不僅僅是簡單的視覺系統(tǒng),更是一種高級多傳感器學習系統(tǒng)。
監(jiān)控司機是一項重要的任務(wù),是現(xiàn)在工業(yè)界高度重視的一個領(lǐng)域。例如,谷歌在自動駕駛方面已經(jīng)決定在決策環(huán)中把司機完全“置之事外”,本質(zhì)上已經(jīng)超越 Level 3 ?,并且認為這樣更加安全。拋開社會影響,取消方向盤,直接跳過 Level 3 會讓我們長期停留在 Level 2,因為隨著我們的學習,無差錯的自動駕駛會成為新的焦點。有專家在華爾街日報上說,要達到這個目標至少需要 15 到 20 年。
最復(fù)雜的自動駕駛技術(shù)也已經(jīng)在復(fù)雜的環(huán)境下實現(xiàn)了。據(jù)谷歌的備案文件顯示,加州交管局表示他們已經(jīng)失敗了數(shù)百次,需要重復(fù)進行人為干預(yù)。事實上在另一資料中顯示,人類駕駛員已經(jīng)數(shù)千次控制汽車并且行駛了 400 公里。自動駕駛汽車會提高性能,更了解周圍環(huán)境,但是即便未來會有更高級的系統(tǒng),汽車還是會處于復(fù)雜的日常環(huán)境。
這是技術(shù)的本質(zhì),汽車的高級駕駛員輔助系統(tǒng)不能躲開路上的障礙物,或者不能認出交警,還是需要司機自己控制。全自動化駕駛會引起其他道德問題,比如,在事故中應(yīng)該責備誰?面對救駕駛員還是救其他人的時候,自動汽車會做什么決定?這些決定不只是在技術(shù)層面內(nèi),而是要將道德理解以及技術(shù)所處的社會水平考慮在內(nèi),還包括政策制定者、倫理學家和對其他人的影響。
前不久Uber發(fā)布了和谷歌類似的技術(shù),盡管Uber方面稱他們確定是專業(yè)的司機駕駛,能熟練地在復(fù)雜狀況下控制汽車。很明顯, Uber知道自己的技術(shù)不是全自動駕駛,需要司機來減小風險。但是如果司機頭昏腦漲(報道中這種情況時有發(fā)生)或者控制得太晚會發(fā)生什么?很遺憾,Uber的團隊沒能監(jiān)控司機何時以及如何控制汽車,這在設(shè)計上是一種硬傷。
在所有情況中,最關(guān)鍵的就是司機需要具有駕駛技術(shù),能夠在任何時間處理緊急情況,如果司機不能控制汽車,就需要有在數(shù)秒內(nèi)解決問題的應(yīng)急措施。
在 Level 3 中,深入理解司機的注意力是很重要的一步,如果汽車能更智能地了解相關(guān)風險程度,就會知道何時以及如何控制司機。我認為,Level 3 會讓我們變得前所未有的真實,全自動 Level 4 駕駛更是如此。這樣一來,我們就需要提高 Level 3 駕駛技術(shù),讓其上路成為現(xiàn)實。