国产日韩在线播放,欧美日韩中文字幕在线,大蕉香蕉国产在线视频,丝袜情趣在线资源二区

上海領(lǐng)先,發(fā)布中國首個(gè)大規模自動(dòng)駕駛大模型GenAD

近年來(lái),上海AI實(shí)驗室自動(dòng)駕駛團隊不斷創(chuàng )新,挑戰各項自動(dòng)駕駛研究任務(wù),在多模態(tài)、時(shí)空融合、端到端、多任務(wù)等方面提出了新思路、新模式。
 

近日,上海人工智能實(shí)驗室(上海AI實(shí)驗室)聯(lián)合香港科技大學(xué)、德國圖賓根大學(xué)、香港大學(xué)推出首個(gè)大規模自動(dòng)駕駛視頻生成模型GenAD,通過(guò)預測和模擬真實(shí)世界場(chǎng)景,為自動(dòng)駕駛技術(shù)的研究和應用提供支撐。

 

自動(dòng)駕駛是汽車(chē)行業(yè)“下半場(chǎng)”競爭的核心,隨著(zhù)科技的飛速發(fā)展,智能駕駛技術(shù)已經(jīng)成為汽車(chē)行業(yè)的熱門(mén)話(huà)題。從最初的輔助駕駛系統到如今的自動(dòng)駕駛技術(shù),智能駕駛正在逐步改變我們的出行方式。但自動(dòng)駕駛是一個(gè)高度復雜的技術(shù)體系,不僅需要多個(gè)學(xué)科領(lǐng)域的知識和技能,包括傳感器硬件、機器學(xué)習、多模態(tài)融合等內容,還需要適應不同國家與地區的道路規則和交通文化,與車(chē)輛及行人進(jìn)行良好的交互,以實(shí)現高度的可靠性和安全性。

 

 

近年來(lái),上海AI實(shí)驗室自動(dòng)駕駛團隊不斷突破創(chuàng )新,挑戰各項自動(dòng)駕駛研究任務(wù),在多模態(tài)、時(shí)空融合、端到端、多任務(wù)等方面提出了新思路、新模式。

 

先是在通用智能大模型“書(shū)生”(INTERN)的支持下,研究人員首次將感知、預測和規劃等三大類(lèi)主任務(wù)、六小類(lèi)子任務(wù)(目標檢測、目標跟蹤、場(chǎng)景建圖、軌跡預測、柵格預測和路徑規劃)整合到統一的基于Transformer的端到端網(wǎng)絡(luò )框架下,實(shí)現了全棧關(guān)鍵任務(wù)駕駛通用模型。在nuScenes真實(shí)場(chǎng)景數據集下,UniAD的所有任務(wù)均達到領(lǐng)域最佳性能(State-of-the-art),尤其是預測和規劃效果遠超之前的最佳方案。其中,多目標跟蹤準確率超越SOTA20%,車(chē)道線(xiàn)預測準確率提升30%,預測運動(dòng)位移和規劃的誤差則分別降低了38%和28%,打造出了業(yè)界首個(gè)感知決策一體化的自動(dòng)駕駛大模型UniAD。

 

隨后為應對“語(yǔ)言+自動(dòng)駕駛”具體研究方向數據短缺的現狀,聯(lián)合團隊構建了首個(gè)含圖結構的“語(yǔ)言+自動(dòng)駕駛”全棧開(kāi)源數據集DriveLM,以覆蓋自動(dòng)駕駛系統中的感知(Perception)、預測(Prediction)、規劃(Planning)等模塊。

 

經(jīng)由人工進(jìn)行復雜標注和嚴格的質(zhì)量檢查,DriveLM包含了高質(zhì)量標準、信息量豐富、邏輯關(guān)聯(lián)充分的駕駛相關(guān)文本數據,將助力自動(dòng)駕駛系統在復雜多變的交通環(huán)境中使用語(yǔ)言模態(tài)應對復雜任務(wù)。

 

此次聯(lián)合團隊將開(kāi)源模型(SDXL)置于駕駛視頻數據集OpenDV-2K進(jìn)行訓練,使之獲得了第一人稱(chēng)駕駛視角圖像的生成能力。隨后,設計并引入了因果時(shí)序模塊,包括為駕駛視頻生成特別設計的解耦空間注意力、因果時(shí)序注意力和長(cháng)時(shí)序交互機制,并在OpenDV-2K上進(jìn)行視頻預測訓練,以此構建起GenAD模型。

 

 

自動(dòng)駕駛是一個(gè)高度復雜的技術(shù)體系,不僅需要多個(gè)學(xué)科領(lǐng)域的知識和技能,包括傳感器硬件、機器學(xué)習、多模態(tài)融合等內容,還需要適應不同國家與地區的道路規則和交通文化,與車(chē)輛及行人進(jìn)行良好的交互,以實(shí)現高度的可靠性和安全性。

 

上海AI實(shí)驗室表示,聯(lián)合團隊構建了駕駛視頻數據集OpenDV-2K。經(jīng)過(guò)視覺(jué)語(yǔ)言模型(VLM)篩選、人工質(zhì)檢等工序,數據集收錄了2059小時(shí)第一人稱(chēng)視角駕駛視頻,覆蓋超過(guò)244個(gè)城市場(chǎng)景,規模為當前之最。目前該數據集已用于GenAD預訓練,同時(shí)向全社會(huì )開(kāi)源。

 

同時(shí)上海AI實(shí)驗室也認為,“世界模型”被視為通向通用人工智能(AGI)的重要路徑,其可在不實(shí)際執行的情況下對未來(lái)結果進(jìn)行預測,從而使模型作出更有效的決策。在自動(dòng)駕駛領(lǐng)域,特斯拉、Wayve等機構紛紛嘗試通過(guò)世界模型的研究提升自動(dòng)駕駛的安全性。

 

得益于其強大的預測和可泛化能力,涵蓋大規模駕駛場(chǎng)景的GenAD為自動(dòng)駕駛大模型向世界模型邁進(jìn)提供了重要技術(shù)潛力。未來(lái),聯(lián)合團隊將進(jìn)一步擴展駕駛視頻數據集的規模,并持續研究以預測未來(lái)能力為核心的基礎模型,推動(dòng)理解復雜世界、三維空間和抽象概念性能提升。

 

近年來(lái)上海在自動(dòng)駕駛領(lǐng)域持續發(fā)力,并取得了較好的成績(jì)。2018年以來(lái),上海分階段、分批次開(kāi)放自動(dòng)駕駛測試道路,打造了嘉定、臨港、奉賢、金橋四個(gè)各具特色的示范區。2023年3月22日,《上海市浦東新區促進(jìn)無(wú)駕駛人智能網(wǎng)聯(lián)汽車(chē)創(chuàng )新應用規定實(shí)施細則》(以下簡(jiǎn)稱(chēng)《實(shí)施細則》)正式發(fā)布,該規定是我國首部針對無(wú)駕駛人智能網(wǎng)聯(lián)汽車(chē)創(chuàng )新應用的地方性法規。獲得牌照的企業(yè)可以在浦東新區行政區域內劃定的路段、區域開(kāi)展車(chē)內全無(wú)人的智能網(wǎng)聯(lián)汽車(chē)道路測試。

 

就在3月19日,浦東新區第二批自動(dòng)駕駛開(kāi)放測試道路新增了金橋經(jīng)濟技術(shù)開(kāi)發(fā)區全域及浦東申江路、滬南公路、兩港公路等“南北科創(chuàng )走廊通道”道路開(kāi)放為自動(dòng)駕駛測試道路。本次開(kāi)放測試道路共205公里,這是繼2022年開(kāi)放首批12條、29.3公里自動(dòng)駕駛測試道路后,浦東新區開(kāi)放的第二批自動(dòng)駕駛測試道路。至此,上海已累計開(kāi)放測試道路達1003條,總里程突破2000公里。

 

截至目前,已有32家企業(yè)、794輛車(chē)獲得道路測試、示范應用、示范運營(yíng)牌照,累計測試里程約2290萬(wàn)公里,測試總時(shí)長(cháng)約122萬(wàn)小時(shí),企業(yè)參與度、測試道路里程數和場(chǎng)景豐富度位居全國前列。

讀者們,如果你或你的朋友想被手機報報道,請狠戳這里尋求報道
相關(guān)文章
熱門(mén)話(huà)題
推薦作者
熱門(mén)文章
熱門(mén)評論