omniture

刷新紀(jì)錄!浪潮AI獲自動(dòng)駕駛nuScenes競(jìng)賽目標(biāo)檢測(cè)第一名

2022-10-31 11:10 5004

北京2022年10月28日 /美通社/ -- 近日,在全球權(quán)威的自動(dòng)駕駛nuScenes競(jìng)賽的最新一期評(píng)測(cè)中,浪潮信息AI團(tuán)隊(duì)斬獲純視覺(jué)3D目標(biāo)檢測(cè)任務(wù)(nuScenes Detection task)第一名,并將關(guān)鍵性指標(biāo)nuScenes Detection Score(NDS)提高到62.4%


自動(dòng)駕駛已被眾多車(chē)企與AI 領(lǐng)先公司視為未來(lái)出行方式變革最重要的支撐性技術(shù),而目標(biāo)檢測(cè)作為自動(dòng)駕駛技術(shù)的核心模塊,其算法的精度和穩(wěn)定性正在眾多AI研究團(tuán)隊(duì)的推動(dòng)下,不斷創(chuàng)下新高。nuScenes數(shù)據(jù)集是目前自動(dòng)駕駛領(lǐng)域中最流行的公開(kāi)數(shù)據(jù)集之一,數(shù)據(jù)采集自波士頓和新加坡的實(shí)際自動(dòng)駕駛場(chǎng)景,是第一個(gè)集成攝像頭、激光雷達(dá)和毫米波雷達(dá)等多種傳感器,實(shí)現(xiàn)360度全傳感器覆蓋的數(shù)據(jù)集。nuScenes數(shù)據(jù)集提供了二維、三維物體標(biāo)注、點(diǎn)云分割、高精地圖等豐富的標(biāo)注信息,包含1000個(gè)場(chǎng)景,擁有140萬(wàn)幀圖像、39萬(wàn)幀激光雷達(dá)點(diǎn)云數(shù)據(jù)、23個(gè)物體類(lèi)別、140萬(wàn)個(gè)三維標(biāo)注框,其數(shù)據(jù)標(biāo)注量比KITTI數(shù)據(jù)集高出7倍以上。

此次浪潮信息AI團(tuán)隊(duì)參與的純視覺(jué)3D目標(biāo)檢測(cè)任務(wù)是競(jìng)爭(zhēng)最激烈的賽道,吸引了百度、鑒智機(jī)器人、縱目科技、卡內(nèi)基梅隆大學(xué)、加利福尼亞大學(xué)伯克利分校、MIT、清華大學(xué)、香港科技大學(xué)、上海交通大學(xué)等全球各地的頂尖AI團(tuán)隊(duì)。


純視覺(jué)3D目標(biāo)檢測(cè)任務(wù),就是在不使用激光雷達(dá)、毫米波雷達(dá)等額外的傳感器信息條件下,僅使用6個(gè)攝像頭完成車(chē)外360度環(huán)視視野的3D目標(biāo)檢測(cè),不僅需要檢測(cè)周?chē)h(huán)境中所有的車(chē)、行人、障礙物、交通標(biāo)志、指示燈等若干類(lèi)對(duì)象,還要精確感知到他們?cè)谡鎸?shí)物理世界中的位置、大小、方向、速度等信息。該項(xiàng)任務(wù)的主要難點(diǎn)是通過(guò)2D圖像難以準(zhǔn)確的獲取目標(biāo)的真實(shí)深度和速度,當(dāng)提取的深度信息不準(zhǔn)確時(shí),一切的三維感知任務(wù)都會(huì)變得異常困難;而當(dāng)提取的速度信息不準(zhǔn)確時(shí),則可能會(huì)對(duì)后續(xù)的決策規(guī)劃任務(wù)產(chǎn)生致命性的影響。

浪潮信息AI團(tuán)隊(duì)創(chuàng)新開(kāi)發(fā)了基于多相機(jī)的時(shí)空融合模型架構(gòu)(Inspur_DABNet4D),在多視角視覺(jué)輸入統(tǒng)一轉(zhuǎn)換到BEV(Bird Eye View)特征空間這一技術(shù)框架的基礎(chǔ)上,引入了數(shù)據(jù)樣本增強(qiáng)、深度增強(qiáng)網(wǎng)絡(luò)、時(shí)空融合網(wǎng)絡(luò)、預(yù)訓(xùn)練權(quán)重等,得到了更魯棒更精確的BEV特征,大幅地優(yōu)化了目標(biāo)物體監(jiān)測(cè)速度和位移方向預(yù)測(cè)。

基于多相機(jī)的時(shí)空融合模型架構(gòu)實(shí)現(xiàn)了四大核心技術(shù)突破。一是,更豐富的數(shù)據(jù)樣本增強(qiáng)算法,將真值以真實(shí)的3D物理坐標(biāo)實(shí)現(xiàn)拷貝貼圖,并實(shí)現(xiàn)了時(shí)序中的擴(kuò)展,顯著的提高目標(biāo)檢測(cè)精度,可將mAP(全類(lèi)平均正確率,mean Average Precision)平均提升2%+;二是,更強(qiáng)大的深度增強(qiáng)網(wǎng)絡(luò),主要針對(duì)現(xiàn)有方案深度信息難以學(xué)習(xí)和建模的問(wèn)題,通過(guò)深度網(wǎng)絡(luò)架構(gòu)優(yōu)化、點(diǎn)云數(shù)據(jù)監(jiān)督指導(dǎo)訓(xùn)練、深度補(bǔ)全等技術(shù),大幅提高深度預(yù)測(cè)精度;三是,更精細(xì)的時(shí)空融合網(wǎng)絡(luò),除了進(jìn)一步優(yōu)化駕駛場(chǎng)景中自車(chē)運(yùn)動(dòng)所帶來(lái)的時(shí)空信息錯(cuò)位融合問(wèn)題,還引入了sweep幀數(shù)據(jù)隨機(jī)抽取與當(dāng)前幀融合,并實(shí)現(xiàn)不同幀的數(shù)據(jù)樣本同步增強(qiáng)操作,使得模型能夠端到端學(xué)習(xí)到更精細(xì)的時(shí)序特征;四是,更完善的統(tǒng)一建模形式,即針對(duì)駕駛場(chǎng)景的視角廣、尺度大、任務(wù)多的特點(diǎn),設(shè)計(jì)了端到端的特征提取、融合、檢測(cè)頭的統(tǒng)一建模架構(gòu),結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練高效、場(chǎng)景通用。預(yù)訓(xùn)練模型可隨時(shí)替換自監(jiān)督模型,快捷便利地完成測(cè)試和精度提升。

得益于更先進(jìn)算法和更高算力的進(jìn)步,nuScenes競(jìng)賽的3D目標(biāo)檢測(cè)任務(wù)榜單成績(jī)?cè)?022年取得大幅提升,其中浪潮信息AI團(tuán)隊(duì)將關(guān)鍵性指標(biāo)NDS提升到62.4%,而相比而言年初的榜單最佳成績(jī)是47%。

消息來(lái)源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection