「AI新青年講座」將邀請世界頂尖AI研究機構和大學的科研新青年,主講他們在計算機視覺、機器學習等人工智能領域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進對人工智能前沿研究的理解,相應領域的專業知識也能夠得以積累加深。同時,通過與AI新青年的直接交流,大家在AI學習和應用AI的過程中遇到的問題,也能夠盡快解決。

「AI新青年講座」目前已完結122講,錯過往期講座直播的朋友,可以點擊文章底部“閱讀原文”進行回看!

有興趣分享學術成果的朋友,可以與智東西公開課教研團隊進行郵件(class@jmfly.net)聯系。

在自動駕駛等應用愈加炙手可熱的背景下,三維深度學習和激光雷達視覺受到越來越多的關注。激光雷達為自動駕駛系統提供了精確的空間信息,然而如何處理采集到的三維點云給車上較為有限的硬件資源帶來了巨大的挑戰。

傳統的三維深度學習方法大多都受限于較大的內存開銷和不規則的內存訪問。基于這些問題,麻省理工學院HAN Lab在讀博士劉志健等人,在近年來對自動駕駛高效三維深度學習做了一系列的探索,包括如何設計高效的三維深度學習組件PVCNN、自動的搜索三維神經網絡架構SPVNAS和加速三維稀疏卷積的計算TorchSparse等。

PVCNN(Point-Voxel CNN)將點云處理領域的兩類思路:?基于柵格和直接處理點云的方法進行了結合,是一種在計算效率與內存利用率都更高效的3D點云處理框架。在語義分割和部件分割數據集上,PVCNN的性能比基于體素的基準高,且GPU內存減少到10%,同時,相比于基于點的方法,PVCNN實現了平均7倍的運算加速。值得一說的是,PVCNN可以部署在 Jetson Nano上并且達到實時的效果,其速度與精度都明顯高于PointCNN和PointNet。

雖然PVCNN在小物體和較小的區域理解中展現了強勁的性能,但在大規模室外場景上仍然無法高效部署。為解決這一問題,劉志健等人又提出了一種新的三維點云計算模塊稀疏點云-柵格卷積 (SPVConv)?和3D神經網絡結構自動搜索 (3D-NAS)。這也是業界最早在3D計算機視覺領域,進行神經網絡結構自動搜索的工作之一,SPVNAS在極具挑戰的室外場景雷達點云語義分割任務上,完勝該領域此前的設計,在自動駕駛的權威評測榜SemanticKITTI 上,更是位列單幀3D場景語義分割榜首。

針對點云數據的處理計算,劉志健博士等人還開源了一個高性能神經網絡加速庫TorchSparse。該庫最新版本在運行標準的稀疏卷積網絡時能相對于此前學術界最先進的開源庫MinkowskiEngine獲得1.9倍的加速。同時,這項工作也獲得了麻省理工學院-IBM沃森人工智能實驗室、賽靈思、ON Semi、三星以及AWS的支持。

6月9日,「AI新青年講座」第123講邀請到麻省理工學院HAB Lab在讀博士劉志健參與,主講《高效的點云神經網絡設計及開源加速庫》。

講者
 劉志健,麻省理工學院HAN Lab在讀博士;導師為韓松教授,2018年從上海交通大學獲得學士學位,2020年從麻省理工學院獲得碩士學位;研究興趣主要是高效和硬件友好的深度學習及其在計算機視覺和機器人中的應用,在NeurIPS、CVPR、ICRA等國際一流會議上發表多篇學術論文。

第123講

主 題
《高效的點云神經網絡設計及開源加速庫》

提 綱
1、點云算法在自動駕駛車輛上部署的難點
2、點云神經網絡算法PVCNN設計
3、輕量級點云神經網絡架構搜索SPVNAS
4、高性能開源神經網絡加速庫TorchSparse
5、在自動駕駛汽車上的部署和測試表現

直 播 信 息
直播時間:6月9日10:00
直播地點:智東西公開課知識店鋪

成果
PV-CNN:《PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection》
 //proceedings.neurips.cc/paper/2019/file/5737034557ef5b8c02c0e46513b98f90-Paper.pdf

SPVNAS:《Searching Efficient 3D Architectures with Sparse Point-Voxel Convolution》
//arxiv.org/pdf/2007.16100.pdf

TorchSparse:《High-Performance Neural Network Library for Point Cloud Processing》
//github.com/mit-han-lab/torchsparse