從高速到城區,自動駕駛汽車正面臨著更復雜的路況,強交互的長尾場景不計其數。而直接在城區進行測試存在極高的成本與風險。因此,在仿真測試基準上進行針對長尾場景的規控能力評測成為了業界的共同選擇。但基于學習方法中的模仿學習方案高度依賴于對所有可能出現情況的全覆蓋,強化學習方案又需要在仿真中進行大規模的試錯探索學習規控策略,其低效性難以應對多達幾十種的長尾場景。

針對當前技術難題,上海交通大學嚴駿馳老師領導的ReThinkLab提出了一種基于隱世界模型下的高效強化學習自動駕駛模型Think2Drive,并成為首個完成CARLA V2全部長尾場景的模型,實現100%的路線完成率。與Think2Drive相關的論文收錄于ECCV 2024上。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

Think2Drive通過訓練世界模型建模自動駕駛環境的變化規律,并在隱特征空間中進行下游規控網絡的策略探索。該模型有以下特點:1)隱世界模型可以進行快速狀態推理,具備極高的數據效率;2)針對將強化學習應用到至自動駕駛任務面臨的策略退化、長尾分布、駕駛不穩定性等挑戰,提出了周期性重置、自動場景生成、終止優先回放等特制模塊,可實現同一規控網絡應對幾十種復雜場景。

Think2Drive建模的世界模型是隱世界模型,通過在該低維空間上基于動作預測未來狀態,以避免在高維空間上進行計算(像素空間、3D物理空間),極大地加速推理效率。經過訓練,整個隱世界模型便可以作為一個低維的“小世界”,它可以對駕駛策略采取的動作給予獎懲,也可預測基于該動作的未來狀態,此時它表現為一個神經網絡模擬器,是對駕駛環境的一個最小仿真。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

基于Think2Drive專家模型,上海交通大學ReThinkLab又推出了首個端到端自動駕駛綜合能力閉環評估開放平臺Bench2Drive。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

Bench2Drive具有一個由最先進的專家模型Think2Drive收集的官方訓練數據集,包含200萬個完全標注的幀,來源于10000個片段。這些數據涵蓋了44種不同的交互式場景。評估協議包括220條短路線,每條路線大約只有150米長,并包含一個特定的場景。

通過這種方式,對單個技能的評估被隔離出來,從而允許對44種不同技能集的自動駕駛系統熟練程度進行詳細的比較。此外,每條路線的簡短性減輕了指數衰減函數對駕駛分數的影響,使得不同系統之間的性能比較更加準確和有意義。該基準為研究人員提供了一種在現實、全面和公平的環境中細化和評估其端到端自動駕駛系統的重要工具。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive

7月31日晚7點,智猩猩邀請到論文一作、上海交通大學ReThinkLab嚴駿馳組在讀博士李奇峰參與「智猩猩自動駕駛新青年講座」第37講,主講《首解CARLA V2:基于隱世界模型的自駕強化模型Think2Drive》。

講者

李奇峰,上海交通大學ReThinkLab嚴駿馳組在讀博士

李奇峰,上海交通大學ReThinkLab在讀博士,師從嚴駿馳老師。主要研究方向為基于強化學習的自動駕駛規控、端到端自動駕駛等。

上海交通大學ReThinkLab近年來在自動駕駛方向上的成果橫跨自動駕駛中的感知、預測、決策領域,并開創性的深入探索了感知決策一體化自動駕駛。其中包括清華A/CCF-A類論文10余篇,CVPR2023最佳論文、CVPR2024最佳論文候選, 兩篇Oral (<3%)工作。在CARLA V1/V2,nuScenes, Waymo等多個公開數據集上取得了國際領先的性能,尤其是在端到端自動駕駛方面的工作已成為領域經典算法。

第 37 講

主 題

《首解CARLA V2:基于隱世界模型的自駕強化模型Think2Drive》

提 綱

1、CARLA v2 閉環仿真測評基準簡介
2、隱世界模型概述及其在自動駕駛中的應用
3、基于隱世界模型的強化學習自動駕駛模型Think2Drive
4、端到端自動駕駛閉環評估開放平臺Bench2Drive
5、先進E2E-AD方法測試及評估

直 播 信 息

直播時間:7月31日19:00
直播地點:智猩猩GenAI視頻號

成果

論文標題1
 《hink2drive: Efficient reinforcement learning by thinking in latent world model for quasi-realistic autonomous driving (in carla-v2)》

論文鏈接1
//arxiv.org/abs/2402.16720

論文標題2
 《Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving》

論文鏈接2
//arxiv.org/abs/2406.03877

項目地址2
//thinklab-sjtu.github.io/Bench2Drive/

入群申請

本次講座組建了學習交流群。加入學習交流群,除了可以觀看直播,并提前拿到課件外,你還能結識更多研究人員和開發者,所提問題也將會優先解答。

希望入群的朋友可以掃描下方二維碼,添加小助手陳新進行申請。已添加過陳新的老朋友,可以給陳新私信,發送“自動駕駛37”進行申請。

首次(全)解鎖CARLA V2! 上交大RethinkLab提出隱世界模型下的強化學習自動駕駛模型Think2Drive