自2019年起,百度Apollo開發者社區在智東西公開課持續推出八場公開課和專場直播,對Apollo中的激光雷達感知、仿真可視化、高精地圖與定位、預測引擎、低速微型車開發套件等核心技術和解決方案進行了深入講解。

3月31日,「百度Apollo強化學習公開課」上線。百度高級架構師、百度PNC強化學習方向技術負責人“向往藍天的鷹”將圍繞主題《 深度強化學習在自動駕駛運動規劃中的應用》,直播講解自動駕駛決策規劃DRL架構。

運動規劃是無人駕駛系統的核心模塊之一。運動規劃模塊承接上游感知、定位、地圖等模塊,規劃無人駕駛車一段時間內的具體的駕駛行為,以軌跡的形式輸出給下游控制模塊執行。常規做法是劃分成預測、決策、路徑規劃和速度規劃等模塊,混合Learning、優化、規則等多種手段、采用場景化的方式分治解決問題,但存在模塊間不匹配和缺乏聯動協同等問題,并且由于自動駕駛場景復雜和各種不確定性問題,導致迭代效率較低。

而深度強化學習在大規模游戲領域的成功,以及大量的理論研究成果也證實了深度強化學習的可行性。因此越來越多的無人駕駛科技公司也開始相信強化學習,將深度強化學習和自動駕駛實踐相結合,并取得了一定的成果。

當然,深度強化學習雖然已經被證實能夠解決無人駕駛中的部分問題,但還面臨諸多挑戰。比如深度強化學習在解決復雜問題需要大量的訓練時間和反復模型優化。需要設計一個穩定的智能系統解決仿真和現實之間的gap差距。同時,模型的精度和整個智能系統的架構設計也會影響深度強化學習的可用性。

在本次公開課中,百度PNC強化學習方向技術負責人“向往藍天的鷹”將圍繞自動駕駛決策規劃宏觀建模與DRL架構、基于深度學習的Mid2Mid的運動規劃系統、強化學習落地經驗以及ApolloRL這四個方面,深度解析百度Apollo基于深度學習的Mid2Mid的運動規劃系統,以及基于預監督和大規模仿真的深度強化學習相結合來優化模型效果的方案。

“向往藍天的鷹”是百度高級架構師、百度PNC強化學習方向技術負責人,致力于Robotaxi 決策規劃系統的提升和數據驅動路徑探索和研究。

本次公開課將以視頻直播形式進行,包含40分鐘主講和20分鐘問答。同時,針對本次公開課,也組建了專屬交流群,屆時主講人也將加入,歡迎感興趣的開發者申請。

公開課信息

主 題?
《深度強化學習在自動駕駛運動規劃中的應用》

提 綱
1、自動駕駛決策規劃宏觀建模和DRL架構
2、基于深度學習的Mid2Mid的運動規劃系統
3、強化學習落地經驗
4、ApolloRL解析

主 講 人
 向往藍天的鷹,現擔任百度高級架構師、百度PNC強化學習方向技術負責人,致力于Robotaxi 決策規劃系統的提升和數據驅動路徑探索和研究。

直 播 時 間
3月31日19:00-20:00