「自動(dong)駕駛新青(qing)年講座」由智(zhi)東西公開(kai)課(ke)企(qi)劃,致力于(yu)邀請全球(qiu)知(zhi)名(ming)高校(xiao)、頂尖(jian)研(yan)究機構以及優秀(xiu)企(qi)業的新青(qing)年,主講在(zai)環境感(gan)知(zhi)、精準定位(wei)、決策規劃、控制執行等自動(dong)駕駛關鍵技(ji)術(shu)上的最(zui)新研(yan)究成(cheng)果和開(kai)發實踐。

「自動駕駛新青(qing)年講座(zuo)」目(mu)前已完結21講,錯過往期講座(zuo)直(zhi)播的朋友,可以點擊文章底(di)部“閱讀原(yuan)文”進行(xing)回看!

有興(xing)趣分享的朋友(you),可以(yi)與(yu)智東(dong)西公開課教研團(tuan)隊進行(xing)郵件(class@jmfly.net)聯系

近年來(lai),自動駕駛汽(qi)車(AV)的(de)(de)智(zhi)能決(jue)策(ce)模(mo)塊可以處理的(de)(de)場景復雜度,逐漸成(cheng)為了衡量(liang)和評價自動駕駛能力(li)的(de)(de)核心(xin)指標之一。

尤其是在強交(jiao)(jiao)互高密度場景中(zhong),例(li)如(ru)(ru)繁忙(mang)的城(cheng)市(shi)道路(lu)、復雜的十(shi)字路(lu)口或(huo)多車道高速(su)公路(lu)真實道路(lu),AV 如(ru)(ru)何(he)進行智能決策(ce),并生(sheng)成高效(xiao)且安全的駕駛(shi)行為,仍然存(cun)在較(jiao)大挑戰(zhan)。此(ci)類問題包含但不限于(yu)如(ru)(ru)何(he)擬人地與人類交(jiao)(jiao)互,提升決策(ce)預(yu)測(ce)算法的泛化能力,有效(xiao)處理多樣駕駛(shi)環境中(zhong)的corner?case問題等(deng)。

針對上述問題,多倫多大學的在讀博士王樂天等研究人員使用(Inverse) reinforcement learning,skill discovery,Bayesian inference等方法,使AV 產生不同風格的擬人化駕駛行為,并在線識別人類的駕駛風格,提升預測算法的場景可遷移性與個體可適應性。這些方法可以大幅提升自動駕駛決策算法的學習效率與性能,智能地解決強交互高密度駕駛場景下的泛化決策問題。相關成果的論文發表于RSS 2023、RA-L 2021(Best Paper)、NeurIPS 2021頂級會議期刊上。
2022 CARLA端到端自動駕駛挑戰賽冠軍獲得者王樂天:強交互高密度場景中自動駕駛智能決策與行為生成|直播預告

2022 CARLA端到端自動駕駛挑戰賽冠軍獲得者王樂天:強交互高密度場景中自動駕駛智能決策與行為生成|直播預告

2022 CARLA端到端自動駕駛挑戰賽冠軍獲得者王樂天:強交互高密度場景中自動駕駛智能決策與行為生成|直播預告

9月1日10點,「自動駕駛新青年講座」第22講邀請到論文一作多倫多大學在讀博士王樂天參與,主講《強交互高密度場景中自動駕駛智能決策與行為生成》。

講者

王樂天多倫多大學在讀博士。研(yan)究方向為自(zi)(zi)動駕(jia)駛與(yu)機器人(ren)的(de)智能決策、行為生(sheng)成與(yu)預(yu)測、人(ren)機交(jiao)互、端(duan)(duan)到端(duan)(duan)自(zi)(zi)動駕(jia)駛。曾(ceng)在RSS,CORL,RA-L,ICRA, Neurips,CVPR等機器學習與(yu)機器人(ren)頂級會議期刊發(fa)表多篇論文(wen)。曾(ceng)在自(zi)(zi)動駕(jia)駛社(she)會化行為生(sheng)成的(de)工作中獲得IEEE Robotics and Automation Letters 2021年(nian)度Best?paper award honorable mention。曾(ceng)獲2022年(nian)度CARLA端(duan)(duan)到端(duan)(duan)自(zi)(zi)動駕(jia)駛挑戰(zhan)賽(sai)冠軍。

第22講

主 題

《強(qiang)交互(hu)高密(mi)度場景(jing)中自動(dong)駕(jia)駛智(zhi)能決(jue)策(ce)與行為生(sheng)成(cheng)》

提 綱

1、智能決(jue)策與行為生成問題與挑戰

2、強(qiang)交互駕駛(shi)場景中社會(hui)化(hua)駕駛(shi)行為生成

3、強交互駕(jia)駛場(chang)景可泛化、個體可適應行為預測

4、強(qiang)交(jiao)互高(gao)密度場景中強(qiang)化學習ASAP-RL算法(fa)解析

5、智能決策(ce)與(yu)行為(wei)生成未來展(zhan)望

直 播 信 息

直播時(shi)間:9月1日10:00

直播地點:智東(dong)西公(gong)開課知識店鋪

成果

論文標題

《Efficient Reinforcement Learning for AutonomousDriving with Parameterized Skills and Priors》

《Socially-Compatible Behavior Design of Autonomous Vehicleswith Verification on Real Human Data》

《Hierarchical Adaptable and Transferable Networks(HATN) for Driving Behavior Prediction》

論文鏈接

//arxiv.org/pdf/2305.04412.pdf

//arxiv.org/pdf/2010.14712.pdf

//arxiv.org/pdf/2111.00788.pdf