「CV研究合輯」,是智東西公開課針對計算機視覺推出的一檔合輯,聚焦于計算機視覺前沿領域研究成果與進展的講解。每一講由主講與答疑兩個環節組成,其中,主講60分鐘,采用視頻直播形式,答疑30分鐘,將在相應交流群進行。
我們都知道,機器學習方法主要可以分為四類,監督學習、半監督學習、無監督學習、以及強化學習。不同于連接主義的監督學習方法,強化學習是智能體通過與環境的交互,觀測交互結果以及獲得相應的回報。這種學習的方式是模擬人或動物的一種學習方式,因此強化學習在機器人領域有著廣泛的應用。
傳統的強化學習局限于動作空間和樣本空間都很小,且一般是離散的情境下。然而實際情況的任務則往往有著很大的狀態空間和連續的動作空間。當輸入數據為圖像,聲音時,往往具有很高維度,傳統的強化學習很難處理,此時就需要結合深度學習的方法,將高緯度數據進行降維處理,即深度強化學習方法。
然而深度強化學習到底是什么樣的方法,又有哪些應用,尤其在機器人領域又有怎樣的進展呢?北京時間4月11日上午10點(硅谷時間4月10日晚7點、賓夕法尼亞州時間4月10日晚10點),智東西公開課「CV研究合輯」第3講直播開講,由卡內基梅隆大學博士胡亞飛和輕舟智航高級感知工程師陳鈺,為大家講解《深度強化學習在機器人領域的研究》。
胡亞飛是卡內基梅隆大學博士,目前在計算機學院下的機器人系進行研究工作,主要研究方向為動態場景下的視覺SLAM(包括深度學習方法和傳統幾何方法)、強化學習在機器人決策與規劃中的應用以及2D/3D多目標跟蹤等問題。他曾任ICRA, Autonomous Robot審稿人。
陳鈺是輕舟智航高級感知工程師,工作內容主要是多傳感器融合的追蹤;卡內基梅隆大學電子與計算機工程碩士、中山大學數據科學與計算機學院本科;曾在阿里巴巴達摩院機器智能部門、瑞芯微電子核心算法部門實習,有多項美國專利;在CMU MLD Katerina Fragkiadaki實驗室做研究助理;在知乎上撰寫了深度學習專欄:CMU 10-703 深度強化學習筆記。
CV研究合輯」此前已經完結兩講。第一講由電子科技大學李文教授主講,主題為《領域適應在計算機視覺中的研究和應用》;第二講是由小牛動漫資深算法工程師盧薇薇主講的《生成式對抗網絡GAN在動漫領域的應用》。更多講次也已陸續敲定,會盡快公布。敬請期待。
直播信息
直播時間:4月11日10:00-11:30(北京時間)
直播平臺:智東西公開課小程序
答疑地址:強化學習交流群
課程內容
主題:深度強化學習在機器人領域的研究
提綱:
1、深度強化學習的研究進展
2、深度強化學習在機器人領域的應用
3、仿真器如何解決自動駕駛領域長尾問題
4、imitation learning快速學習可操作的駕駛策略
5、使用A3C,DDPG進行smart agent方面的研究
講師介紹
胡亞飛,卡內基梅隆大學博士,目前在計算機學院下的機器人系進行研究工作;主要研究方向為動態場景下的視覺SLAM(包括深度學習方法和傳統幾何方法),強化學習在機器人決策與規劃中的應用,以及2D/3D多目標跟蹤等問題;曾任ICRA, Autonomous Robot審稿人。
陳鈺,輕舟智航高級感知工程師,工作內容主要是多傳感器融合的追蹤;卡內基梅隆大學電子與計算機工程碩士、中山大學數據科學與計算機學院本科;曾在阿里巴巴達摩院機器智能部門、瑞芯微電子核心算法部門實習,有多項美國專利;在CMU MLD Katerina Fragkiadaki實驗室做研究助理;在知乎上撰寫了深度學習專欄: ?CMU 10-703 深度強化學習筆記。
申請入群
本次課程的講解分為主講和答疑兩部分,主講以視頻直播形式,答疑將在「強化學習交流群」進行。
加入交流群,除了可以免費收聽直播之外,還能認識講師,與更多同行和同學一起學習,并進行深度討論。
掃碼添加小助手小開(ID:hikai19)即可申請,備注“姓名-公司/學校/單位-職位/專業”的朋友將會優先審核通過哦~