繼「學術新青年講座」、「CVPR 2021特別企劃」之后,智東西公開課AI教研組又有新動作啦~
當下,人工智能正熱,而其備受關注、取得革命性進步背后的“推手”正是機器學習。關于機器學習的定義有很多,但它的基本目標是一致的,即在訓練樣本的基礎上進行泛化,讓機器學習模型成功解釋之前從未“見過”的數據。近年來,有很多新型的機器學習技術受到人們的廣泛關注,像深度學習、強化學習、遷移學習、對抗學習、元學習等,它們在數據挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、游戲和機器人等領域有著廣泛的應用。
ICML是國際機器學習領域最具影響力的學術會議之一,亦是探討機器學習前沿研究成果和技術實踐應用的重要舞臺。為了讓大家更到的了解ICML的最新研究成果,智東西公開課全新策劃推出了「ICML 2021一作講壇」。
首期我們邀請到3位ICML 2021論文一作,講解他們各自在ICML 2021上的最新研究成果。
8月30日早10點,來自萊斯大學的查道琛博士將率先帶來「ICML 2021一作講壇」第1講的直播講解,講解主題為《游戲AI探究:從零開始通過自我博弈強化學習來學打斗地主》。
強化學習是機器學習大家族中重要的分支,相較于有監督學習和無監督學習,強化學習最大的特點是在交互中學習,即智能體在與環境的交互中根據獲得的獎勵或懲罰不斷的學習知識,更加適應環境。正因如此,強化學習非常適合應用在游戲領域,通過提供指向高等級目標的獎勵信號,讓游戲角色制定出獲得高額獎勵的最優策略,從而有助于設計出更強的游戲角色。
現階段,強化學習已經應用在了很多棋牌類游戲中,如AlphoGo(圍棋)、冷撲大師(德州撲克)、Suphx(麻將)。而斗地主因其極大的狀態空間、豐富的隱含信息、復雜的牌型、并存的合作與競技,一直是一個極具挑戰的領域。
本次講座中,查博將深入講解他們在ICML 2021上最新提出的工作,面向斗地主的DouZero AI人工智能系統。講解的內容主要包括基于蒙特卡羅算法的優化算法;以及RLCard工具包。RLCard集成了DouZero中的算法,并且支持八種游戲實現(包括斗地主、麻將、德州撲克等)以及各種強化學習算法(比如DouZero中使用的算法DMC、DQN、CFR等)。
第2講將于8月31日晚7點進行,由蒙特利爾學習算法研究院研究生徐民凱主講,主題為《基于二階規劃的端到端3D結構生成框架》。
深度學習已經在分子性質預測,分子生成等領域取得了極大的進展,在這些場景中,分子通常被表示為以原子為節點、共價化學鍵為邊的圖。然而,在現實應用中分子通常以三維結構進行表示。相比圖結構,3D結構更加本質,通常蘊含著更豐富的信息,也決定了許多化學和生物學特性。
最近大多數工作首先預測原子之間的距離,然后通過求解距離幾何問題,根據預測的距離生成分子構象。這種基于距離幾何的方法有效地考慮了分子構象的旋轉和平移不變性,因此取得了很好的性能。但是,這種兩階段的方法通常會遭受誤差傳遞的負面影響,即如果第一階段預測的距離本身就不能支撐一個合理的三維結構,那么第二個生成階段會生成非常不合理的分子構象。
在本次講座中,徐民凱老師講解他們在ICML 2021上發表的最新研究成果:一種基于條件VAE的架構ConfVAE。分子圖首先會被映射到特征空間,然后通過求解一個雙層優化問題來生成他的3D結構。
第3講將由伊利諾伊大學厄巴納香檳分校在讀博士王昊翔主講,時間為9月1日早10點。王博將以《聯結多任務學習與元學習:快速訓練與高效遷移》為主題講解他們在ICML 2021上的最新成果。
多任務學習主要是通過在多個任務上同時訓練來提升泛化能力。而元學習是通過在有限的數據快速學習從未見過的新任務。多任務學習和元學習在算法框架上存在著很大的差別,但當利用訓練任務之間的共享結構,將多任務學習和元學習進行結合,便能得到更好的泛化和適應能力。
在本次講座中,王博將詳細剖析多任務學習和元學習之間的密切聯系,證明多任務學習與一類基于梯度的元學習算法 (Gradient-Based Meta-Learning,GBML) 共享相同的優化形式,并且可以在同一數據集上會學到相似的模型。通過多個實驗證明,多任務學習算法可以在小于10%的訓練時間上,訓練出達到最先進的GBML的水平的模型。
「ICML 2021一作講壇」將在智東西公開課知識社區進行,包含主講和問答兩個部分。其中主講環節40分鐘,問答環節20分鐘。每個環節主講老師都將通過視頻直播進行實時講解與互動。
「ICML 2021一作講壇」籌備不易,歡迎大家踴躍報名。同時后續更多的ICML 2021 論文一作我們也在持續邀請中,大家敬請期待!
課程介紹
課程時間:8月30日早10點
課程主題:游戲AI探究:從零開始通過自我博弈強化學習來學打斗地主
講師介紹:萊斯大學四年級在讀博士查道琛
課程時間:8月31日晚7點
課程主題:基于二階規劃的端到端3D結構生成框架
講師介紹:蒙特利爾學習算法研究院研究生徐民凱
課程時間:9月1日早10點
課程主題:聯結多任務學習與元學習:快速訓練與高效遷移
講師介紹:伊利諾伊大學厄巴納-香檳分校在讀博士王昊翔