复旦大学在读博士黄新宇：视觉感知新范式——万物识别大模型 RAM｜AI新青年讲座

「AI新青年講座」將邀請世界頂尖AI研究機構和大學的科研新青年，主講他們在計算機視覺、機器學習等人工智能領域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑，將可以幫助大家增進對人工智能前沿研究的理解，相應領域的專業知識也能夠得以積累加深。同時，通過與AI新青年的直接交流，大家在AI學習和應用AI的過程中遇到的問題，也能夠盡快解決。

「AI新青年講座」目前已完結220講；有興趣分享學術成果的朋友，可以與智東西公開課教研團隊進行郵件（class@jmfly.net）聯系。

大語言模型已經給自然語言處理領域帶來了新的革命。在計算機視覺領域，Meta AI近期推出的Segment Anything Model（SAM）工作，在視覺定位（Localization）任務上取得了令人振奮的結果。然而SAM作為一個極致的定位大模型，并沒有識別（Recognition）能力，而識別是與定位同等重要的CV基礎任務。現有的開放式檢測、分割任務嘗試同時做好識別和定位，卻在兩個任務上都不能達到極致。

來自 OPPO 研究院、IDEA研究院的研究者們最新開源了一個視覺感知大模型Recognize Anything Model（RAM），提供最強的圖像識別能力。RAM 為圖像識別領域提供了一種新的范式，使用海量無需人工標注的網絡數據，可以訓練出泛化能力強大的通用模型，甚至在垂域下可以超越人工標注訓練的有監督模型。

RAM 可以以較高的準確率自動識別超過 6400 類的圖像標簽，橫跨學術數據集和商業化產品，并根據其 Open-Set 能力覆蓋任意標簽類別。

7月27日晚7點，「AI新青年講座」第221講邀請到 RAM 一作、OPPO 研究院研究實習生、復旦大學在讀博士黃新宇參與，主講《視覺感知新范式——萬物識別大模型 RAM》。

講者
黃新宇復旦大學在讀博士，同時是 OPPO 研究院研究實習生，并與粵港澳大灣區數字經濟研究院保持密切合作；研究方向為多模態學習與圖像視覺理解，提出的 Recognize Anything（RAM）模型是目前最強的開源圖像識別模型。

主題
《視覺感知新范式——萬物識別大模型 RAM》

提綱
1、圖像分割大模型 SAM 概述
2、現有檢測、分割模型的局限性
3、開源圖像識別大模型 RAM
4、泛化訓練及未來研究探討

直播信息
直播時間：7月27日19:00
直播地點：智東西公開課知識店鋪

成果
論文標題：《Recognize Anything: A Strong Image Tagging Mode》
論文地址：//arxiv.org/pdf/2306.03514.pdf
代碼地址：//github.com/xinyu1205/recognize-anything
Huggingface Demo：//huggingface.co/spaces/xinyu1205/recognize-anything

国产又黄又猛又粗又爽的A片,小祖宗┅┅快┅┅用力啊视频,国产精品麻豆欧美日韩ww,少妇精品无码一区二区免费视频,波多野结衣在线播放

相關推薦