4月1日-2日,2025中國生成式AI大會(北京站)「GenAICon 2025北京站」將在北京中關村東升科技園萬麗酒店盛大舉辦。中國生成式AI大會已成功舉辦三屆,現已成為國內人工智能領域最具影響力的產業峰會之一。
本次大會繼續由智一科技旗下智猩猩、智東西共同發起,以“大拐點 新征程”為主題,邀請到50+位重量級嘉賓同臺分享和交鋒,深入解構DeepSeek引發的變革狂潮,全面展示國內生成式AI重大進展。大會也是“智領未來”北京人工智能系列活動之一。
大會主會場首日將進行開幕式、GenAI應用論壇,次日全天將進行大模型峰會;分會場則會先后組織DeepSeek R1與推理模型技術研討會、AI智能體技術研討會和具身智能大模型技術研討會。其中,三場研討會為閉門制,主要面向持有閉門專享票、貴賓通票的觀眾開放。

作為本次峰會的三場技術研討會之一,DeepSeek R1與推理模型技術研討會將在4月1日的下午進行,由主題報告和圓桌Panel兩個環節組成。
目前,DeepSeek R1與推理模型技術研討會邀請到360智腦算法資深專家鄒昊晟,中國人民大學高瓴人工智能學院在讀博士陳志朋,東南大學計算機學院碩士研究生、LMM-R1一作 、螞蟻金服實習算法研究員彭英哲,浙江大學軟件學院碩士研究生、LightThinker一作張錦添,華中科技大學Hust Vision Lab與地平線聯合培養博士生蔣博5位來自學術界和工業界的青年學者和技術專家帶來報告。
性能領先、開源普惠、國產易獲取的三重勢能,造就了2025年初DeepSeek的技術平權狂熱。然而,在端側部署DeepSeek模型時,研究者需在高計算成本和低推理質量之間權衡。3月4日,360智腦開源了Light-R1模型及全部訓練數據和代碼,用較低的訓練成本即可從零訓練得到推理模型,在開源時首次實現領域內評測超越DeepSeek-R1-Distill。本次研討會,?360智腦算法資深專家鄒昊晟將以《Light-R1:低成本復現推理模型之路》為主題,介紹Light-R1背后的課程學習SFT、RFT、DPO等方法上的數據心得和訓練策略,和QwQ-32B、TinyR1等相關工作在訓練資源、方法等各方面進行比較。
傳統通用大型語言模型的思維方式更像是“快思考”,其主要依靠算力對海量數據進行學習,實現對后續空白內容的快速預測,回答人類提出的各類問題,本質上是基于概率模型對可能的答案進行“猜測”。相比之下,推理大模型更有意識和邏輯,會在回答之前進行一段時間“慢思考”,依據特定思維鏈條,提供更全面解答。本次研討會,中國人民大學高瓴人工智能學院陳志朋博士將以《類o1模型復現探索與行業思考,慢思考的外置、內化與提升》為題,闡述如何通過獎勵引導的外置樹搜索、“模仿、探索和自我改進”的框架來增強大語言模型的推理能力。陳志朋博士負責推進“STILL”系列研究工作,探索大模型慢思考能力這一前沿課題,為提升大模型的深度推理能力提供了新的思路。
大型多模態模型在處理視覺與語言信息時面臨著顯著的推理能力挑戰,尤其是在多模態環境下實現高質量的邏輯推理更是難上加難。LMM-R1提出了一種創新的兩階段框架,通過規則強化學習實現了模型推理能力從文本到多模態的跨域遷移與泛化。本次研討會,LMM-R1一作彭英哲將以《LMM-R1:探索增強多模態模型推理能力的兩階段強化學習》為題,深入剖析LMM-R1的技術原理、實現細節與評估結果,探討這一方法如何推動多模態AI技術在實際應用中的落地,以及對未來研究方向的啟示。
大型語言模型在復雜推理任務中生成冗長的中間思維步驟會導致顯著的內存與計算開銷,限制其實際應用效率。本次研討會,LightThinker一作張錦添將以《長思維鏈高效推理方法——動態壓縮思維過程》為題,闡述通過訓練的方式,讓大型語言模型在合適的時機自主壓縮冗長的思維為緊湊的表征,并基于壓縮后的內容繼續推理,從而降低顯存開銷,提升推理速度。張錦添主導并開源MachineSoM、OneGen、LightThinker等研究項目,參與agents(github累積5.3k star)項目的構建。
DeepSeek R1驗證了強化學習在模型自主探索和提升模型能力/訓練效率上的顯著優勢,結合推理策略,有效增強了模型的復雜問題解決能力。在自動駕駛領域,終極任務是planning,這也是一項涉及場景理解、分析、和決策的復雜任務。本次研討會,華中科技大學Hust Vision Lab與地平線聯合培養博士生蔣博以《探索DeepSeek強化學習和推理策略在自動駕駛中的巨大潛力》為題,介紹將DeepSeek R1的強化學習和推理策略遷移應用于駕駛領域,并做出一系列針對駕駛規劃的策略優化,顯著提升大模型自動駕駛決策規劃的效果,并展現出涌現的多模態規劃能力。蔣博是AlphaDrive的一作,代表作VAD/VADv2,已成為端到端自動駕駛的基準算法。
一、DeepSeek R1與推理模型技術研討會議程

二、技術研討會報告人及報告主題介紹

報告嘉賓:360智腦算法資深專家 鄒昊晟
報告主題:Light-R1:低成本復現推理模型之路
內容概要: 360智腦在3月4日開源了Light-R1模型及全部訓練數據和代碼,用較低的訓練成本即可從零訓練得到推理模型,在開源時首次實現領域內評測超越DeepSeek-R1-Distill。報告將介紹Light-R1背后的課程學習SFT、RFT、DPO等方法上的數據心得和訓練策略,和QwQ-32B、TinyR1等相關工作在訓練資源、方法等各方面的比較。雖然Light-R1僅使用數學數據訓練了模型的長推理能力,但在非數學任務上也表現出了泛化性及有效性。隨著訓練和推理技術的不斷發展,未來長推理模型將更加普及,Light-R1正為低成本快速訓練一個領域專精推理模型提供了重要參考。

報告嘉賓:中國人民大學高瓴人工智能學院二年級博士研究生 陳志朋
報告主題:類o1模型復現探索與行業思考,慢思考的外置、內化與提升
內容概要:
最近,測試時擴展(Test-time Scaling )引起了研究界的廣泛關注,這在很大程度上得益于OpenAI o1模型和DeepSeek R1模型的重大進展。通過在推理階段分配更多的計算資源,大型語言模型(LLMs)可以通過生成更多的思考標記或多樣的解決方案,廣泛探索解決空間,從而產生更準確的響應。然而,研發和訓練類似的推理模型具有挑戰性,研究人員一直在進行各種嘗試,以推動這一開放研究領域的發展。我們先后從以下三個方面對復現類R1的慢思考系統做出了探索。
1.如何通過獎勵引導的外置樹搜索增強大型語言模型的推理能力?
2.如何通過內化慢思考過程長程思維鏈,使用“模仿、探索和自我改進”的框架來增強大語言模型的推理能力?
3.如何對已經具備慢思考能力的大語言模型進行進一步提升?

報告嘉賓:東南大學計算機學院碩士研究生二年級、LMM-R1一作 、螞蟻金服實習算法研究員 彭英哲
報告主題: LMM-R1:探索增強多模態模型推理能力的兩階段強化學習
內容概要:
大型多模態模型(LMMs)在處理視覺與語言信息時面臨著顯著的推理能力挑戰,尤其是在多模態環境下實現高質量的邏輯推理更是難上加難。LMM-R1提出了一種創新的兩階段框架,通過規則強化學習實現了模型推理能力從文本到多模態的跨域遷移與泛化。在第一階段”基礎推理增強”(FRE)中,LMM-R1利用純文本數據集進行規則強化學習,克服了直接多模態訓練中數據稀缺與質量不足的瓶頸,構建起堅實的推理基礎。隨后在第二階段”多模態泛化訓練”(MGT)中,模型將已獲得的推理能力自然擴展到視覺-語言交互場景,展現出強大的跨模態泛化能力。實驗表明,該方法在多種基準測試中取得了顯著進步,多模態任務平均提升4.83%,純文本任務提升4.5%,特別在需要復雜推理的場景中表現尤為突出。更重要的是,LMM-R1建立了一種數據高效的訓練范式,巧妙規避了對大量高質量多模態訓練數據的依賴,為大模型推理能力的提升開辟了新途徑。本次演講將深入剖析LMM-R1的技術原理、實現細節與評估結果,探討這一方法如何推動多模態AI技術在實際應用中的落地,以及對未來研究方向的啟示。

報告嘉賓:浙江大學軟件學院碩士研究生二年級、LightThinker一作 張錦添
報告主題:長思維鏈高效推理方法——動態壓縮思維過程
內容概要:
大型語言模型(LLM)在復雜推理任務中生成冗長的中間思維步驟會導致顯著的內存與計算開銷,限制了其實際應用效率。現有高效長思維推理方法可以分為兩類,第一類通過提示工程或者訓練的方式讓LLM學會使用較少的詞進行推理,第二類通過在LLM推理過程中對kv緩存進行裁剪進行。本次演講提出LightThinker,一種基于動態思維壓縮的推理加速方法,其核心是通過訓練的方式讓LLM在合適的時機自主壓縮冗長的思維為緊湊的表征,并基于壓縮后的內容繼續推理,從而降低顯存開銷,提升推理速度。

報告嘉賓:華中科技大學Hust Vision Lab與地平線聯合培養博士生 蔣博
報告主題:探索DeepSeek強化學習和推理策略在自動駕駛中的巨大潛力
內容概要:
DeepSeek R1驗證了強化學習在模型自主探索和提升模型能力/訓練效率上的顯著優勢,結合Reasoning策略,有效增強了模型的復雜問題解決能力。在自動駕駛領域,終極任務是planning,這也是一項涉及場景理解、分析、和決策的復雜任務,我們首次嘗試將DeepSeek R1的強化學習和推理策略遷移應用于駕駛領域,并做出一系列針對駕駛規劃的策略優化,顯著提升大模型自動駕駛決策規劃的效果,并展現出涌現的多模態規劃能力。
三、報名方式
DeepSeek R1與推理模型技術研討會將在4月1日下午的分會場進行,主要向持有閉門專享票、貴賓通票的觀眾開放。
希望參加研討會的朋友,可以掃描下方二維碼,添加小助手“泡泡”咨詢和購票。已添加過“泡泡”的老朋友,給“泡泡”私信,發送“GenAICon25”即可。

除了閉門專享票、貴賓通票,大會還設有主會場觀眾票、主會場VIP票,在主會場的座位分布如下。有需要的朋友可以進行免費申請或購買。
