智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影
在博士畢業前,中國人民大學博士生王涵之,拿到了世界頂級高校墨爾本大學的教職。
近年來,人工智能領域博士一畢業就被聘為國內博導的事例已不鮮見,但無出國留學經歷、無博士后經歷、以國內博士生身份拿到海外頂尖大學教職者,仍是屈指可數。
師從中國人民大學高瓴人工智能學院魏哲巍教授的王涵之,就是這樣一位佼佼者。
面向圖計算與近似算法研究,王涵之在KDD、SIGMOD、VLDB、PODS、STOC等會議上發表多篇高質量論文,成功將單點PageRank、PageRank contributions、動態子集采樣等多個圖分析問題的計算時間復雜度降低至理論下界,達到理論最優。
在校期間,她獲得過諸多學術殊榮:2021年百度獎學金(全球10人)、2022年微軟學者獎學金(亞太地區12人)、2024年吳玉章獎學金(全校10人),在畢業之年入選2024年“CCF優博”,成為人大歷史上第四位獲此殊榮的博士生。
CCF優博(中國計算機學會博士學位論文激勵計劃)是中國計算機學會自2006年起設立的激勵獎項,每年從國內高校計算機學科博士畢業生中評選不超過10名獲獎者,以表彰其所做出的優秀成果。王涵之也是2024年CCF優博中唯一一位女生。
▲2024CCF博士學位論文激勵計劃入選者與頒獎嘉賓合影,右五為王涵之(圖源:中國計算機學會)
2015年考入人大、2019年直博、2024年博士畢業后受邀加入墨爾本大學任Lecturer,王涵之的科研道路似乎很順遂。
但王涵之謙遜地說,自己剛讀博士時基礎很差,英語表達錯誤頻出,論文寫作一頭霧水,對算法設計也總是摸不著頭腦;幸運的是,導師魏哲巍教授的培養方法非常科學,在導師的指導下,她逐步成長,渡過道道難關,最終交出了一份亮眼的答卷。
一、為傳統問題設計高效算法,論文入選CCF優博
2024年夏季,烈日炎炎,王涵之作為學生代表在中國人民大學畢業典禮上發言。她提到現今科學技術日新月異,各領域研究范式劇烈變化,整個社會被牽引與變革。作為新時代的青年,她希望以求知初心,實干篤行,在追求真理的道路上勇攀高峰,追逐熱愛、奔赴山海。
王涵之是中國人民大學信息學院2015級本科生、2019級直博生,師從高瓴人工智能學院魏哲巍教授。
魏哲巍教授是高瓴人工智能學院的首批老師之一,33歲破格晉升為人大當年最年輕的正教授、博導,在頂級學術會議及期刊上發表論文80余篇,主持自然科學基金重點項目、科技部2030人工智能重大項目課題。高瓴人工智能學院在CS Ranking人工智能方向排名世界第七。
博士期間,王涵之的研究目標是為傳統問題設計具有可擴展性的高效算法,這是大數據時代的新課題。
其方法可以簡單理解為:通過設計更好的算法,使得原問題可以在更大的數據集上被更快更好地解決。“這樣既解決了問題,又節約了算力成本、減少了時間消耗,屬于花小錢辦大事”。
以網頁搜索為例,人們在搜索引擎中查詢感興趣的內容時,會希望立刻查到高質量網頁。但是互聯網上的網頁規模以十億、百億計,傳統算法在包含100萬網頁的網絡上返回搜索結果普遍已經需要1分鐘才能完成計算,如果不進行算法優化,則只能通過多配置算力機器的方法加速算法運行,這樣會引發不必要的經濟費用,也會消耗大量能源。
而王涵之的工作通過算法優化,實現在10億網頁的網絡上也可以1秒鐘得到搜索結果,且保證搜索質量不變或更高。這一思路在圖神經網絡等應用領域亦有啟發意義,對算法運行效率的整體理解與優化有助于顯著提高經濟效益和社會效益。
王涵之的博士學位論文《大圖上隨機游走概率的高效計算》,提出了圖上隨機游走概率計算的通用范式。她設計的通用算法在應用場景中進行了實驗驗證,證明該算法的計算復雜度在常見設定下已達到理論最優,可加速社區發現和圖神經網絡等實際應用場景的執行效率。這項研究成果入選了2024年CCF優博獎項。
▲CCF優博獲獎者名單
二、算法研究像探索世界,追求簡潔優雅
“我的科研基礎很差,但魏老師始終非常耐心,絕不會因為我想不出問題就批評指責,也從未因為進度不佳就打擊催促。魏老師始終平和、冷靜、客觀、包容。”王涵之回憶說,在她進步的路上,魏老師的支持和鼓勵給了她很大的動力。
王涵之初與算法研究結緣,是在一堂由魏哲巍教授主講的大三計算機專業必修課《算法分析與設計》上。無論是多么晦澀難懂的概念和艱深抽象的名詞,經過魏老師深入淺出地講解后,似乎都會變得親和友善起來。
在中國人民大學,無論是本科生還是研究生,都可以在微人大上搜到各年級的完整課表。王涵之每個學期也都會去旁聽她感興趣的課程,接收不同方向的思維灌輸。
博士剛入學時,魏老師先讓王涵之讀幾本算法書籍打基礎,循序漸進地培養科研能力。當她遇到想不清楚的算法問題,魏老師很少直接講授解決思路,而是會把大問題拆分為小問題,逐步引導。
“這個過程就像在游戲中升級打怪,你并不會覺得一下子很難,每步都感覺是一項小關卡,有一點難,但努努力還是可以夠到。”王涵之分享道。
在研究過程中,她曾發現之前做算法推導時遺漏了一個細小步驟,導致計算復雜度的結果出錯,這項工作因此被卡住。在破解一個個分支問題后,王涵之起初遇到瓶頸的大問題最終取得突破。她的研究成果發表至國際理論計算機領域頂級會議STOC。
▲王涵之與導師魏哲巍教授合影(圖源:中國人民大學)
每當聊到與導師交流、思考研究方向、攻克理論難題等各種科研經歷時,王涵之總會流露出一股熱情昂揚的勁頭。
“魏老師常鼓勵我們要設計God-intended的算法。”她分享說,God-intended算法是一個略夸張的比喻,指的是“上帝所設計的算法”,即盡可能追求簡潔優美的算法,最好能在算法設計時覺得哪怕是上帝在解決這個問題時,其大抵也應該會這樣設計算法。
這不僅是對算法運行效率的一種追求,更是因為“最簡潔優雅的算法往往能帶來最直觀的效益”,而反復優化算法結構的過程會不斷加深自己對問題的思考。
在她看來,這種探索世界的感覺,正是算法研究的魅力所在。每當一個琢磨很久的算法問題有了突破,她會收獲一種撥云見日的快感,就像在一條走了100遍的路上突然發現了金礦。
這份研究熱情,驅使她在博后畢業拿到墨爾本大學的教職后,并沒有選擇立刻入職,而是決定先前往丹麥哥本哈根大學BARC基礎算法研究中心跟隨Mikkel Thorup教授進行一年的博后學習,以期進一步提升自己的能力。
王涵之說,Mikkel Thorup教授是算法研究領域最頂級的專家,似乎總能一眼看透問題的本質,和他在一起工作總會被他奇妙的想法所震驚,感覺每天都在經歷柳暗花明的過程。“他對我們說的最多就是‘have fun’,這份對算法研究的純粹熱情反復感染著我們。”
▲王涵之
結語:青年人才擔起傳遞算法薪火的重任
發展以深度學習為重心的人工智能技術,離不開海量高質量數據的驅動。而中國最早的數據庫教學研究,正是在中國人民大學開創的。如今,高速發展的人工智能相關學科正發展成人大的一枚新金字招牌,近年來密集產出前沿學術成果。
當前,人工智能已成為引領科技革命和產業變革的戰略性技術,正在重構全球創新版圖。隨著相關理論、技術、應用的突破日新月異,人工智能學科的熱度高漲,不僅有更多年輕研究員在一流人工智能實驗室擔起科研主力,還有越來越多的優秀青年人才走上傳遞薪火的教職崗位。
新一代青年學者正展現出超越年齡的學術天賦和定力,以更開闊的視野、探索未知的熱忱、長期主義的精神,在算法理論和應用領域持續沉心求索,推動更多的破界創新。