9月8日上午,在上海舉行的2023 inclusion·外灘大會《從機器智能到人機智能》論壇上,ATEC前沿科技探索社區宣布啟動ATEC“數星”計劃。
這是業內首個基于真實工業場景的大規模研究性數據集開放計劃,首批將公開兩個脫敏的、超大規模的工業數據集——ATEC2022賽事數據集“農村金融風險預測”和螞蟻集團多場景多模態點擊率預估數據集(AntM2C)。
“農村金融風險預測”中包含了涉農經營者的信貸風險信息及用戶的歷史多源交互數據。如何利用數字化技術識別農村經營者的經營狀況和經營風險,是幫助農村經營者進行融資的基礎能力之一。該數據集在遵循國家法律法規及個人隱私保護的前提下,為金融科技領域、特別是農村金融科技領域的行業研究和發展提供了重要的數據支持。
AntM2C覆蓋支付寶內多個業務場景,包含廣告、營銷、搜索和推薦真實場景中不同類型商品的CTR數據,整體數據規模達到10億(第一階段發布1700萬規模的數據)。該數據集的發布填補了行業內,多場景多模態點擊率預估問題的數據集空白。
清華大學計算機系副系主任、ATEC前沿科技探索社區發起人徐恪教授指出,“數星”計劃是ATEC社區在科技賽事、高校實訓之后的又一項重要舉措。數字技術的研究和發展離不開真實應用的數據土壤,億級規模工業數據集,將成為人機智能等創新技術的關鍵燃料,推動機器智能等新一代數字技術的新范式發展。”
目前,“數星”計劃的數據集可在ATEC官方平臺下載。
ATEC 是信息領域前沿技術實踐發展社區,致力于搭建面向新一代互聯網相關技術的產學研合作平臺,推動創新技術的產業應用研究,支持實踐型技術人才培養,傳播積極奮進的工程師文化。社區的發起單位包括清華大學、上海交通大學、浙江大學、西安交通大學和螞蟻集團等。
人機混合智能是人工智能發展的必經之路,本次論壇圍繞以人為本的人機增強Al技術的關鍵技術發展和價值,以及產業應用和實踐等進行了探討。同濟大學校長鄭慶華,清華大學計算機系教授、信息科學與技術國家研究中心副主任朱文武,浙江大學教授吳飛,螞蟻集團資深算法專家俞吳杰做了主題演講。