AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布三类模型安全评测

智東西（公眾號：zhidxcom）
作者?|?香草
編輯?|?李水青

智東西7月24日報道，今日，中國人工智能產業發展聯盟（AIIA）安全治理委員會舉辦了成果發布會。會上，中國信息通信研究院人工智能研究所安全與元宇宙部主任石霖，解讀了成立半年來委員會形成的組織架構，安全、治理兩大工作組的工作情況，并啟動了AI安全守護計劃，發布了三大類別的安全評測結果。

AIIA安全治理委員會成立于2023年12月底，經過半年運營，現有治理組、安全組兩個工作組，近百家單位加入，主任單位由中國信通院牽頭，副主任單位包括多家知名企業和高校。

其中，治理組工作圍繞AI治理框架、合規治理、賦能治理展開，安全組主要開展大模型安全、合規等研究及基準測試。

今年6月，中國信通院依托該委員會發起“人工智能安全守護計劃”，包括建立威脅信息共享機制、開展AIGC真實內容來源可信工作、建立AI保險機制等。

一、成立半年近百家單位加入，形成安全、治理兩大工作組

AIIA安全治理委員會成立于2023年12月底，經過半年的運營，組織架構現有治理組、安全組兩個工作組，同時負責運營安全對齊伙伴計劃、可信人臉應用守護計劃、內容科技產業推進方陣等。

AI安全守護計劃啟動！信通院牽頭，AIIA安全治理委員會發布三類模型安全評測

▲AIIA安全治理委員會整體情況

目前，AIIA安全治理委員會已有近百家單位加入，由主任單位、副主任單位、專家委和辦公室，以及圍繞業務方向設置的工作組和伙伴計劃組成。

其中，主任單位由中國信通院牽頭，副主任單位包括vivo、百度、騰訊、360、華為、中國移動、阿里、浙江大學以及螞蟻集團。

專家委負責對AIIA安全治理委員會的總體工作進行把關，兩個工作組及伙伴計劃則負責開展AI相關研究，推動產業鏈各方的AI安全治理工作。

據石霖介紹，治理組目前的工作進展圍繞三個方面展開，包括AI治理框架、AI合規治理以及AI賦能治理。

AI安全守護計劃啟動！信通院牽頭，AIIA安全治理委員會發布三類模型安全評測

▲治理組工作進展

具體來說，治理工作組聚焦AI整體治理框架研究和起草工作，與國際對標，如針對ISO/IEC 42001等進行研討對比，輸入國際優秀風險管理經驗。

同時，治理組圍繞人臉識別等典型應用開展工作，支撐地方網信主管部門針對文旅行業開展合規實踐，形成人臉識別相關治理研究報告。

此外，圍繞AI賦能治理，治理組開展法律大模型相關技術標準規范研討工作，相關規范正式定稿。

安全組則主要根據大模型安全、合規等熱點方向，開展安全基準測試，推動多項AI原生安全規范的編寫和技術交流。

AI安全守護計劃啟動！信通院牽頭，AIIA安全治理委員會發布三類模型安全評測

▲安全組工作進展

目前，安全組圍繞大模型的安全合規和技術研究開展文檔編寫等，已經開展了兩個批次的AI安全Benchmark測試工作，其中二季度融入了更多常見攻擊方法，包括誘導攻擊、提示詞注入攻擊、內容泛化攻擊等，能更全面直觀反映國內外閉源模型的安全情況。

圍繞AI原生安全、AI賦能安全等，安全組在今年上半年先后召開了線上/線下共20多場交流研討，開展了標準制定、測試評估等工作，包括大模型安全、AI網絡安全大模型規范、AIGC檢測規范等。

石霖談道，在兩大工作組的實踐當中委員會發現，單獨的工作組各自圍繞安全或治理，從規則或技術角度開展工作，在這個過程中技術和規則需要融合。因此，建立跨組安全防護能力至關重要。

今年6月，中國信通院依托AIIA發起“人工智能安全守護計劃”，即AI Guard，目標是聯合多方力量提升我國AI技術水平和治理能力，促進產業健康有序發展。

AI安全守護計劃啟動！信通院牽頭，AIIA安全治理委員會發布三類模型安全評測

▲人工智能安全守護計劃

首先，該計劃將建立AI威脅信息共享機制，從AI芯片等基礎設施，到數據、算法、應用等方面的漏洞，通過委員會層面的互助共治及時預警，提升安全防范能力，從而應對AI安全威脅除等問題。

其次，該計劃將開展AIGC真實內容來源可信工作，通過建立統一內容標準平臺，打造內容可溯源的能力。目前主要針對圖片、音頻和視頻等多模態內容，采用隱式水印方法建立互認機制。文本內容上的實現仍有一定技術難度，后續將持續有針對性地突破。

此外，計劃將通過AI保險機制，為相關人員和單位給予救濟，提供賠償兜底策略。

最后，石霖發布了大模型安全風險防范能力評測、多模態圖文大模型內容安全防范能力評測、人臉識別安全專項評測以及代碼大模型安全風險風險防范能力評測結果，vivo、螞蟻、阿里云、百度、科大訊飛、商湯等作為代表獲得了證書。

AI安全守護計劃啟動！信通院牽頭，AIIA安全治理委員會發布三類模型安全評測

▲大模型安全風險防范能力評測、多模態圖文大模型內容安全防范能力評測結果

AI安全守護計劃啟動！信通院牽頭，AIIA安全治理委員會發布三類模型安全評測

▲人臉識別安全專項評測結果

AI安全守護計劃啟動！信通院牽頭，AIIA安全治理委員會發布三類模型安全評測

▲代碼大模型安全風險風險防范能力評測結果

大模型發展迅速，但AI安全問題的嚴重性和緊迫性不容忽視，安全挑戰已從技術本身的傳統安全問題向多方面擴展，各國和地區基本形成本土框架。例如，美國推出風險管理框架，歐盟構建風險分級治理方案，新加坡推出治理模型框架并提出9個維度，日本發布指南制定行為準則等。

而在國內，AIIA安全治理委員會正在積極推動精準化治理前沿技術治理工具的構建，目前已圍繞治理框架、風險管理、衛生安全、安全應用取得一定成果。未來在各單位的共同努力下，期待我國能形成完整的安全風險機制，確保AI向安全可靠可控方向發展。