智東西(公眾號:zhidxcom)
作者 | 陳駿達
編輯 | 漠影

“我的數據庫……沒了?”

今年7月,一位名為“Jason”的網友在X平臺上分享了一場Vibe Coding災難。他在開發平臺Replit上使用其內置的Agent輔助編程,在一次操作中,Agent在沒有明確用戶指令的情況下,竟錯誤地執行了一個致命的數據庫命令。

頃刻之間,他長達80小時的工作成果被清空。這無異于一位本應協助你的“數字員工”,在未經允許的情況下,走進你的辦公室,將你寫了數周的項目資料全部扔進了碎紙機。

暗潮洶涌,云廠商打響Agent Infra之戰,阿里云憑什么沖出重圍?

Jason的遭遇絕非孤例,這揭示了Agent從原型演示到投入生產環境之間尚未跨越的鴻溝,即底層基礎設施(Infra)的缺失。

當前,AI模型正在從被動的問答工具,轉變為能夠自主規劃、執行任務的Agent數字員工。然而,如何為這些員工提供足夠強大的算力和工具,并賦予長期記憶,又如何為它們設定權限紅線,確保它們不會“誤觸紅色按鈕”,已成為Agent規模化普及前的巨大挑戰。

沒有堅實可靠的Agent Infra,再聰明的Agent也無法成為可信賴的生產力。Replit的這次事故,正是這種風險最生動的注腳。

而這也正是阿里云、AWS、谷歌云、微軟Azure等云廠商爭相發力Agent Infra的核心原因。他們試圖打造的并非一個簡單的工具集,而是一座現代化的 “智能車間”。

在這里,每個AI Agent都將在安全的環境中工作,擁有清晰的權限、穩定的工具和足夠的數據,從而真正從實驗室的原型,轉變為真實生產環境中可靠數字員工。

一、Agent規模化落地挑戰大,配套Infra已成必選項

企業為何需要這樣一座Agent智能車間呢?

要讓Agent在生產場景中發揮作用,我們需要為其提供足夠的算力和數據(記憶),幫助Agent解決水土不服的問題。

例如,當Agent分析海量數據時,本地設備既無法承載龐大的數據洪流,也無法完成復雜的推理運算。這時,云端算力的支持就成了理所當然的選擇。

此外,要讓Agent做出正確的決策,就需要為其提供全面、準確且實時的信息,否則,其決策將基于不完整或過時的數據,導致輸出結果不可靠,甚至產生錯誤。

但這僅僅是第一關,更大的隱患在于安全與權限控制的缺失。今年,知名AI搜索獨角獸Perplexity旗下的Comet AI瀏覽器就曾爆出安全丑聞。

這款AI瀏覽器本質上就是一個能直接操縱用戶設備的Agent,然而,由于缺乏安全機制,它在閱讀到網頁上植入的惡意指令后,能直接打開用戶郵箱、收取驗證碼,還把驗證碼分享給外部黑客,一條龍完成盜號。

暗潮洶涌,云廠商打響Agent Infra之戰,阿里云憑什么沖出重圍?

這一事件暴露了將擁有高權限的Agent直接部署在開放環境中的巨大風險,企業必須為Agent打造配套的基礎設施。

然而,Agent Infra極為復雜,涉及底層算力調度、安全沙箱、模型集成、記憶數據庫、工具調用鏈路等一系列核心技術模塊,企業自建成本高昂且技術門檻難以逾越,后續維護也需要持續投入頂尖的研發團隊,并時刻應對層出不窮的新型安全威脅,堪稱一個填不滿的技術深坑。

暗潮洶涌,云廠商打響Agent Infra之戰,阿里云憑什么沖出重圍?

采用云廠商們開發的現成Agent Infra套件,對大多數企業而言是更為現實的選擇。例如,知名Agent產品Manus便是通過Agent Infra創企E2B打造的沙盒環境,讓Manus的Agent獲得了完整的終端訪問權限,也提供了持久化的工作空間,這對于Manus廣為人知的長鏈路任務而言,十分重要。

除了E2B外,AWS、谷歌云、微軟Azure等云廠商也都已打造了相關套件。

AWS的AgentCore提供記憶管理、身份驗證、代碼執行和瀏覽器工具等,強調安全、可擴展和多Agent協作;

谷歌云的Vertex AI Agents聚焦構建和管理多Agent系統,支持任務調度、跨Agent協作以及與企業數據和云服務的集成;

微軟Azure的Agent Factory強調身份認證、治理、內容安全和可觀測性,同時結合Azure云服務和Copilot工具鏈,支持企業快速落地智能體應用。

總體來看,主流云廠商的思路均是:構建安全、可擴展、可組合的Agent Infra,讓企業開發者能在已有基礎設施和生態下快速部署、管理和監控多Agents系統,形成差異化服務能力,同時降低企業上手門檻。

二、國產Agent Infra突圍,讓Agent學會自我進化

在Agent Infra的布局上,國內廠商也絲毫不落后。今年4月,阿里云開啟Agent Infra開發套件——無影AgentBay的公測,迅速吸引了大量開發者和企業關注。

AgentBay的核心定位是為AI Agent打造的“超級大腦”或“云上操作系統”。它能夠動態調用云端算力、存儲和工具鏈資源,將復雜任務接入高性能云電腦,突破了Agent在本地設備上的算力限制。

暗潮洶涌,云廠商打響Agent Infra之戰,阿里云憑什么沖出重圍?

AgentBay不僅集成了云上沙箱環境、算力調度、持久化數據存儲和企業級安全等核心功能,還內置了視覺理解、自然語言控制和任務解析等多項AI技術。尤其是云上沙箱環境,保障了Agent對本地環境的零侵入,給Agent執行加了一道保險。

同時,它支持原子化工具API、AI Agent API以及ASP遠程串流協議等多種交互方式,極大地提升了自動化執行效率,使開發者能夠在高性能、安全的云端環境中快速部署和管理AI Agent。

而在今年的云棲大會期間,AgentBay迎來重大升級,推出了自進化引擎、內存狀態管理、安全圍欄等全新能力。其中最引人關注的,是基于環境反饋的自進化引擎——Self-Evolving。

阿里云無影關注到了企業在利用第三方AI Infra部署AI Agent時的一大關鍵挑戰。Agent并不能在執行任務過程中實現“自我提升”,最終其效果還需要人工調整,才能逐漸優化。這就好比你招募了一位員工,但他并不能主動從工作中總結經驗和教訓,始終未能進步。

對于AgentBay自進化引擎的工作原理,AgentBay產品經理屈立威向智東西解釋道,自進化引擎可以理解為廣義的強化學習,但并不直接訓練模型。自進化引擎會針對提示詞、工作流、Agent架構、工具等多個方向進行能力優化,每個方向使用的方法或算法各不相同。

暗潮洶涌,云廠商打響Agent Infra之戰,阿里云憑什么沖出重圍?

例如在提示詞優化方面,對于短序列任務,可以直接根據目標和實際結果進行修正;而對于長序列任務,由于難以直接獲得最終結果,則會采用多種算法來優化執行效果,比如基于文本梯度(text grad)或微調推理(mipro)的方法。

通過這種模塊化、服務化的設計,企業無需組建龐大AI團隊,也能讓Agent在執行過程中不斷自我優化,提升與業務目標的匹配度。

AgentBay自進化引擎能夠在任務執行中自動分析Agent的失敗案例,并嘗試生成和測試更優的提示詞。它還能根據任務需求自主創建或封裝新工具,不斷拓展Agent能力邊界。

這一機制不僅關注單個Agent的流程優化,也可在多Agent協作網絡中智能部署最優工作流,提高整體效率。

此外,平臺的記憶策略使Agent具備“過目不忘”和“選擇性遺忘”的能力,可以對長期任務進行智能管理,適應復雜、長周期的應用場景。

三、Agent Infra加速發展,會成為下一代應用的躍升點嗎?

AgentBay并非憑空出現,屈立威在采訪中介紹道,在云電腦時代,阿里積累了多項核心技術能力,而AgentBay的許多技術依賴,與云電腦是“一脈相承”的。

例如,云電腦需要高流暢性和清晰的操作體驗,而阿里云此前已自研了ASP端云實時通信協議,確保遠程云環境操作體驗接近本地,這也能讓幫助Agent實現與云端執行環境之間的高效、實時交互。

大規模的資源調度能力和性能保障,也是阿里云此前打造云電腦時重點解決的問題。目前,AgentBay便依托阿里云的全球資源池進行部署,用戶可以就近接入,保證了低延遲和高可用性。

然而,Agent也提出了新的技術挑戰和升級需求。屈立威稱,首先,Agent需要更強的感知與控制能力,不僅要像人一樣“看懂畫面”,判斷鼠標點擊、輸入是否生效,還要支持文件系統操作、命令行以及撰寫RPA腳本等多種工具操作。

其次,其風控與安全要求也更高,需要阻斷敏感指令、過濾不安全內容、約束上網行為,保障企業私域安全。

此外,Agent任務的執行方式呈樹狀、多分支,每個節點都需打快照(checkpoint)、支持快速回滾,并復制克隆環境以實現并行執行,這對狀態管理和多維度調度提出了更高要求,而這些都是云電腦時代所未涉及的關鍵能力,需要重點突破。

暗潮洶涌,云廠商打響Agent Infra之戰,阿里云憑什么沖出重圍?

為此,阿里云自研了持久化文件系統,讓AgentBay能夠動態地按需保留用戶狀態和文件,確保了任務執行的連續性和狀態的一致性,這對于需要執行長鏈條、多步驟任務的復雜Agent至關重要。

安全方面,AgentBay則構建了端到端安全體系,包括沙箱隔離、數據加密與RBAC訪問控制、AI內容風險檢測以及日志審計,保障任務安全、合規與可追溯。

除了給企業打造Agent Infra之外,阿里云還在云棲大會上,給個人用戶也提供了一款跨終端、跨模態的智能計算平臺——無影Agentic Computer。

Agentic Computer是一個擁有長期記憶的個人助手,具備云端彈性算力與多任務并行能力。它內置垂直場景Agent,實現辦公、設計、研究等專業化支持。它將個人計算與云端智能協同起來,有望讓更多用戶體驗到Agent帶來的賦能作用。

暗潮洶涌,云廠商打響Agent Infra之戰,阿里云憑什么沖出重圍?

從產業視角來看,Agent Infra的發展與移動互聯網時代App生態的興起有一大共性:基礎設施成熟,為新形態產品快速落地提供了支撐。

移動互聯網時代,智能終端、網絡和云計算能力的完善,使海量App得以高效運行和廣泛普及,催生了豐富的應用生態;如今,AI Infra依托全球化云資源、彈性算力調度和全棧安全體系,為AI Agent提供高性能、低延遲、可控的運行環境。

穩固的基礎設施降低了創新門檻,推動Agent在企業自動化、內容生成等多樣化場景中迅速落地,有望形成新一輪產業生態和創新循環。

結語:給Agent打好Infra地基,Agent離廣泛落地又近一步

Agent Infra正逐步成為新一代數字化、智能化基礎設施的組成部分,類似于移動互聯網時代的云和網絡,為AI Agent生態提供底層支撐。

同時,Agent Infra的發展正在改變產業創新節奏和生態構建方式。企業不再需要自行搭建復雜底層架構,而是可以在統一、安全、可擴展的平臺上試驗多樣化Agent應用。

隨著工具鏈標準化和安全機制完善,或許會有越來越多企業和開發者能夠快速部署Agent,推動生產、服務和研發環節的自動化與智能化,從而催生新型業務模式和產業應用。