智東西(公眾號:zhidxcom)
作者 |? 陳駿達
編輯 |? 心緣
又一家千億美元估值AI獨角獸即將誕生!
智東西8月20日報道,昨日,AI數據分析平臺Databricks宣布,該公司已經簽署了K輪融資的條款清單,預計將在現有投資者的支持下很快完成,這輪融資對Databricks的估值已經超過了1000億美元(約合人民幣7179.1億元),估值與8個月前的620億美元(約合人民幣4451.0億元)相比,上漲了超61%。

▲Databricks官宣新融資(圖源:Databricks官網)
據TechCrunch援引知情人士的消息稱,Databricks最新一輪融資規模約為10億美元(約合人民幣71.8億元),投資方包括a16z、Thrive Capital等,并且獲得了“瘋狂的超額認購”。
成立于2013年的Databricks,主要提供統一的數據與AI平臺服務,幫助企業整合和處理大規模數據,用于數據工程、數據科學、機器學習與AI應用,也能為電商、金融、醫療等領域的企業提供數據服務。其創始團隊中還有華人,聯合創始人兼首席架構師為Reynold Xin(辛湜)。
作為獨特的“湖倉一體”數據庫架構開創者,Databricks是數據智能領域的代表性企業,也是AI時代重要的數據基礎設施提供商。截至目前,有超過60%的財富500強企業采用了Databricks的數據智能平臺來管理數據,并將其與AI結合。
Crunchbase的數據顯示,Databricks目前是全球估值排名第八的獨角獸企業。完成K輪融資后,Databricks有望成為僅次于OpenAI、字節跳動、xAI,估值排名全球第四的AI獨角獸企業。

值得一提的是,英偉達也是Databricks的投資方之一,曾領投Databricks的I輪融資,規模為5億美元,但并未參與本輪融資。
Databricks稱,本輪融資中獲得的資金,將被用于加速Databricks的AI戰略,這包括進一步擴大企業級智能體服務Agent Bricks、投資面向AI Agent優化的新數據庫Lakebase,并支持未來的AI領域收購,深化AI研究。
一、成立12年估值1000億刀,客戶規模已突破1.5萬
Databricks的創始團隊由七位加州大學伯克利分校的教授和研究生組成,自2013年成立以來,陸續吸引了大約80家投資者的關注。
該公司的創始人大部分為加州大學伯克利分校AMPLab成員,共同打造了開源分布式計算框架Apache Spark,還創下數據排序速度的世界紀錄。后來,他們決定將相關技術商業化運作,Databricks應運而生。

▲Databricks七位創始人(圖源:福布斯)
據The Information報道,早期投資者稱,Databricks的創始人們對如何賺錢幾乎沒有直覺,董事會原本打算在外部聘請有經驗的領導者擔任CEO,但發現時任Databricks工程副總裁的Ali Ghodsi在員工中很有聲望。
接任CEO后,投資者對教授出身的Ghodsi還是有些遲疑。Ghodsi加緊研讀商業書籍,惡補了企業管理的方法。如今,他以親力親為地方式管理這家企業,高強度工作,風格強硬,并憑借這種方式帶領Databricks快速發展,也獲得了客戶的信賴。
▲Ali Ghodsi(圖源:Databricks)
Adobe的首席數據官Bin Mu曾如此評價Ghodsi:“如果我遇到一個大問題,他會在接下來的一個小時內解決這個問題。”
Databricks的創始人團隊中還有華人身影。其聯合創始人兼首席架構師為Reynold Xin(辛湜),他高中畢業后前往加拿大多倫多大學就讀本科,后續在加州大學伯克利分校AMPLab完成博士學業,畢業后直接參與Databricks的創立。

▲辛湜(圖源:Linkedin)
“湖倉一體”架構是Databricks最重要的護城河之一。這一技術起源于DataBricks團隊創業前打造的Apache Spark項目,將數據倉庫的結構化數據存儲功能,與數據湖的非結構化和半結構化數據存儲能力融合,從而提升數據處理的效率與可靠性。
在AI時代,湖倉一體架構的價值愈發凸顯。AI訓練、推理過程中都需要使用到大量的結構化、半結構化和非結構化數據,湖倉一體架構能對這些數據統一存儲管理,支持實時數據攝入、處理和分析,還能彈性伸縮,從而降低存儲和計算成本。
湖倉一體架構也具備向量化檢索、與機器學習框架(如PyTorch)集成等AI原生設計,可簡化AI數據處理的流程。
2022年,OpenAI推出ChatGPT并引發全球AI熱潮后,Databricks聯合創始人兼CEO Ghodsi看到了AI對數據分析領域的巨大潛力,決定加大對AI技術的投資。當時,Databricks預計2022財年至2025財年期間的總現金消耗成本為15億美元。
2023年,Databricks還斥資13億美元收購了大模型創企MosaicML,此次收購幫助 Databricks在2024年3月份發布了一個開源模型,但并未推出后續版本,轉而使用開源模型。
Databricks的一體化數據智能平臺提供AutoML(自動化模型訓練)、Mosaic AI(模型部署)、AI Playground(無代碼互動測試)、Unity Catalog Agent工具管理、MLflow集成等AI服務,支持從數據管理、訓練、部署到監控的AI開發全流程,可整合大模型、工具鏈,與數據平臺無縫融合。
2024年時,Ghodsi稱,截至當年11月,包括Mosaic在內的生成式AI產品收入同比增長了300%。
二、連發多款AI Agent服務,年化收入達到37億美元
在去年年底拿下100億美元的巨額融資后,Databricks在AI領域的動作不斷,推出多款新產品與服務,還在收購市場斬獲一家AI創企。
Agent是近期Databricks投資、發展AI技術的主線。今年5月,Databricks宣布收購無服務器Postgres數據庫(一種開源的對象關系型數據庫)公司Neon。Neon使用AI Agent來驅動數據庫的配置,其平臺上八成的數據庫均由AI自動打造。
這筆交易的規模達到10億美元,Databricks可借此進一步消除傳統數據庫的彈性伸縮瓶頸,為AI Agent提供“AI優先”的底層數據庫功能。
收購Neon后不久,Databricks在今年6月推出了兩款Agent服務。
其中,Agent Bricks可用于自動化創建AI Agent,用戶只需提供對任務的簡單描述,并通過Databricks的數據庫向Agent提供企業數據,就能完成Agent創建。
Agent Bricks已經針對常見的行業用例進行了優化,比如結構化信息提取、知識輔助、自定義文本轉換和多智能體系統等,企業可以用其完成對電子郵件、法律文書等內容的處理。

Databricks還推出了Lakebase,這是一款用于AI應用和Agent的新型完全托管Postgres數據庫。
Lakebase由Databricks此前收購的Neon提供技術支撐,與Databricks的數據湖倉平臺Lakehouse深度整合,把業務數據和分析數據融合在一起,既能用來運行大規模分析,又能支持實時應用,滿足了AI Agent對快速查詢數據的需求。
這兩項服務起到了互補的作用,Agent Bricks顯著簡化了企業打造Agent的流程,而Lakebase能為這些Agent提供合適的數據庫。雖然都仍處在預覽階段,不過其易用性、生態整合度、兼容性等獲得了市場的認可。
各類AI服務的推出,也成為Databricks的新增長點。今年6月,Databricks高管在一場投資者活動上稱,該公司的年化收入會在7月份達到37億美元(約合人民幣265.6億元),同比增長50%。同時,Databricks的客戶數量已經達到了15000多家。
三、外部力量大力推動本輪融資,但還面臨多方競爭
Databricks已經成為硅谷當今最炙手可熱的投資標的之一,累計融資額近200億美元。收獲新一輪融資后,Ghodsi接受了CNBC的采訪,他稱在Figma完成IPO并股價飆升后,“他的手機被投資者轟炸了”,這輪融資“肯定有來自外部的大力推動”。
這也顯示出,投資方希望在Databricks這家同樣炙手可熱的AI企業IPO之前,分得一杯羹。在去年12月底官宣的J輪融資中,Databricks獲得了100億美元的巨額融資,創下當年度的融資紀錄,目前并不缺乏運營資金。
Ghodsi稱,目前投資者最關心的問題就是,Databricks的Agentic AI服務能否真正地自動化工作流程,有沒有給企業帶來價值?Ghodsi對此的回應是,這些服務仍處在早期階段,目前更注重解決企業的日常任務。
Databricks的本輪融資,印證了市場對此類新型AI數據基礎設施公司的濃厚興趣,不過,Databricks仍需面對來自Snowflake、甲骨文等對手的競爭。
成立時間與Databricks相仿的Snowflake,被普遍認為是前者的主要競爭對手之一。Snowflake源自云數據倉庫(Data Warehouse),主打結構化數據分析、易用性與企業級安全性。Databricks的Lakehouse則強調對結構化與非結構化數據的處理能力及AI/ML能力。
在AI時代,兩家公司的業務重合度不斷提升,都推出了數據Agent服務,在收購上也選擇了相同的方向——Snowflake于今年收購了Postgres數據庫創企Crunchy Data,與Databricks收購的Neon類似。Snowflake目前的市值約為642億美元,低于Databricks目前的估值。

▲Snowflake股價變動(圖源:雅虎財經)
甲骨文這樣的老牌數據庫企業,也在加緊布局AI相關的數據產品。甲骨文于2024年推出了生成式AI Agent服務,提供檢索增強生成(RAG)等功能。今年3月,該公司進一步推出AI Agent Studio,作為企業創建、擴展、部署和管理AI Agent和Agent團隊的綜合平臺,也能為Agent接入企業的自有數據。
諸如微軟Azure、谷歌云、AWS等大型云基礎設施公司也是這一市場中的重要參與者,并相繼推出了AI相關的數據服務。
咨詢公司IDC的報告顯示,2025年,在全球數據平臺軟件提供商中,Databricks在能力維度排名全球第一,與谷歌、甲骨文、Snowflake等共同處于領導者范疇,但在規模上略小于谷歌和Snowflake。

結語:Databricks接近自由現金流盈利,下一步會是IPO嗎?
多家分析機構指出,Databricks雖然仍在虧損,但在運營效率和成本控制上已有顯著改善,并有望在2025年實現自由現金流盈利。
隨著美股IPO市場回暖以及AI相關股票的驚人漲幅,投資者對Databricks潛在IPO的表現普遍看好——而近期一輪由投資者力推完成的融資,便成為最好的佐證。
不過,Databricks目前尚未提交IPO申請,其高管對相關事項的表述也較為模糊,僅透露有IPO意向,但未明確時間。