智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西7月4日報道,今日下午,騰訊云發布AI原生(AI Native)向量數據庫Tencent Cloud VectorDB。該數據庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景,是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數據庫,將于8月正式登陸騰訊云。

向量數據庫專門用于存儲和查詢向量數據。如果把大模型比作人的大腦,那么向量數據庫就如同海馬體,能夠為大模型提供長期記憶。向量數據庫可以突破時間和空間上的限制,助力企業廣泛挖掘數據價值。據悉,騰訊云向量數據庫最高支持10億級向量檢索規模,延遲控制在毫秒級,相比傳統單機插件式數據庫檢索規模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。

一、騰訊云定義AI原生向量數據庫,加速企業在大模型時代的AI化進程

騰訊云數據庫副總經理羅云談道,向量數據庫是企業數據和大模型之間的橋梁,能夠彌補大模型在時間和空間上的限制。

向量數據庫能夠解決大模型預訓練成本高、沒有“長期記憶”、知識更新不足、提示詞工程復雜等問題,加速大模型落地行業場景。

企業拿到非結構化數據后,通過神經網絡進行向量化,進而存儲到向量數據庫中,進行存儲和查詢,這樣可以極大地提升效率和降低成本。

羅云認為,AI原生時代已經到來,“向量數據庫+大模型+數據”,三者將產生“飛輪效應”,共同助力企業步入AI原生時代。

在AI原生時代,數據的使用范式如下圖所示,比如處理大段PDF文件,會先經過文本分割,把文字分解成小段文字,然后計算層會將這些文字通過向量化(embedding)算法變成浮點數數組,再調用向量數據接口,將數據存放到存儲層數據庫。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

用自然語言提出問題后,應用開發者后臺會計算“問題”向量,進行基于向量的知識檢索,找到最相關的20個片段,整理后推給一個大模型,讓大模型幫它得出最終的答案。可以看到,客戶的數據加工流程非常復雜,要解決分段、embedding、二次embedding等問題。

對此,騰訊云重新定義了AI原生的開發范式,提供了接入層、計算層、存儲層的全面AI化解決方案,讓用戶在使用向量數據庫的全生命周期都能應用到AI能力。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

在接入層,騰訊云向量數據庫支持自然語言文本的輸入,同時采用“標量+向量”的查詢方式,支持全內存索引,最高支持每秒百萬的查詢量(QPS)。

計算層在數據庫內部提供分割、embedding、精排、聚合等AI計算的算子,簡化客戶使用數據的成本。AI原生開發范式可實現全量數據AI計算,一站式解決企業在搭建私域知識庫時的文本切分、embedding等難題。

在存儲層,騰訊云向量數據庫支持數據智能存儲分布,助力企業存儲成本降低50%。騰訊云內部按照AI方式進行預訓練,產生一些數據和算法,能夠更好幫助客戶動態構建索引。

騰訊云向量數據庫有助于加速企業在大模型時代的AI化進程。

統計顯示,將騰訊云向量數據庫用于大模型預訓練數據的分類、去重和清洗相比傳統方式,可以實現10倍效率的提升。如果將向量數據庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數量級。企業原先接入一個大模型需要花1個月左右時間,使用騰訊云向量數據庫后,3天時間即可完成,極大降低了企業的接入成本。

二、多年存儲引擎和AI算法積淀,助力數據接入效率提升10倍

上述成績源自騰訊云多年積累的存儲引擎和AI算法。此前騰訊云向量數據庫的向量化能力曾多次獲得權威機構認可,2021年曾登頂MS MARCO榜單第一、相關成果已發表于NLP頂會ACL。

騰訊云向量數據庫基于騰訊集團每日處理千億次檢索的分布式向量數據庫引擎Olama。該引擎已經廣泛應用于大語言模型、推薦搜索廣告系統、音視頻和圖片審核以及去重等領域。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

Olama從2019年開始在PCG業務團隊技術孵化,如今已面向騰訊全部業務,覆蓋騰訊6個BG、接入騰訊視頻、QQ瀏覽器、QQ音樂等30多款國民級產品,日均搜索請求超千億,調用成功率達100%,搜索成功率達99.995%。

當前Olama能夠支持的單索引行數達到10億行,單實例QPS達100萬,全網P99響應時延小于20ms。經過騰訊內部海量場景的實踐,使用騰訊云向量數據庫,數據接入AI的效率比傳統方案提升10倍,運行穩定性高達99.99%。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

騰訊云向量數據庫能有效助力產品提升運營效率。使用騰訊云向量數據庫后,QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低37.9%。

騰訊PCG大數據平臺部搜索推薦Senior Tech Lead鄭偉分享了騰訊內部應用騰訊云向量數據庫的三個案例。?

游戲知幾是騰訊自研的游戲智能AI產品機玩家互動運營解決方案,應用在超過200款游戲上。它相當于是一個游戲智能客服應用,能夠對玩家的個性化問題給出答案。

在游戲領域,可以先把所有游戲問題和答案建成標準問答庫,然后通過深度學習技術把問答庫變成一個個向量,存儲到Olama引擎,當用戶輸入問題,也把這個問題變成向量,再將該向量存儲到Olama引擎的數據庫里做檢索,檢索后就可以得到標準的問題和答案,然后把標準問題做一層排序,將分數最高的問題推薦給用戶。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

第二個案例是QQ瀏覽器信息流推薦。這些推薦業務大量使用騰訊云數據庫Olama引擎。用戶在推薦系統里看到的新聞、視頻,以及帶推薦的物品推薦池,都輸入到大模型層,大模型有三大類(DSSM模型、圖數據庫、序列模型),通過一個個序列大模型,將帶推薦的物品推薦詞變成一個個向量,放到Olama引擎里。當用戶來到推薦系統,就可以根據用戶過去看過哪些新聞和視頻,將用戶相關行為變成向量,到數據庫進行檢索,把檢索結果合并,推薦出最終感興趣的新聞和視頻。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

另一個案例是騰訊視頻視頻關系中臺。Olama引擎能用在視頻判重和音頻判重。具體做法是把一個個視頻庫里的視頻變成圖片幀、音頻抽出成音頻幀,或者把音頻通過轉化成文本的方式,通過深度學習技術,變成音頻向量和文本向量。當用戶輸入視頻時,就能將視頻向量、音頻向量、文本向量進行召回聚合,然后輸出結果,告訴用戶視頻的相似關系。

騰訊云發布AI原生向量數據庫,提供10億級向量檢索能力,已支撐騰訊視頻等業務

結語:助攻大模型普及,AI原生向量數據庫將成企業數據處理標配

在大模型熱潮的催化下,向量數據庫進入飛速發展期。據東北證券預測,到2030年,全球向量數據庫市場規模有望達到500億美元,國內向量數據庫市場規模有望超過600億人民幣。

向量數據庫能夠幫助企業更高效、便捷地使用大模型,將數據的價值釋放到最大。隨著大模型的不斷發展和普及,AI原生向量數據庫將成為企業數據處理的標配。而騰訊云向量數據庫希望走在AI原生時代的前排。