“每日調(diào)用量超千億次。”
(資料圖片僅供參考)
7月4日,騰訊云正式發(fā)布國內(nèi)首個AI原生(AI Native)的自研向量數(shù)據(jù)庫(Tencent Cloud Vector DB),預(yù)計 8月上線騰訊云官網(wǎng)。
據(jù)介紹,該數(shù)據(jù)庫是騰訊自研、基于內(nèi)部多年運營積累的分布式向量數(shù)據(jù)庫,已經(jīng)過騰訊海量業(yè)務(wù)場景驗證,日均處理向量檢索千億次,支持標量+向量的混合檢索,具有高性能、大容量等特點,支持全內(nèi)存索引。主要面向大模型訓(xùn)練,讓企業(yè)原先花一個月時間才能完成的大模型接入,縮短到三天時間。
天眼查App顯示,騰訊科技(深圳)有限公司于近日申請注冊兩枚“TENCENT CLOUD VECTORDB”商標,國際分類為科學(xué)儀器、網(wǎng)站服務(wù),當前商標狀態(tài)為申請中。
騰訊云數(shù)據(jù)庫副總經(jīng)理羅云指出,向量數(shù)據(jù)庫已經(jīng)在QQ瀏覽器、騰訊視頻、騰訊游戲、QQ音樂、搜狗輸入法等上百個業(yè)務(wù)場景應(yīng)用,每日調(diào)用量超千億次。其中,支撐QQ音樂人均聽歌時長提升3.2%,QQ瀏覽器成本降低37.9%,騰訊視頻有效曝光人均時長提升1.74%。
其還自研了分布式向量數(shù)據(jù)庫核心引擎Olama,原ElasticFaiss。據(jù)了解,Olama最早于2019年4月進行孵化,目前可支持十億級別的單行向量數(shù)據(jù)索引、查詢QPS達到百萬、響應(yīng)延遲在20毫秒。
向量數(shù)據(jù)庫源自騰訊集團每日處理千億次檢索的向量引擎(OLAMA),單索引支持10億級向量規(guī)模,更適用于AI運算、檢索,數(shù)據(jù)接入AI的效率也比傳統(tǒng)方案提升10倍。
針對大模型場景,向量數(shù)據(jù)庫在接入層、計算層、存儲層實現(xiàn)了全面AI化:在接入層,智能化支持自然語言文本的直接檢索;在計算層,通過AI算子替代企業(yè)尋找/調(diào)優(yōu)AI算法,將接入工期從一個月縮短到3天;在存儲層,融合智能壓縮算法,把向量存儲成本降低50%。
此外,騰訊云在6月19日首次公布了其行業(yè)大模型研發(fā)進展,依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),技術(shù)底座來自騰訊全棧能力,提供高性能計算集群HCC、高性能網(wǎng)絡(luò)、向量數(shù)據(jù)庫等基礎(chǔ)設(shè)施。
4月,騰訊云發(fā)布了專為大模型訓(xùn)練設(shè)計的新一代HCC高性能計算集群,采用最新一代的騰訊云星星海自研服務(wù)器,具備業(yè)界最高的3.2Tbps互聯(lián)帶寬,算力性能提升3倍。
一直以來,騰訊在產(chǎn)業(yè)互聯(lián)網(wǎng)中的定位是做產(chǎn)業(yè)的“數(shù)字化助手”,騰訊云作為中國云市場的頭部廠商,目前形成了四級加速框架,為產(chǎn)業(yè)輸出從底層算力支撐到AI開發(fā)平臺、到AI產(chǎn)品解決方案、再到頂層數(shù)智化轉(zhuǎn)型方法的四級全鏈條服務(wù),是實現(xiàn)這一目標的重要動力引擎。
展望未來,“向量數(shù)據(jù)庫+大模型+數(shù)據(jù)”將產(chǎn)生“飛輪效應(yīng)”,共同助力企業(yè)步入AI Native(AI原生)時代。騰訊云也將繼續(xù)打磨技術(shù)能力,提供更堅實的AI基礎(chǔ)設(shè)施。