
算力是驅(qū)動(dòng)經(jīng)濟(jì)社會(huì)數(shù)字化轉(zhuǎn)型的新引擎,是新時(shí)代的核心生產(chǎn)力。很長(zhǎng)一段時(shí)間,CPU主導(dǎo)了整個(gè)數(shù)據(jù)中心,虛擬化算力成為云計(jì)算的重點(diǎn)。伴隨數(shù)字經(jīng)濟(jì)的推進(jìn),每年各行業(yè)產(chǎn)生的數(shù)據(jù)量以30%的速度向上增長(zhǎng),網(wǎng)絡(luò)帶寬也從10G向20G、100G,甚至400G邁進(jìn),然而影響算力的關(guān)鍵硬件CPU性能的增長(zhǎng)速度每年卻不足3%。當(dāng)CPU再無(wú)力解決數(shù)據(jù)中心基礎(chǔ)設(shè)施遇到的瓶頸時(shí),新一代DPU芯片出現(xiàn)了。DPU是Data Processing Unit(數(shù)據(jù)處理單元)的簡(jiǎn)稱,是最新發(fā)展起來(lái)的專用處理器的一個(gè)大類,被業(yè)界認(rèn)為是繼CPU、GPU之后,數(shù)據(jù)中心場(chǎng)景中的第三顆重要的算力芯片,為高帶寬、低延遲、數(shù)據(jù)密集的計(jì)算場(chǎng)景供給計(jì)算引擎。DPU 可以重新分配算力和優(yōu)化算力資源,帶來(lái)新的數(shù)據(jù)中心創(chuàng)新范式,因而被認(rèn)為是未來(lái)幾年行業(yè)內(nèi)最重要的創(chuàng)新。

DPU 是在目前算力困境、摩爾定律放緩的大背景下產(chǎn)生的。隨著單一服務(wù)器的網(wǎng)絡(luò)端口的速度達(dá)到 200G 或以上,原來(lái)的網(wǎng)絡(luò)、存儲(chǔ)、虛擬化、安全等基礎(chǔ)設(shè)施多方面任務(wù),已經(jīng)無(wú)法有效率地由CPU承載,而將這一類基礎(chǔ)設(shè)施任務(wù)轉(zhuǎn)移到新的計(jì)算單元DPU上。DPU也因此從處理網(wǎng)絡(luò)負(fù)載和卸載CPU任務(wù)的智能網(wǎng)卡,演變成新一代數(shù)據(jù)中心算力和服務(wù)的核心。作為新型數(shù)據(jù)專用處理器,DPU針對(duì)基礎(chǔ)設(shè)施層的計(jì)算負(fù)載,通過(guò)創(chuàng)新專用DPU計(jì)算架構(gòu)等方式,解決CPU處理效率低下以及任務(wù)負(fù)載無(wú)法處理等問(wèn)題,是未來(lái)算力網(wǎng)絡(luò)的核心基礎(chǔ)設(shè)施。國(guó)際芯片巨頭如因英偉達(dá)、英特爾、AMD等廠商都已積極開展DPU芯片研發(fā)工作,預(yù)計(jì)到2025年,全球及國(guó)內(nèi)市場(chǎng)有望分別達(dá)到245.3億美元與565.9億元,可見DPU芯片發(fā)展勢(shì)頭不容忽視。
首顆國(guó)產(chǎn)DPU芯片,填補(bǔ)國(guó)內(nèi)市場(chǎng)空白目前我國(guó)DPU領(lǐng)域還處于起步階段,在國(guó)家大力推進(jìn)數(shù)字經(jīng)濟(jì)的背景下,國(guó)內(nèi)DPU廠商面對(duì)全新賽道,正奮起直追,在機(jī)遇與挑戰(zhàn)之間努力搶占新技術(shù)制高點(diǎn)。位于中關(guān)村壹號(hào)的國(guó)內(nèi)DPU芯片研發(fā)領(lǐng)軍企業(yè)
中科馭數(shù)是國(guó)內(nèi)DPU芯片領(lǐng)域唯一擁有自研核心架構(gòu)能力的企業(yè),近一年多來(lái)獲得了三輪數(shù)億元規(guī)模的融資,被評(píng)為中國(guó)信科“潛在獨(dú)角獸”。中科馭數(shù)創(chuàng)始團(tuán)隊(duì)大多來(lái)自科研院所計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室,在計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域有著近二十年的技術(shù)積累,至今已經(jīng)進(jìn)行了三代DPU芯片的研發(fā)迭代。

2022年12月21日,中科馭數(shù)宣布:
其研發(fā)的第二代DPU芯片——K2成功點(diǎn)亮。這是國(guó)內(nèi)首顆功能較完整的ASIC形態(tài)的DPU芯片,ASIC(Application Specific Integrated Circuit)形態(tài)即專用集成電路形態(tài),是指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造的集成電路形態(tài),與普通集成電路相比,具有體積更小、功耗更低、可靠性更高、性能更好、保密性更強(qiáng)、成本更低等優(yōu)點(diǎn)。ASIC形態(tài)DPU芯片對(duì)于中國(guó)芯片行業(yè)升級(jí)以及中科馭數(shù)的發(fā)展都具有里程碑式的意義。

“K2出現(xiàn)之際,正值國(guó)家提出東數(shù)西算戰(zhàn)略,可謂生逢其時(shí)。它的成功,為中科馭數(shù)DPU芯片產(chǎn)品規(guī)?;慨a(chǎn)打下了堅(jiān)實(shí)的基礎(chǔ)?!敝锌岂S數(shù)創(chuàng)始人、CEO鄢貴海表示。K2采用了28nm成熟工藝制程,可以支持網(wǎng)絡(luò)、存儲(chǔ)、虛擬化等功能卸載,是目前國(guó)內(nèi)首顆功能較完整的ASIC形態(tài)的DPU芯片,具有極其出色的時(shí)延性能,可以達(dá)到1.2微秒超低時(shí)延,支持最高200G網(wǎng)絡(luò)帶寬。

此外,基于DPU芯片核心技術(shù),中科馭數(shù)研發(fā)了超低時(shí)延DPU網(wǎng)卡、RDMA加速卡、數(shù)據(jù)查詢加速DPU卡,以及面向金融計(jì)算領(lǐng)域的極速風(fēng)控、極速行情等產(chǎn)品。其中,中科馭數(shù)面向金融計(jì)算領(lǐng)域的極速行情加速卡,可達(dá)到業(yè)界領(lǐng)先的1微秒級(jí)別的轉(zhuǎn)發(fā)穿透時(shí)延,在加工處理行情時(shí),能夠?qū)崟r(shí)根據(jù)行情生成快照,最大吞吐量可達(dá)每秒近千萬(wàn)條信息處理速度。
應(yīng)用場(chǎng)景廣泛,解決多種行業(yè)難題近年來(lái),隨著新基建、東數(shù)西算、“雙碳”目標(biāo)等政策規(guī)劃的提出,以及云計(jì)算、智能駕駛、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的創(chuàng)新突破,為我國(guó)經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型提供了廣闊場(chǎng)景,不斷催生多元算力需求。K2作為我國(guó)第一顆功能比較完整的DPU數(shù)據(jù)處理芯片,它的成功研制為我國(guó)數(shù)字經(jīng)濟(jì)時(shí)代基礎(chǔ)設(shè)施建設(shè)提供了保障,為整個(gè)社會(huì)的數(shù)字化轉(zhuǎn)型提供強(qiáng)勁且綠色的動(dòng)力。

在實(shí)際應(yīng)用中,K2廣泛布局在金融計(jì)算、高性能計(jì)算、數(shù)據(jù)中心、云原生、5G邊緣計(jì)算、自動(dòng)駕駛等領(lǐng)域,它的直接效果是給CPU“減負(fù)”,帶來(lái)算力和運(yùn)營(yíng)效率的雙倍提升,可用在一些超低時(shí)延和超大吞吐的應(yīng)用上,在建設(shè)數(shù)字化、智能化產(chǎn)業(yè)中發(fā)揮巨大的價(jià)值。在未來(lái)的實(shí)際應(yīng)用中,K2將推動(dòng)云計(jì)算網(wǎng)絡(luò)、安全、存儲(chǔ)等方向上的技術(shù)革新,助力大數(shù)據(jù)計(jì)算基礎(chǔ)架構(gòu)創(chuàng)新,賦能數(shù)據(jù)中心、運(yùn)營(yíng)商網(wǎng)絡(luò)高性能計(jì)算網(wǎng)絡(luò),助力大數(shù)據(jù)和人工智能多領(lǐng)域基礎(chǔ)設(shè)施產(chǎn)業(yè)升級(jí)。
國(guó)內(nèi)芯片技術(shù)的新時(shí)代標(biāo)桿與技術(shù)集成開拓者目前,業(yè)界DPU主要運(yùn)用FPGA形態(tài)方式,簡(jiǎn)單來(lái)說(shuō)FPGA就是一塊可由工程師反復(fù)編程的邏輯器件,本體是一種數(shù)字集成電路,一個(gè)可以通過(guò)編程來(lái)改變內(nèi)部結(jié)構(gòu)的芯片,具備布線資源豐富、可重復(fù)編程、集成度高、投資較低的特點(diǎn)。FPGA也存在不足,它的所有功能均需依靠硬件實(shí)現(xiàn),只能實(shí)現(xiàn)定點(diǎn)運(yùn)算,無(wú)法實(shí)現(xiàn)分支條件跳轉(zhuǎn)等操作,雖然速度上可以和專用芯片相比,但設(shè)計(jì)的靈活性與通用處理器相比有很大的差距。隨著我國(guó)計(jì)算機(jī)領(lǐng)域的飛速發(fā)展,F(xiàn)PGA形態(tài)的芯片已不能滿足當(dāng)前產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展需求。

而中科馭數(shù)ASIC形態(tài)K2芯片則恰到好處地彌補(bǔ)了FPGA的不足。K2芯片具有成本低、性能優(yōu)、功耗小等優(yōu)勢(shì),包含帶寬支撐200G、60兆TPS轉(zhuǎn)發(fā)速度,主打延遲高性能網(wǎng)絡(luò),不僅在網(wǎng)絡(luò)加速方面的功能顯著高于智能網(wǎng)卡和基礎(chǔ)網(wǎng)卡所能提供的延遲指標(biāo),還能對(duì)數(shù)據(jù)中心起到支撐作用,支撐各種軟件定義的技術(shù)。同時(shí),中科馭數(shù)的自主研發(fā)優(yōu)勢(shì),能更好地避免商業(yè)經(jīng)濟(jì)捆綁與威脅,且能更好地適配用戶系統(tǒng)與產(chǎn)業(yè)特性,有利于當(dāng)產(chǎn)業(yè)性能與貿(mào)易經(jīng)濟(jì)發(fā)生細(xì)微變化時(shí),能及時(shí)有效作出調(diào)整,具備強(qiáng)大的市場(chǎng)競(jìng)爭(zhēng)力。
結(jié)語(yǔ)2019年,中科馭數(shù)研發(fā)了第一代DPU芯片K1,2022年,研發(fā)了第二代DPU芯片K2。從K1到K2,中科馭數(shù)拼搏進(jìn)取,銳意創(chuàng)新,逐步填補(bǔ)了國(guó)產(chǎn)DPU市場(chǎng)的空白?!拔磥?lái),中科馭數(shù)將繼續(xù)堅(jiān)持自主可控、核心功能自研的策略,在軟件層面堅(jiān)持開放,與上下游廠商充分融合,推進(jìn)國(guó)內(nèi)DPU產(chǎn)業(yè)發(fā)展?!敝锌岂S數(shù)創(chuàng)始人兼CEO鄢貴海表示。
小貼士[1] CPU是central processing unit的簡(jiǎn)稱,即中央處理器,作為計(jì)算機(jī)系統(tǒng)的運(yùn)算和控制核心,是信息處理、程序運(yùn)行的最終執(zhí)行單元。[2] DPU是Data Processing Unit的簡(jiǎn)稱,它是最新發(fā)展起來(lái)的專用處理器的一個(gè)大類,是繼CPU、GPU之后,數(shù)據(jù)中心場(chǎng)景中的第三顆重要的算力芯片,為高帶寬、低延遲、數(shù)據(jù)密集的計(jì)算場(chǎng)景提供計(jì)算引擎。[3] ASIC是Application Specific Integrated Circuit的簡(jiǎn)稱,即專用集成電路,是指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造的集成電路。[4] GPU是graphics processing unit的簡(jiǎn)稱,即圖形處理器,又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。[5] RDMA是Remote Direct Memory Access的縮寫,意思是遠(yuǎn)程直接數(shù)據(jù)存取,就是為了解決網(wǎng)絡(luò)傳輸中服務(wù)器端數(shù)據(jù)處理的延遲而產(chǎn)生的。[6] FPGA(Field Programmable Gate Array)是在PAL (可編程陣列邏輯)、GAL(通用陣列邏輯)等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。[7] TPS是Transaction Per Second的簡(jiǎn)稱,一個(gè)表達(dá)系統(tǒng)處理能力的性能指標(biāo),每秒處理的消息數(shù)。