各方鏖戰(zhàn)DPU,一場始于云計(jì)算的軟硬件歷史變革,剛剛開啟。
一場始于云計(jì)算的軟硬件變革,已經(jīng)蔓延到了芯片行業(yè)甚至整個(gè)IT產(chǎn)業(yè)。沒人能否認(rèn),新的大幕正徐徐拉開。
云廠商難抵擋的誘惑
自研DPU(Data Processing Unit),成為云廠商擺在臺(tái)面上的要緊事。
國內(nèi)外兩家頭部云廠商AWS和阿里云,在數(shù)年前不約而同踏入了同一條河流。2017年10月份,阿里云推出了神龍架構(gòu),同年12月,AWS推出Nitro,二者的目的都是為了減少虛擬化損耗,把服務(wù)器的所有底層資源充分利用起來。
阿里巴巴集團(tuán)研究員、阿里云彈性計(jì)算產(chǎn)品線負(fù)責(zé)人張獻(xiàn)濤表示,“過去云計(jì)算的硬件對(duì)于虛擬化技術(shù)的支撐非常少,效率非常低。比如它會(huì)有百分之十幾到二十的性能損耗,百分之十幾的資源損耗。從性價(jià)比上來講,它和物理機(jī)相比直接損失二十到三十個(gè)點(diǎn),這種情況下,其實(shí)只改軟件和只改硬件其實(shí)都沒有辦法去解決這個(gè)問題?!?/p>
能否杜絕這種“浪費(fèi)”,對(duì)于云計(jì)算廠商來說,可能就是下一次淘汰賽的入場券。
云廠商的種種動(dòng)作也在印證著這個(gè)趨勢(shì),鈦媒體App注意到,云廠商或多或少開始儲(chǔ)備DPU資源,例如天翼云的紫金架構(gòu),騰訊云“水杉”“銀杉”智能網(wǎng)卡以及智能網(wǎng)卡芯片“玄靈”,并且投資了DPU廠商云豹智能,華為的IN300/IN500產(chǎn)品,美團(tuán)和百度先后投資了星云智聯(lián)等。
公有云巨頭或者有海量服務(wù)器及潛在應(yīng)用場景的廠商們,紛紛通過自研和投資方式,參與到這場盛宴當(dāng)中。
根據(jù)英偉達(dá)提供的數(shù)據(jù),在NVIDIA BlueField DPU上運(yùn)行vSphere,用的越多,省的越多。整個(gè)服務(wù)器效率方面會(huì)整體提升22%,在3年ROI角度測(cè)算帶來5倍的投資回報(bào)率。
780臺(tái)安裝有NVIDIA BlueField DPU的服務(wù)器,相當(dāng)于1000臺(tái)安裝有標(biāo)準(zhǔn)智能網(wǎng)卡的服務(wù)器。每臺(tái)服務(wù)器的TCO(總體投入)可節(jié)省8200美元,3年內(nèi)通過提升效率可節(jié)省180萬美元。
而在云計(jì)算場景下,公有云廠商擁有數(shù)十萬乃至上百萬臺(tái)服務(wù)器的數(shù)據(jù)中心,這是一筆穩(wěn)賺不賠的買賣。
同時(shí),從云計(jì)算競爭差異化的角度看,客戶界面IaaS層資源趨于同質(zhì)化,但在后臺(tái)資源層面,具備DPU的云廠商,足以對(duì)沒有DPU的廠商產(chǎn)生降維打擊,這是戰(zhàn)略競爭優(yōu)勢(shì)。
虛擬化是云服務(wù)的基礎(chǔ),沒有虛擬化,就沒有被抽象的資源池,云廠商也就不能在其上開展業(yè)務(wù),由虛擬化帶來的額外損耗在云計(jì)算初期不顯,或者云廠商對(duì)此無能為力,隨著現(xiàn)階段云廠商由重規(guī)模擴(kuò)張,到重視健康增長的轉(zhuǎn)變,底層技術(shù)的優(yōu)先級(jí)再度提高。
有意思的是,云廠商在推動(dòng)DPU技術(shù)的早期,甚至還沒有DPU的名稱,大家在共同的大方向上默契探索,行業(yè)還沒有開始收斂。
芯片廠商聞風(fēng)而動(dòng)
2019年,美國一家名為Fungible的初創(chuàng)公司提出了DPU的概念,同年英偉達(dá)以69億美元價(jià)格收購了Mellanox,后者是業(yè)內(nèi)知名的網(wǎng)絡(luò)設(shè)備公司。2020年,英偉達(dá)基于Mellanox技術(shù)推出DPU產(chǎn)品Bluefield系列,點(diǎn)燃了全球DPU市場的熱情。
英偉達(dá)CEO黃仁勛表示,DPU將成為未來計(jì)算的三大支柱之一,未來的數(shù)據(jù)中心標(biāo)配是CPU+DPU+GPU,CPU用于通用計(jì)算、GPU用于加速計(jì)算、DPU則進(jìn)行數(shù)據(jù)處理。
“數(shù)據(jù)中心已經(jīng)成為全新的運(yùn)算單位”,按照這種邏輯,CPU是以服務(wù)器為計(jì)算單位的中心,而DPU有望成為以數(shù)據(jù)中心為計(jì)算單位的中心,對(duì)芯片廠商是全新的市場,不亞于CPU和GPU的規(guī)模。
而DPU不只是芯片,而是包括軟硬件在內(nèi)的一系列產(chǎn)品,以Nitro為例,至少包括Nitro虛擬化管理程序、Nitro I/O加速卡和Nitro安全芯片、Nitro Enclaves(為計(jì)算實(shí)例提供CPU和內(nèi)存隔離環(huán)境)、Nitro TPM(安全性和兼容功能)。
阿里云的新一代虛擬化架構(gòu)還包含“X-Dragon虛擬化芯片”、“X-Dragon Hypervisor系統(tǒng)軟件”、以及“X-Dragon服務(wù)器硬件架構(gòu)”等,上下游廠商都瞄準(zhǔn)了新芯片的機(jī)會(huì)。
作為中央處理器,CPU既要做計(jì)算,又要做管理,這種“既當(dāng)?shù)之?dāng)媽”的情況,被DPU所改變,網(wǎng)絡(luò)服務(wù)(虛擬交換、虛擬路由)、存儲(chǔ)服務(wù)(RDMA、NVMe)、安全(防火墻、加解密)等都可以由DPU解決。
“Intel和AMD等公司以后再?zèng)]有網(wǎng)絡(luò)、存儲(chǔ)、管控、虛擬化跑在CPU上了,這是巨大的浪費(fèi),所有這些都跑在DPU上,所以Google要和Intel合作,AMD收購了Pensando,Nvidia兩年多前也看到這個(gè)趨勢(shì),美國一早就看到了大趨勢(shì),而中國落后了五年?!毙酒袠I(yè)專家Kenyon(化名)如此表示。
基于 DPU 組網(wǎng)的新型云計(jì)算示意
芯片大廠與初創(chuàng)企業(yè)聞風(fēng)而動(dòng),市場的喧囂與火熱一并到來。
中科創(chuàng)星創(chuàng)始合伙人米磊是投資DPU行業(yè)的早期投資者之一,他主導(dǎo)投資了大禹智芯(2020年)和中科馭數(shù)(2018年)兩家DPU廠商的天使輪,當(dāng)時(shí)兩家公司估值在一億元人民幣以下。大禹智芯2022年6月份宣布完成了A輪融資,融資金額未公布,中科馭數(shù)9月份宣布完成數(shù)億元B輪融資。
“說實(shí)話,投這兩個(gè)項(xiàng)目時(shí)還沒有DPU概念,我們看到了整個(gè)數(shù)據(jù)中心大量的數(shù)據(jù),需要一些專業(yè)的芯片去解決,后來這款芯片的應(yīng)用前景足夠大,從而獨(dú)立成為一個(gè)處理單元?!泵桌诒硎?。
“2020年中大禹智芯成立之后,我見了大概50多家投資人,聽說這個(gè)概念的就很少,也就10%,真正在找這個(gè)方向的只有他們一家(中科創(chuàng)星)”,大禹智芯CEO李爽說。
“今年資本市場比較冷淡,去年只要拿幾頁做DPU的PPT,再從云廠商挖一兩個(gè)人,整個(gè)公司估值就過10個(gè)億”,張獻(xiàn)濤說。
DPU從一個(gè)較為冷門的賽道,到創(chuàng)業(yè)廠商批量涌現(xiàn),只用了一兩年光景,讓很多人始料未及。根據(jù)中國信息通信研究院華東分院11月份發(fā)布的《DPU行業(yè)發(fā)展研究報(bào)告(2022年)》,2016年至今,DPU廠商合計(jì)發(fā)生融資近30 筆。
從融資年份上看,截至2022年9月,2021年和2022年共發(fā)生融資22筆,占比超過75%,其中,2021年以14筆融資位居*,融資筆數(shù)占總數(shù)的比重接近50%,2022年也已發(fā)生8筆融資。從融資輪次上看,DPU企業(yè)融資主要集中于A輪和Pre-A輪,隨著DPU行業(yè)的持續(xù)發(fā)展,2022年,融資輪次逐步后移,開始出現(xiàn)B輪融資。
據(jù)鈦媒體App不完全統(tǒng)計(jì),近一兩年DPU公司融資還包括:
2021年8月,星云智聯(lián)完成數(shù)億元A輪融資,由美團(tuán)*投資;2022年2月,引入百度作為戰(zhàn)略投資方。2022年3月,芯啟源完成數(shù)億元超億元戰(zhàn)略投資。2022年4月,云脈芯聯(lián)宣布獲得數(shù)億元人民幣PreA輪投資。2022年6月,益思芯科技宣布完成新一輪數(shù)億元人民幣的融資。
芯片行業(yè)受資本關(guān)注,且單輪融資額度高的特性,在DPU行業(yè)得到進(jìn)一步彰顯。目前DPU賽道估值最高的公司是云豹智能,今年6月云豹智能宣布完成B輪融資,融資后估值約90億元。
大熱之后,DPU行業(yè)迎來了調(diào)整與反思,燒錢融資、做產(chǎn)品和找客戶,是接下來的行業(yè)主線。
DPU產(chǎn)業(yè)圖譜(來源:DPU行業(yè)發(fā)展報(bào)告)
三重難關(guān)
資本關(guān)
受大環(huán)境影響,2022年的資本市場更為冷靜,而DPU仍處于燒錢階段,不具備持續(xù)融資能力的DPU廠商,或許成為*被淘汰的一批。
鈦媒體App接觸的多家DPU廠商都表示,短期內(nèi)還會(huì)有融資計(jì)劃,相比其他領(lǐng)域的投融資項(xiàng)目,DPU廠商受到的影響較小,大概率今年會(huì)有一個(gè)回落,但幅度不大。
“在芯片行業(yè)里,如果不是頭部企業(yè),懂行業(yè)的投資者是不會(huì)投的,因?yàn)槎€的芯片公司大部分很難為投資者帶來回報(bào)?!痹票悄軇?chuàng)始人蕭啟陽對(duì)鈦媒體App表示。
他解釋:“在美國,過去十年間從創(chuàng)業(yè)到上市的芯片公司寥寥可數(shù),因此大部分投資者都只能希望其投資的芯片創(chuàng)業(yè)公司被已上市的芯片公司收購,從而獲得回報(bào)。而在國內(nèi),芯片行業(yè)的企業(yè)并購非常罕見,大部分投資者只能通過其投資的公司上市來獲取收益。而芯片行業(yè)相對(duì)其他行業(yè)來說,投資周期很長,而財(cái)務(wù)投資者首先會(huì)關(guān)心的問題是項(xiàng)目回報(bào)多大,如何退出、時(shí)間多長、風(fēng)險(xiǎn)多高,如果一個(gè)項(xiàng)目的投入需要等10年才能獲得回報(bào),并且還有很大的不確定性,大部分的投資者都不會(huì)考慮的?!?/p>
“做像DPU這樣的大芯片,除了購買IP、流片等研發(fā)費(fèi)用,還需要至少300-400人以上的硬件、軟件和技術(shù)支持等高端技術(shù)專家持續(xù)多年投入,加上新產(chǎn)品的開發(fā)和產(chǎn)品迭代,花費(fèi)至少需要20億以上人民幣。我們面對(duì)的不單是國內(nèi)市場,還有海外市場?!彼a(bǔ)充道。
DPU廠商不能只看資本運(yùn)作,更要看重產(chǎn)業(yè)資源。云豹智能的投資方包括了中芯國際、紅杉資本、深創(chuàng)投、騰訊等,騰訊是云豹的*大外部股東,連續(xù)三輪都投資了云豹智能。資本投資人及產(chǎn)業(yè)投資人希望云豹成為“中國的博通”。
DPU廠商估值的水漲船高,也讓一部分投資者慎重考慮是否入局和追投。另一位投資者認(rèn)為,“現(xiàn)在(DPU公司)看上去顯得有點(diǎn)貴,但是高速增長能夠消化的話,也沒有問題。歷史經(jīng)驗(yàn)證明,融資融得好的企業(yè),未必是最后的贏家,”
他認(rèn)為,對(duì)于現(xiàn)階段的DPU廠商來說,VC的錢比客戶的錢更好拿,但融資和營收是兩碼事,未來幾年,行業(yè)會(huì)明顯更加關(guān)注營收,關(guān)注企業(yè)自身是否有造血能力。
李爽也提到,“從資本市場來講,DPU市場不像去年那么火,但是從另外一個(gè)角度,用戶層面的情況要比去年好,很多客戶已經(jīng)看到了這個(gè)產(chǎn)品并且愿意去嘗試。”
產(chǎn)品關(guān)
“沒有”,若論商業(yè)化的成熟DPU產(chǎn)品,李爽給出了他的答案。
“DPU現(xiàn)在在云計(jì)算領(lǐng)域的迭代速度還是有點(diǎn)快,這么快的迭代速度,對(duì)于硬件來講并不劃算,大家都希望場景和需求達(dá)到一個(gè)相對(duì)成熟的狀態(tài)之后,再將產(chǎn)品完善,我認(rèn)為會(huì)在2024年左右?!?/p>
他進(jìn)一步指出,“DPU行業(yè)不同公司的視角不同,做出來的效用或者結(jié)構(gòu)可能不一樣,但條條大路通羅馬,新產(chǎn)品就是不斷探索的過程,DPU還沒有一個(gè)事實(shí)標(biāo)準(zhǔn)?!?/p>
目前云廠商和芯片廠商都以FPGA為主,好處是靈活可編程,減少試錯(cuò)成本,DPU廠商希望借此把軟件和業(yè)務(wù)先打通,但是FPGA不是DPU的成熟形態(tài),其性能、頻率等都受到限制,ASIC是公認(rèn)的下一代DPU形態(tài)。
天翼云資深研發(fā)專家、自研DPU技術(shù)負(fù)責(zé)人劉祿仁提到,“未來DPU大規(guī)模上量的話,肯定是ASIC化的產(chǎn)品,從功耗、成本還有性能來算,對(duì)云廠商應(yīng)該是*解。當(dāng)然要達(dá)到ASIC化,肯定針對(duì)的目標(biāo)場景業(yè)務(wù)要成熟”。
據(jù)鈦媒體App了解到,國內(nèi)有DPU廠商已經(jīng)開始裁員,也有DPU廠商的技術(shù)方案出現(xiàn)反復(fù),前期硬件設(shè)計(jì)沒有考慮周全的情況下,當(dāng)網(wǎng)絡(luò)帶寬等指標(biāo)進(jìn)一步增長,只能推翻硬件重來,是一筆不小的成本損耗?,F(xiàn)階段相較于同期網(wǎng)卡型產(chǎn)品,DPU的成本估計(jì)在3到5倍之間。
目前,中國DPU創(chuàng)業(yè)公司大多做的并不是真正的DPU大芯片,而是基于FPGA的解決方案,就算有計(jì)劃做芯片的,也只是做某單一功能的加速芯片,不少廠商希望分步探索,直至最終大芯片目標(biāo)的實(shí)現(xiàn)。
一張芯片或卡卸載計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)等負(fù)載,還是多張芯片或卡分別卸載,有本質(zhì)差別。云豹智能此前用了不到一年的時(shí)間推出了一款基于FPGA的DPU解決方案,包含硬件及軟件,投入了幾十位技術(shù)人員去開發(fā)。
而目前云豹智能正在開發(fā)DPU大芯片,投入數(shù)百人力,相對(duì)于FPGA方案,其芯片功耗及成本都可降低一半以上,性能可提升3-4倍,通用性、靈活性、可編程性和易用性也有加強(qiáng),這塊DPU大芯片將于明年量產(chǎn)。
“美國已經(jīng)實(shí)現(xiàn)了,中國的廠家也在學(xué)習(xí),亞馬遜(自研)、微軟(FPGA)、Google(FPGA)都實(shí)現(xiàn)了,Google也知道用FPGA不能持續(xù),才讓Intel幫他們合作一顆芯片?!盞enyon說。英特爾和谷歌合作的IPU(Infrastructure Processing Unit,基礎(chǔ)設(shè)施處理單元),也希望做ASIC化的大芯片。
客戶關(guān)
客戶也是DPU行業(yè)的一個(gè)大問題,按理說,云廠商是DPU的大客戶,然而云廠商都傾向于自研,他們并不想等待通用產(chǎn)品,而是在自己的云場景下做*適配,這也與AWS和阿里云的示范效應(yīng)息息相關(guān)。
一位云計(jì)算行業(yè)高管認(rèn)為,“DPU創(chuàng)業(yè)廠商很難成功,因?yàn)樗麄儗?duì)于客戶業(yè)務(wù)的理解,對(duì)于整個(gè)軟件棧的控制,作為一家芯片公司很難做到。”
“別人能做,我也能做”,云廠商走上軟硬一體自研自用的方向,受傷害*的是芯片廠商們。
許多DPU廠商希望與云廠商溝通合作,一是做技術(shù)和需求上的交流,二是為了潛在的銷售機(jī)會(huì),而云廠商確定自研之后,廠商銷售產(chǎn)品的意愿便少了許多。
張獻(xiàn)濤表示,云計(jì)算提供了一個(gè)天然的場景,從軟件到硬件再到上層服務(wù),都是云計(jì)算公司在做,DPU創(chuàng)新之所以難,是因?yàn)閱为?dú)軟件公司、硬件公司很難結(jié)合在一起,很難對(duì)客戶業(yè)務(wù)有深度的了解,技術(shù)的積累和認(rèn)知也需要有一個(gè)過程。
今年6月份,阿里云推出了云基礎(chǔ)設(shè)施處理器CIPU,它將取代CPU成為新一代云計(jì)算體系架構(gòu)的核心?!癈IPU是云計(jì)算軟硬體系中的一個(gè)核心關(guān)鍵點(diǎn),基于CIPU,我們會(huì)推動(dòng)從數(shù)據(jù)中心底層到硬件體系的變革,更好適配數(shù)據(jù)中心‘風(fēng)火水電’的標(biāo)準(zhǔn)”,張獻(xiàn)濤說。
在最近舉辦的2022 re:Invent上,AWS Nitro推出了v5版本,晶體管數(shù)量增加一倍,內(nèi)存性能提升50%,帶寬提升兩倍,相比于前一代產(chǎn)品,Nitro將顯著改善延遲30%,同時(shí)每瓦性能提高40%,PPS提高60%。
也有觀點(diǎn)認(rèn)為,目前國內(nèi)很多DPU創(chuàng)業(yè)公司已放棄云客戶,是因?yàn)闊o法滿足云廠商業(yè)務(wù)的需求。舉一個(gè)最簡單的例子,如何在芯片架構(gòu)和配合的軟件上支持在云上的熱遷移功能?如果連這方面的經(jīng)驗(yàn)都沒有,做出來的DPU方案是很難成功的。
與此同時(shí),DPU的場景也在向云計(jì)算之外發(fā)展,例如電信、安全和金融等。一些DPU選擇了先在某些行業(yè)立足,譬如中科馭數(shù)選擇了金融場景。信創(chuàng)場景也是國內(nèi)DPU廠商的一個(gè)方向,DPU與數(shù)據(jù)緊密關(guān)聯(lián),硬件級(jí)的安全也有政企客戶買賬。
現(xiàn)階段,不論是先選擇行業(yè),還是先打造產(chǎn)品,都需要不斷地磨合與調(diào)整,行業(yè)格局尚未形成。
再思考,來路與出路
仁者見仁,智者見智。
DPU行業(yè)正處于類似的競合狀態(tài),在這個(gè)時(shí)間點(diǎn),有必要重新思考來路與出路——廠商做DPU應(yīng)該補(bǔ)足哪些短板,又該如何推動(dòng)DPU的進(jìn)一步發(fā)展?
李爽談到,DPU廠商競爭的壓力更多來自己身,大家都在埋頭做自己的產(chǎn)品,當(dāng)然非要說競爭的話,市場上看得到的競爭更多的是融資上的競爭。
劉祿仁表示,DPU廠商的認(rèn)知是*的門檻,云計(jì)算業(yè)務(wù)比較復(fù)雜,大家對(duì)需求的理解不同,雖然每一家技術(shù)演變都殊途同歸,但畢竟每家都會(huì)有各種特點(diǎn)或差異,這是最主要的門檻。同時(shí)DPU不止用在數(shù)據(jù)中心,端網(wǎng)協(xié)同、5G場景、邊緣場景也有需求,需求更加發(fā)散化。
同時(shí)他也提到,做芯片本身的門檻就比較高,DPU涉及到計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)三個(gè)大方面,不僅有傳統(tǒng)芯片設(shè)計(jì)里的驗(yàn)證驅(qū)動(dòng)算法,還涉及到業(yè)務(wù)軟件協(xié)議棧和用戶程序等,比如AI芯片更多是一個(gè)單模塊的功能點(diǎn),DPU芯片軟硬都要協(xié)同,讓原本門檻很高的芯片開發(fā),又拔高到一個(gè)新的維度。
Kenyon也給出了類似的答案,一家芯片創(chuàng)業(yè)公司是否能成功,其中一個(gè)必要條件為其團(tuán)隊(duì)是否做過類似的芯片。很多創(chuàng)業(yè)者連從研發(fā)芯片到量產(chǎn)以及運(yùn)營一家企業(yè)需要多少人、多少時(shí)間、多少錢等問題都不清楚就開始創(chuàng)業(yè),也不知道能為客戶帶來多大的價(jià)值,這樣很難成功。
而關(guān)于DPU和其將影響的未來,張獻(xiàn)濤從云計(jì)算的角度思考,以設(shè)計(jì)一個(gè)超級(jí)計(jì)算機(jī)的視角來看,底層技術(shù)變成一個(gè)完全軟件定義的技術(shù)棧,軟件定義數(shù)據(jù)中心以前是點(diǎn)狀的改變,但是這些點(diǎn)狀變成一個(gè)線、面的時(shí)候,它會(huì)帶來新的革命。
相比于過去CPU發(fā)展歷史上的缺位,中國云計(jì)算和海外云計(jì)算的行業(yè)差距并不大,在一些領(lǐng)域?qū)崿F(xiàn)并跑,而由云計(jì)算場景推動(dòng)的DPU軟硬件變革中,新的歷史正在寫就。