要說當(dāng)下最火熱的科技大佬,非英偉達(dá)創(chuàng)始人黃仁勛莫屬。
手握AI算力命門,“黃教主”攜旗下A100、H100號令天下,這兩款芯片是目前“*可以實際處理ChatGPT的GPU”。
就連一直在呼吁暫緩AI研發(fā)的馬斯克,也很誠實地購買了1萬枚英偉達(dá)的GPU,以防備愈演愈烈的AI商業(yè)軍備競賽。
ChatGPT問世后,中國掀起了一場轟轟烈烈的AIGC“大躍進(jìn)”,互聯(lián)網(wǎng)、文娛、游戲、科技企業(yè)乃至央企、科研院所都蜂擁而上。
但人工智能不會憑空而來而是需要設(shè)備,這就對上游的AI芯片產(chǎn)生了井噴式的需求。但早在去年8月,美國政府就已經(jīng)限制了A100、H100及其同等性能的芯片對中國的出口。英偉達(dá)也在調(diào)整相應(yīng)參數(shù),既能符合貿(mào)易禁令,又能滿足中國企業(yè)的需求。
當(dāng)下的中國科技企業(yè)們正試圖邁向AI時代,雖有凌云壯志,但處境卻非常尷尬。暫時拋開產(chǎn)品力不談,在一哄而上、無限內(nèi)卷的“大干快上”之下,行業(yè)正迅速變成紅海。
中國AI創(chuàng)業(yè)者們對上游芯片供應(yīng)過度依賴,而英偉達(dá)幾乎獨占算力資源,直接讓其以“壟斷”優(yōu)勢攫取巨額利潤。萬億美金市值的神話,直接表明了資本市場對這場上下游之間不對等博弈的態(tài)度。
一個還沒開始大發(fā)展的高科技產(chǎn)業(yè),瞬間就注定了被海外企業(yè)掌控命脈的羸弱產(chǎn)業(yè)的命運,甚至和傳統(tǒng)得不能再傳統(tǒng)的鐵礦石區(qū)別不大,令人唏噓無奈。
01 AI時代的“微軟+英特爾”
AI商戰(zhàn)背后不僅是算法的比拼,更是算力的對壘。
此前,有傳言稱黃仁勛將于6月6日到訪上海,會見小米、騰訊、字節(jié)跳動、理想汽車、比亞迪等中國企業(yè)高管。
而在結(jié)束臺北之行后,黃仁勛坐上了返回美國的飛機,并沒有如期來到大陸。至今也沒有再次來華的消息。
外界盛傳黃仁勛來大陸,符合中國需要英偉達(dá)的呼聲;但他折返回美國,也在情理之中,畢竟在局勢如此敏感的時刻,挑動美國政府緊繃的神經(jīng)并不明智。
向前追溯,英偉達(dá)的AI種子播種于2016年。彼時OpenAI剛剛創(chuàng)立,黃仁勛親自前去交流,并捐贈了一臺搭載有8顆P100芯片的DGX-1,那是英偉達(dá)當(dāng)時最強力的浮點運算GPU。6年后,ChatGPT橫空出世,AI浪潮引爆全球,作為其背后的鼎力支持者,英偉達(dá)順勢坐上了火山口。
相比高性能服務(wù)器和通用服務(wù)器,AI大模型所需要的服務(wù)器除CPU外,還要配備4~8顆GPU,部分高配版甚至搭配16顆GPU。
AI商戰(zhàn)背后不僅是算法的比拼,更是算力的對壘。大模型本身就是無數(shù)個AI服務(wù)器的堆疊。并且在推出成熟的產(chǎn)品前,廠商們還需要大量芯片進(jìn)行事前的模擬訓(xùn)練。
去年7月,美國BIS頒發(fā)《出口管制條例》,限制向中國出口先進(jìn)芯片產(chǎn)品,英偉達(dá)A100、H100赫然在列。
兩款芯片被禁止后,英偉達(dá)調(diào)整技術(shù)參數(shù),以符合貿(mào)易規(guī)定,黃仁勛就曾表示:“在中國,我們有特別定制的芯片,提供給阿里、百度等中國云廠商,中國初創(chuàng)公司一定會有機會來開發(fā)自己的大語言模型?!?/p>
他口中的替代品即A800和H800。據(jù)稱,國內(nèi)幾家頭部互聯(lián)網(wǎng)企業(yè)都向英偉達(dá)下了1.5萬~1.6萬枚的訂單,金額大概在十億美金左右。
這顯然無法滿足蜂擁而至的創(chuàng)業(yè)者。況且,就算是*替代品A800,傳輸速度和運算性能只有A100的七成。如今即便是“閹割版”,A800和H800都已經(jīng)十分緊俏。
據(jù)悉,目前持有量超過1萬枚GPU的中國企業(yè)不超過5家。其中,擁有1萬枚英偉達(dá)A100的企業(yè)至多可能只有阿里云1家。?
加起來看,國內(nèi)可用于訓(xùn)練AI大模型的A100大約只有4萬~5萬枚,相當(dāng)吃緊。百度在文心一言的沖刺階段,“幾乎將整個集團所有的A100都頂了上去?!?/p>
供應(yīng)和需求嚴(yán)重倒掛,導(dǎo)致價格瞬間狂飆。
H100在網(wǎng)上的售價已經(jīng)被炒到4萬多美金;一枚A100也上升到15萬元,有黃牛甚至喊出155萬元的驚天報價。
據(jù)TrendForce 研究顯示,運行ChatGPT至少需要1萬枚A100芯片,而如果以A100的處理能力來預(yù)算,GPT-3.5大模型需要2萬塊GPU來處理數(shù)據(jù),大模型商業(yè)化的GPT則需要超過3萬顆。
可以預(yù)想,算力作為一個產(chǎn)業(yè)蘊含的經(jīng)濟價值多么龐大,英偉達(dá)的潛在利潤空間有多么驚人。
作為實打?qū)嵉摹坝餐ㄘ洝?,AI時代的“英偉達(dá)+臺積電”就等于PC時代的“英特爾+微軟”,也類似于移動時代的“高通+蘋果”。
他們站在科技產(chǎn)業(yè)的金字塔尖,以極深的技術(shù)護城河,豎起壟斷高墻,攫取巨額利潤。
02 極特殊的壟斷
“只有碼農(nóng)沒有GPU?!?/p>
AIGC是一個“軟硬兼?zhèn)洹钡男袠I(yè),既需要算法也需要算力。但囿于高端芯片的缺位,也就出現(xiàn)了“國內(nèi)只有碼農(nóng)沒有GPU”的實際情況。
芯片禁令生效前,A100等芯片主要供給云廠商客戶。因此,阿里、騰訊、字節(jié)跳動、百度等云企業(yè)基于芯片儲備,理論擁有了征戰(zhàn)AI的“入場券”。
由于算力所限,小廠商只能先做小模型;而王慧文、王小川等新入局者只能“先軟后硬”,先集中資源優(yōu)化算法,再考慮芯片等硬件基座。
BAT、字節(jié)等互聯(lián)網(wǎng)巨頭,華為、三六零、科大訊飛、商湯、昆侖萬維等企業(yè),清華、復(fù)旦、中科院等科研院所,再加上一眾熱血的創(chuàng)業(yè)者,紛紛加入戰(zhàn)局。無論何種路徑,對算力硬件的需求只是被迫延后,但最終不會缺席。
極為火爆的創(chuàng)業(yè)潮,是否能讓下游需求井噴尚不得而知,但對上游高端芯片的需求暴增已是事實,并且上游供給的彈性極低。
前段時間,OpenAI首席執(zhí)行官 Sam Altman就表示,公司必須要籌集到1000億美元,以支付 AI 模型高昂訓(xùn)的練費用。微軟也曾斥資數(shù)億美元從英偉達(dá)購入了數(shù)萬枚A100芯片。
再加上中國企業(yè)的需求,為應(yīng)對暴增的訂單,英偉達(dá)已向臺積電下發(fā)“超級急件”,共追加了1萬片的制造產(chǎn)能。
但要知道,一枚芯片從設(shè)計到制造再到封裝測試,最終出廠交付,要經(jīng)歷IC設(shè)計-代工-封裝測試等位于全世界不同區(qū)域的不同廠商的復(fù)雜工作。高端GPU的耗時更長。
目前,英偉達(dá)GPU交貨周期被迫拉長,交付周期從此前的大約一個月,到現(xiàn)在基本都需要三個月或更長,甚至很多新訂單要等到年底或更久才能拿到貨。馬斯克也不禁吐槽:“比毒品還難買”。
為此,英偉達(dá)還推出了一項“租賃服務(wù)”,企業(yè)可以不用購買芯片,而是以每月3.7萬美元的價格租用搭載了A100和H100的超級計算機DGX Cloud。
英偉達(dá)之所以能在AI芯片領(lǐng)域獨霸天下,一方面是基于在圖形、視覺等專業(yè)領(lǐng)域的長期積淀,黃仁勛敏銳地察覺到AI的廣闊前景,并為此孤注一擲。
2012年,英偉達(dá)的一些人工智能的研究人員發(fā)現(xiàn)用GPU訓(xùn)練AI模型,效率遠(yuǎn)超CPU。自此,英偉達(dá)押注GPU,4年后,黃仁勛向OpenAI捐出了*臺DGX-1,OpenAI原來需要一年的訓(xùn)練,被壓縮到短短一個月。
AI的火種自此開始燃燒。至今,英偉達(dá)一家在超算中心領(lǐng)域獨霸9成以上市場份額。
另一方面,則是深度綁定臺積電,黃仁勛和臺積電創(chuàng)始人張忠謀都是華人,兩人不僅是密友,也是商業(yè)上的合作伙伴。6月初的臺灣之行中,黃仁勛就和張忠謀夫婦聚餐。據(jù)傳,英偉達(dá)會在下一代AI GPU中導(dǎo)入臺積電的3nm工藝。
要知道,高端芯片是一項極為復(fù)雜的高精密產(chǎn)業(yè),設(shè)計芯片是一回事,制造又是另一回事。
目前,全球能勉強抗衡臺積電的只有三星和英特爾,而臺積電的優(yōu)勢還在進(jìn)一步擴大。國內(nèi)*進(jìn)的廠商中芯國際,與臺積電相比還存在兩代左右的工藝差距。并且囿于光刻機等高端設(shè)備的禁運,國內(nèi)產(chǎn)品要想在短期內(nèi)實現(xiàn)高端替代,幾乎沒有可能。
03 難尋的替代者
國內(nèi)也掀起了一波“造芯運動”。
從提出顯卡概念,到主攻GPU,到AI時代的“軍火商”,英偉達(dá)的*地位遭到了不少覬覦。
早在2021年,高通、微軟、英特爾、亞馬遜四大巨頭就組成“反英偉達(dá)聯(lián)盟”,試圖阻擊英偉達(dá)收購ARM,防止兩家形成新的壟斷。
如今,新的戰(zhàn)火再次燃起,為擺脫對英偉達(dá)的過度依賴,谷歌拿出了第四代TPU,亞馬遜、微軟、特斯拉、meta都在研發(fā)自己的定制芯片。
國內(nèi)由于英偉達(dá)高端芯片的供應(yīng)限制,也掀起了一波“造芯運動”。其中,海光信息的DCU深算一號,是國內(nèi)*能支持FP64雙精度浮點運算的高性能芯片。紙面數(shù)據(jù)上,海光深算一號基本能發(fā)揮出英偉達(dá)A100 70%的性能。其股價因此爆發(fā)式上漲。
此外,還有寒武紀(jì)的思元290系列,景嘉微的 JM9 ,以及燧原科技、壁仞科技等一眾初創(chuàng)企業(yè)在苦苦追趕。
但對比來看,中國企業(yè)和英偉達(dá)之間還差著好幾個AMD。雖然海光深算一號數(shù)據(jù)上有A100七成的功力,但海光的DCU(加速計算芯片) 的片間互聯(lián)性能還有較大的提升空間。
除了性能*,英偉達(dá)在架構(gòu)方面也有*優(yōu)勢。依靠革命性的CUDA架構(gòu),英偉達(dá)對GPU流處理器進(jìn)行了細(xì)致的分組,將他們轉(zhuǎn)變?yōu)橐粋€個小型單元且能單獨運行。這樣一來,組合起來的GPU就能應(yīng)付自動駕駛、元宇宙、AI等大型計算場景。
對應(yīng)摩爾定律,黃仁勛還提了“黃氏定律”:即每隔半年,顯卡芯片的性能就會提高一倍,比摩爾定律的速度整整快了兩倍。也就是說,英偉達(dá)的芯片性能在加速迭代。
剛剛過去的臺北電腦展 COMPUTEX 2023 上,黃仁勛就拿出了最新的超級計算機DGX GH200,他稱其為“巨型 GPU”,配備了超級芯片 GH200,這款產(chǎn)品聚焦于生成式人工智能模型訓(xùn)練場景。
而且,A100只是2020年的產(chǎn)品,最新的H100芯片于去年9月量產(chǎn)。相比A100芯片,H100性能提升六倍,內(nèi)部包含800億個晶體管,使用臺積電4納米工藝。而A100的晶體管數(shù)量為540億個。
由于下游市場需求暴增,英偉達(dá)對2024第二財季給出了令市場亢奮的指引。營收預(yù)期將達(dá)到110億美元,足足比市場預(yù)期高出了38億美元。這直接推動其股價一度暴漲30%。
目前看,英偉達(dá)處于*的獨一檔,僅有AMD能夠略微與之抗衡。隨著股價飆升,英偉達(dá)成為第七家萬億市值公司,其市值已是AMD 的近5倍,是英特爾的7倍多,這兩個曾經(jīng)的老對手如今被遠(yuǎn)遠(yuǎn)甩在身后。
也難怪幾年前英偉達(dá)就曾放出豪言:“即使英特爾將圖形計算能力提高10倍,也無法與我們匹敵”,至于AMD,“我們已經(jīng)很多年沒關(guān)注過它了,我們之間的實力差距是9:0”。
幾乎難有相匹配的替代品,讓英偉達(dá)一家獨大,在產(chǎn)業(yè)鏈中擁有*的議價權(quán),這意味著巨大的利潤。
04 寫在最后
“為了計算和人類的未來,我捐出世界上*臺DGX-1?!?/p>
2016年,黃仁勛來到OpenAI的辦公樓,并用記號筆寫在DGX-1的機箱上寫下了這句話。
6年后,目前,OpenAI掀起的AI巨浪從大洋彼岸而來,席卷大洋此岸。澎湃洶涌的AIGC創(chuàng)業(yè)大潮讓英偉達(dá)坐收漁利。從這個角度看,被捐贈的那一臺DGX-1太值錢了。
一大批中國廠商的大模型必然會失敗退場,但這并不妨礙英偉達(dá)作為“軍火商”成為這個時代*的贏家。因為失敗的AI創(chuàng)業(yè)者和成功的AI創(chuàng)業(yè)者一樣,都要掏錢付給英偉達(dá)和黃仁勛。