英偉達(dá)曝 AI 專用「核彈」：GPT速度提高 30 倍，三大云廠商搶著買

作者：鄭玄來(lái)源：極客公園 201603/22

3 月 21 日晚上 11 點(diǎn)，英偉達(dá) CEO 黃仁勛的演講，為 GTC 2023 拉開(kāi)序幕。ChatGPT 和 GPT-4 掀起這股生成式 AI 熱潮后，為 AI 提供心臟的英偉達(dá)成了背后的大贏家，也讓今年的 GTC 注定成為有史以來(lái)最受

標(biāo)簽： AI 英偉達(dá) GPT

3 月 21 日晚上 11 點(diǎn)，英偉達(dá) CEO 黃仁勛的演講，為 GTC 2023 拉開(kāi)序幕。

ChatGPT 和 GPT-4 掀起這股生成式 AI 熱潮后，為 AI 提供心臟的英偉達(dá)成了背后的大贏家，也讓今年的 GTC 注定成為有史以來(lái)最受關(guān)注的一屆。

黃仁勛沒(méi)有讓關(guān)注者失望。

「AI 的 iPhone 時(shí)刻已經(jīng)到來(lái)。」70 分鐘的演講里，老黃重復(fù)了四五遍。

每次講這句話前，他都會(huì)分享一項(xiàng)關(guān)于生成式 AI 的新進(jìn)展——對(duì)創(chuàng)作、醫(yī)療、工業(yè)等領(lǐng)域的革命，讓普通人用瀏覽器就能訓(xùn)練大模型的云服務(wù)，以及讓大模型處理成本下降 10 倍的超級(jí)芯片……

「AI 的發(fā)展會(huì)超過(guò)任何人的想象。」這句話是對(duì)這場(chǎng)演講*的注腳。

01、讓大語(yǔ)言模型的處理成本下降一個(gè)數(shù)量級(jí)

2012 年，Alex Kerchevsky、Ilya Suskever 和他們的導(dǎo)師 Geoff Hinton 在兩塊 GeForce GTX 580 上，使用 1400 萬(wàn)張圖像訓(xùn)練了 AlexNet——這被認(rèn)為是這一輪 AI 革命的開(kāi)端，因?yàn)樗状巫C明了 GPU 可以用于訓(xùn)練人工智能。

4 年后，黃仁勛親手向 OpenAI 交付了*臺(tái) NVIDIA DGX 超級(jí)計(jì)算機(jī)。此后數(shù)年，OpenAI 在大型語(yǔ)言模型上的突破讓 AIGC 開(kāi)始進(jìn)入人們的視野，并在去年年底推出 ChatGPT 后徹底破圈。幾個(gè)月內(nèi)這個(gè)對(duì)話式 AI 產(chǎn)品吸引了超過(guò) 1 億用戶，成為歷史上增長(zhǎng)最快的 App。

NVIDIA DGX 最初被用作 AI 的研究設(shè)備，現(xiàn)在已經(jīng)被企業(yè)廣泛用于優(yōu)化數(shù)據(jù)和處理 AI。根據(jù)黃仁勛，財(cái)富 100 強(qiáng)公司中有一半安裝了 DGX。

在這之中，部署像 ChatGPT 這樣的 LLM 正在成為 DGX 越來(lái)越重要的一項(xiàng)工作。對(duì)此，黃仁勛宣布了一種新的 GPU——帶有雙圖形處理器 NVlink 的 H100 NVL。

基于英偉達(dá)的 Hopper 架構(gòu)，H100 采用 Transformer 引擎，被設(shè)計(jì)用于專門處理類似 GPT 這樣的模型。與用于 GPT-3 處理的 HGX A100 相比，一個(gè)搭載四對(duì) H100 和 NVlink 的標(biāo)準(zhǔn)服務(wù)器的處理速度快 10 倍。根據(jù)官網(wǎng)數(shù)據(jù)，H100 的綜合技術(shù)創(chuàng)新?？梢詫⒋笮驼Z(yǔ)言模型的速度提高 30 倍。

「H100 可以將大型語(yǔ)言模型處理成本降低一個(gè)數(shù)量級(jí)，」黃仁勛說(shuō)到。

此外，在過(guò)去的十年里，云計(jì)算每年增長(zhǎng) 20%，成為一個(gè) 1 萬(wàn)億美元的行業(yè)。為了 AI 和云計(jì)算，英偉達(dá)設(shè)計(jì)了 Grace CPU，在新的架構(gòu)下，GPU 負(fù)責(zé)處理 AI 的工作負(fù)載，Grace CPU 負(fù)責(zé)采樣，二者之間通過(guò)一個(gè) 900 GB/s 的高速傳輸設(shè)備連接在一起。

「Grace-Hopper 是處理大規(guī)模數(shù)據(jù)集的*選擇?！裹S仁勛稱，「我們的客戶希望建立訓(xùn)練數(shù)據(jù)大幾個(gè)數(shù)量級(jí)的 AI 大模型，Grace-Hopper 是理想的引擎?！?/p>

某種意義上來(lái)說(shuō)，計(jì)算成本已經(jīng)成為今天阻礙生成式 AI 發(fā)展的核心問(wèn)題，OpenAI 為此燒掉了數(shù)十億乃至上百億美元，微軟也出于成本考慮始終沒(méi)有向更大范圍的公眾開(kāi)放新 Bing，甚至限制用戶每天的對(duì)話次數(shù)。

英偉達(dá)此時(shí)推出更高效的算力方案，無(wú)疑是給行業(yè)解決了一個(gè)大難題。

02、DGX Cloud：讓任何企業(yè)

都能構(gòu)建 AI 能力

今年 GTC 上另一個(gè)涉及生成式 AI 的重點(diǎn)，就是 DGX Cloud。

實(shí)際上，這并不是英偉達(dá)*次公布 DGX Cloud。此前英偉達(dá)四季報(bào)發(fā)布時(shí)，黃仁勛就向外界透露英偉達(dá)將與云服務(wù)廠商展開(kāi)合作，讓客戶可以使用網(wǎng)頁(yè)瀏覽器，就能通過(guò) NVIDIA DGX Cloud 來(lái)使用 DGX 計(jì)算機(jī)，從而訓(xùn)練和部署大型語(yǔ)言模型或完成其他 AI 工作負(fù)載。

英偉達(dá)已經(jīng)與甲骨文展開(kāi)合作，預(yù)計(jì)下個(gè)季度微軟 Azure 也會(huì)開(kāi)始托管 DGX 云，而谷歌云也將在不久之后加入這一行列，以托管的方式向那些有意愿構(gòu)建新產(chǎn)品和發(fā)展 AI 戰(zhàn)略的企業(yè)提供 DGX 云服務(wù)。

黃仁勛稱，這種合作關(guān)系將英偉達(dá)的生態(tài)系統(tǒng)帶到了云服務(wù)商手中，同時(shí)擴(kuò)大了英偉達(dá)的市場(chǎng)規(guī)模和覆蓋面。企業(yè)將能夠每月租用 DGX 云集群，確保他們能夠快速輕松地?cái)U(kuò)展大型多節(jié)點(diǎn) AI 訓(xùn)練。

03、ChatGPT 只是開(kāi)始

「加速計(jì)算是曲速引擎，AI 就是它的能源?！裹S仁勛說(shuō)道，「生成式 AI 日新月異的能力，給我們重新構(gòu)想其產(chǎn)品和商業(yè)模式帶來(lái)了緊迫感?！?/p>

ChatGPT 和 GPT-4 為代表的大語(yǔ)言模型在過(guò)去幾個(gè)月火遍全球，但對(duì)英偉達(dá)來(lái)說(shuō)，ChatGPT 和大模型并不是 AI 的全部。會(huì)上，黃仁勛還分享了更多英偉達(dá)在 AI 領(lǐng)域的探索和他本人的觀察。

首先是最火的生成式 AI。

只需要一張手繪的草圖，就能生成 3D 建模的戶型。

撰寫代碼也不在話下。

還有創(chuàng)作音樂(lè)。

為了加速那些尋求利用生成 AI 的人的工作，英偉達(dá)宣布成立 NVIDIA AI Foundations，這是一個(gè)云服務(wù)和代工廠，面向需要構(gòu)建、改進(jìn)和定制 LLM 和生成式 AI 的用戶，這些客戶使用其專有數(shù)據(jù)訓(xùn)練特定領(lǐng)域的 AI。

AI Foundations 的服務(wù)包括 NVIDIA NeMo，用于構(gòu)建文本-文本的生成模型；畢加索，一種視覺(jué)語(yǔ)言模型制作服務(wù)，面向希望構(gòu)建基于經(jīng)授權(quán)內(nèi)容訓(xùn)練模型的用戶；以及 BioNeMo，幫助生物醫(yī)藥研究人員。

作為生產(chǎn)力工具，AI 也在發(fā)揮巨大的價(jià)值，黃仁勛在演講中介紹了幾個(gè)非常有意思的案例。

*個(gè)是與美國(guó)電信巨頭 AT&T。AT&T 需要定期派遣 3 萬(wàn)名技術(shù)人員，為 700 個(gè)區(qū)域的 1300 萬(wàn)名客戶提供服務(wù)。這個(gè)龐大的數(shù)據(jù)，調(diào)度是一個(gè)痛點(diǎn)，如果在 CPU 上運(yùn)行，調(diào)度優(yōu)化需要一整夜的時(shí)間才能完成。

借助英偉達(dá)的 CuOpt，AT&T 可以將調(diào)度方案的優(yōu)化時(shí)間加快 100 倍，并可實(shí)時(shí)更新其調(diào)度方案。

某種意義上，在英偉達(dá)的幫助下，AT&T 做到了美團(tuán)、滴滴這些需要實(shí)時(shí)匹配的互聯(lián)網(wǎng)公司用好多年積累才做到的事情。

另一個(gè)案例是與芯片公司的合作。大多數(shù)人都知道了光刻機(jī)這個(gè)半導(dǎo)體產(chǎn)業(yè)的關(guān)鍵設(shè)備。但鮮為人知的是，隨著制程技術(shù)的發(fā)展，芯片設(shè)計(jì)對(duì)算力的需求也是半導(dǎo)體行業(yè)的一大痛點(diǎn)。

今天計(jì)算光刻是芯片設(shè)計(jì)和制造領(lǐng)域*的計(jì)算工作負(fù)載，每年需要消耗數(shù)百億 CPU 小時(shí)，并且隨著算法越來(lái)越復(fù)雜，計(jì)算光刻的成本也在提高。

對(duì)此，英偉達(dá)宣布推出 cuLitho——一個(gè)計(jì)算光刻庫(kù)。并與 ASML、臺(tái)積電等巨頭展開(kāi)合作，從而大幅降低芯片設(shè)計(jì)過(guò)程中的算力消耗，節(jié)能減排。

事實(shí)上，減少能源消耗，提高計(jì)算效率，是黃仁勛眼中 AI 技術(shù)將為人類社會(huì)帶來(lái)的另一大價(jià)值。而在摩爾定律失效的當(dāng)下，加速計(jì)算和 AI 的到來(lái)恰逢其時(shí)。

「各行業(yè)正都在面對(duì)可持續(xù)發(fā)展、生成式 AI 和數(shù)字化的挑戰(zhàn)。工業(yè)公司正在競(jìng)相數(shù)字化，并重塑為軟件驅(qū)動(dòng)的科技公司——成為顛覆者，而不是被顛覆者，」加速計(jì)算讓這些公司可以應(yīng)對(duì)這些挑戰(zhàn)，黃仁勛說(shuō)道?！讣铀儆?jì)算是減少電力消耗、實(shí)現(xiàn)可持續(xù)性發(fā)展和碳中和的*方式?！?/p>

最后，類似于一個(gè)彩蛋，從老黃此次演講的表現(xiàn)不難猜測(cè)，視頻中出現(xiàn)的老黃，應(yīng)該全程是一個(gè)虛擬形象。如無(wú)意外，很有可能也是「生成式 AI」的產(chǎn)物——在表現(xiàn) AI 進(jìn)步的同時(shí)，也算是黃仁勛為自己家「核彈算力」再次「現(xiàn)身說(shuō)法」。

免責(zé)聲明：本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開(kāi)信息，并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性，信息僅供參考，不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有，如有侵權(quán)或其它問(wèn)題請(qǐng)及時(shí)告之，本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者，視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596，謝謝。

肥臀巨乳熟女网站|免费亚洲丁香|性爱超碰在线播放|丁香五月欧美成人|精产国品免费jiure99|熟女伦网导航|草草视频在线直播免费观看|外网毛片9999|约干AV一区二区|亚洲激情黄色视屏

首頁(yè)

資訊

財(cái)中號(hào)

品牌

專題

投資學(xué)院

發(fā)布文章

APP下載

熱點(diǎn)

國(guó)資

產(chǎn)業(yè)

券商

基金

金融

上市公司

財(cái)富

專題

英偉達(dá)曝 AI 專用「核彈」：GPT速度提高 30 倍，三大云廠商搶著買

2023年中國(guó)經(jīng)濟(jì)面臨巨大挑戰(zhàn)，只有知道如何破局，才能縱橫股市

首頁(yè)

資訊

財(cái)中號(hào)

品牌

專題

投資學(xué)院

發(fā)布文章

APP下載

英偉達(dá)曝 AI 專用「核彈」：GPT速度提高 30 倍，三大云廠商搶著買

您可能感興趣的文章

英偉達(dá)曝 AI 專用「核彈」：GPT速度提高 30 倍，三大云廠商搶著買