9月29日,寒武紀-U(688256.SH)旗下官微發(fā)布消息稱,寒武紀已同步實現(xiàn)對深度求索公司最新模型DeepSeek-V3.2-Exp的適配,并開源大模型推理引擎vLLM-MLU源代碼。針對本次的DeepSeek-V3.2-Exp新模型架構(gòu),寒武紀通過Triton算子開發(fā)實現(xiàn)了快速適配,利用BangC融合算子開發(fā)實現(xiàn)了極致性能優(yōu)化,并基于計算與通信的并行策略,再次達成了業(yè)界領(lǐng)先的計算效率水平。
寒武紀還表示,公司一直重視芯片和算法的聯(lián)合創(chuàng)新,致力于以軟硬件協(xié)同的方式,優(yōu)化大模型部署性能,降低部署成本。此前,公司對DeepSeek系列模型進行了深入的軟硬件協(xié)同性能優(yōu)化。


73709/29








