國產(chǎn)14nm AI芯片算力已可媲美英偉達(dá)4nm芯片?
近日,在北京ICC全球CEO峰會上,中國半導(dǎo)體行業(yè)協(xié)會副理事長魏少軍拋出了一枚震撼彈:一款采用成熟14nm制程與18nm DRAM的國產(chǎn)AI芯片,竟聲稱能夠媲美NVIDIA的4nm GPU!這一說法雖顯得頗為科幻,但它卻代表了國內(nèi)AI戰(zhàn)略的最新進展。這款芯片利用3D混合鍵合與近內(nèi)存計算架構(gòu),試圖打破對NVIDIA CUDA(統(tǒng)一計算架構(gòu))的依賴。
魏少軍詳細(xì)介紹了這款芯片的技術(shù)亮點:它將14nm的AI芯片與18nm的DRAM進行堆疊鍵合,并采用3D混合鍵合技術(shù)實現(xiàn)銅對銅的超高密度連接,從而顯著提高了內(nèi)存帶寬并降低了運算延遲。傳統(tǒng)封裝方式通常面臨“內(nèi)存墻”瓶頸——AI訓(xùn)練過程中頻繁的數(shù)據(jù)存取導(dǎo)致能量和時間成本高昂;而這種新架構(gòu)則使得邏輯運算緊貼內(nèi)存執(zhí)行,軟件定義的邏輯可以更動態(tài)地改善AI工作負(fù)載。
此外,魏少軍還透露了這款國產(chǎn)14nm AI芯片的性能數(shù)據(jù):每瓦達(dá)2 TFLOPS(每秒萬億次浮點運算)的能效,總吞吐量高達(dá)120 TFLOPS,遠(yuǎn)超NVIDIA的A100 GPU。然而,通過網(wǎng)絡(luò)查閱資料顯示,NVIDIA A100 GPU的性能高達(dá)312 TFLOPS,顯然超出了國產(chǎn)AI芯片的性能水平。因此,盡管這款國產(chǎn)芯片在某些方面展現(xiàn)出潛力,但要真正挑戰(zhàn)國際大廠,仍然需要更多的努力。
總的來說,這款國產(chǎn)AI芯片的推出代表了中國半導(dǎo)體行業(yè)在AI領(lǐng)域的技術(shù)進步,未來如果能夠不斷優(yōu)化并提高性能,將有望為全球AI計算領(lǐng)域帶來更具競爭力的選擇。
關(guān)注我們


