AI浪潮來襲,算力需求爆發(fā)。國內(nèi)AI服務(wù)器廠商和各類芯片企業(yè)無不積極擁抱這場巨大變革。
(相關(guān)資料圖)
“單個GPU已經(jīng)無法跑Transformer、BERT、GPT這些大模型,需要幾百個甚至上千個GPU連在一起才能跑起來。”國數(shù)集聯(lián)創(chuàng)始人兼首席執(zhí)行官巍騖在接受第一財經(jīng)采訪時稱,目前內(nèi)存容量快速增長,GPU性能呈指數(shù)級增長,但I/O(輸入/輸出)卻沒有跟上,成為AI算力提升瓶頸,導(dǎo)致GPU等未充分利用,造成資源浪費,業(yè)界正試圖解決這一問題。
中金公司也認為,除了依靠單個GPU性能升級外,還需要高速的芯片互聯(lián)技術(shù)、系統(tǒng)互聯(lián)技術(shù)作為支撐,從而提升GPU算力的可擴展性,形成強大的集群算力。
互聯(lián)接口芯片市場預(yù)計增至250億美元
隨著AIGC浪潮興起,AI服務(wù)器需求增長,服務(wù)器內(nèi)部之間或與其他設(shè)備的數(shù)據(jù)傳輸、控制和管理等接口功能的要求也隨之增加。
市場調(diào)研機構(gòu)650 Group報告顯示,從2022年到2027年,全球數(shù)據(jù)中心的互聯(lián)接口芯片市場規(guī)模將翻番,達到250億美元。主要的驅(qū)動力除了AI、機器學(xué)習(xí) (ML),還包括數(shù)據(jù)分析、富媒體應(yīng)用和其他高性能分布式計算,以及不斷激增的邊緣側(cè)和物聯(lián)網(wǎng)設(shè)備向云端傳輸數(shù)據(jù)、使用云端服務(wù)。
中金公司表示,在高性能服務(wù)器強增長的趨勢下,內(nèi)存接口芯片和PCIe接口芯片作為核心數(shù)據(jù)傳輸環(huán)節(jié),有望加速升級迭代,量價齊升推動市場顯著增長。
內(nèi)存接口芯片是服務(wù)器內(nèi)存模組的核心邏輯器件,其連接CPU和DRAM,集成在內(nèi)存模組內(nèi),能夠提升內(nèi)存數(shù)據(jù)訪問的速度及穩(wěn)定性。美光預(yù)計到2025年,服務(wù)器DRAM需求相較2021年將實現(xiàn)2倍提升,而AI服務(wù)器DRAM容量將是普通服務(wù)器的8倍。
內(nèi)存模組市場正在由DDR4世代向DDR5世代迭代升級。目前DDR5內(nèi)存接口芯片的競爭格局與DDR4世代類似,全球由瀾起科技(688008.SH)、瑞薩電子和Rambus三家供應(yīng)商提供DDR5第一子代的量產(chǎn)產(chǎn)品。
其中,瀾起科技2022年牽頭制定DDR5第二子代、第三子代內(nèi)存接口芯片及第一子代高帶寬內(nèi)存接口芯片MDB等產(chǎn)品的國際標準,并積極參與DDR5第一子代CKD和DDR5內(nèi)存模組配套芯片標準制定。
PCIe是一種高速串行計算機擴展總線標準,可實現(xiàn)高速串行點對點雙通道高帶寬傳輸。PCIe產(chǎn)業(yè)鏈主要以IP(DPU、GPU)接口、PCIe Retimer/Redriver、PCIe Switch形態(tài)存在,以及各種PCIe Bridge(比如NVME控制器)。
PCIe Switch芯片兼具連接和交換功能,可以提供擴展能力,幫助CPU連接更多設(shè)備,實現(xiàn)PCIe設(shè)備互聯(lián)。華安證券表示,AI服務(wù)器內(nèi)日益增加的PCIe節(jié)點和復(fù)雜的網(wǎng)絡(luò)架構(gòu)需要更多PCIe Switch。市場調(diào)研機構(gòu)Transparency預(yù)測,2027年P(guān)CIe Switch全球市場規(guī)模將達到92億美元,2019-2027年復(fù)合增長率(CAGR)達15% 中金公司認為,在AI大算力需求下,PCIe Switch是數(shù)據(jù)中心低功耗、高性能解決方案核心一環(huán)。
由于技術(shù)壁壘極高,PCIe Switch芯片市場主要由博通、微芯科技和祥碩科技供應(yīng),中國大陸在該領(lǐng)域還是空白。不過,除了這些傳統(tǒng)芯片廠商,AI行業(yè)巨頭英偉達,硅谷新興硬科技公司Astera Labs、Enfabrica以及中國大陸的國數(shù)集聯(lián)等也都將加入這一近百億美元的市場。據(jù)悉,Enfabrica創(chuàng)始團隊主要來自博通、思科和谷歌,國數(shù)集聯(lián)創(chuàng)始團隊來自阿里和思科。
下一代芯片互聯(lián)標準CXL或帶來新的可能性
由于AI和高性能計算需求激增,為了突破傳統(tǒng)PCIe帶寬限制造成的通信瓶頸,英偉達首創(chuàng)NVLink + NVSwitch技術(shù),為多GPU系統(tǒng)提供更加快速的系統(tǒng)內(nèi)互聯(lián)解決方案。
2016年,英偉達發(fā)布了搭載NVLink的第一款產(chǎn)品Pascal GP100 GPU。NVLink主要用于GPU與GPU之間以及GPU與CPU之間的信息傳輸。借助NVSwitch,NVLink連接可在節(jié)點間擴展以創(chuàng)建多節(jié)點GPU集群。通過NVLink + NVSwitch + InfiniBand和GPU,英偉達在高端的互聯(lián)市場筑牢競爭壁壘,并牢牢掌握AI產(chǎn)業(yè)的話語權(quán)。
隨著技術(shù)迭代升級,CXL(Compute Express Link)的出現(xiàn)讓單一巨頭強大的生態(tài)控制出現(xiàn)了裂痕,芯片廠商、服務(wù)器廠商有機會借此進入這一市場,提供擴展性更好、性價比更有優(yōu)勢、功耗更低的硬件產(chǎn)品。
CXL標準2019年初由英特爾公司牽頭,多家國際知名公司共同推出,旨在提供CPU和專用加速器、高性能存儲系統(tǒng)之間的高效、高速、低延時接口,以滿足資源共享、內(nèi)存池化和高效運算調(diào)度的需求。
作為下一代芯片互聯(lián)的標準,CXL主要解決服務(wù)器內(nèi)部芯片間高速互聯(lián)問題。與二十年前PCIe總線標準發(fā)布創(chuàng)立模塊化和分工明確的服務(wù)器和個人電腦產(chǎn)業(yè)一樣,CXL標準的頒布將開創(chuàng)連接為中心的異構(gòu)集群計算時代。
“傳統(tǒng)的PCIe相當于高速公路,在上面走的是小轎車。隨著PCIe標準逐漸升級迭代,路的通道從兩車道到四車道到八車道。然而GPU算力越來越高,小車相當于變成了大卡車。為了更快地運輸,CXL相當于在通道上鋪了國際標準的鐵軌,專門跑高鐵(GPU、內(nèi)存和其他高速芯片)。高鐵越來越多,就需要引入紅綠燈機制(Switch),防止相撞。如果紅綠燈算法擁有城市大腦能力,交換效率就會很高。”巍騖對第一財經(jīng)解釋稱。
與英偉達采用NVLink專有接口解決方案不同,CXL是行業(yè)共同推出的標準?;谶@一“國標鐵軌”,博通、微芯科技躍躍欲試,希望復(fù)制“高速公路”時期的成功。Astera Labs、Enfabrica以及國數(shù)集聯(lián)也正利用CXL協(xié)議,基于傳統(tǒng)PCIe技術(shù)構(gòu)建下一代“紅綠燈”調(diào)度系統(tǒng)。此外,瀾起科技也是CXL聯(lián)盟的成員單位之一。
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.mduo.com.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com