改變企業(yè)命運(yùn)的前沿技術(shù)
本期Kiwi Talks 將講述Chiplet技術(shù)是如何改變了一家企業(yè)的命運(yùn)并逐步實(shí)現(xiàn)在高性能計(jì)算與數(shù)據(jù)中心領(lǐng)域的復(fù)興。
當(dāng)我們勇于承擔(dān)可控的風(fēng)險(xiǎn)、積極尋求改變世界的前沿技術(shù)時(shí),AMD 才會越來越好。
——AMD 董事會主席及首席執(zhí)行官 Lisa Su 博士
開端:Why Chiplet?
2017年對于AMD公司來說是一個(gè)非常關(guān)鍵的轉(zhuǎn)折點(diǎn)。在那之前的10年,AMD都面臨著強(qiáng)勁的競爭對手,糟糕的財(cái)務(wù)負(fù)擔(dān)。 那一年AMD實(shí)現(xiàn)了突破式的創(chuàng)新,以全新的Chiplet架構(gòu)誕生 EPYC第一代處理器,標(biāo)志著AMD在高性能計(jì)算領(lǐng)域的復(fù)興,也是其在服務(wù)器市場上的重要里程碑。
回顧2017年,Global Foundries 從AMD剝離,這意味著公司從一家擁有晶圓廠的公司變成芯片設(shè)計(jì)公司。
在被問及是否因?yàn)榫A協(xié)議才被迫選擇Chiplet賽道時(shí),首席執(zhí)行官Lisa Su回應(yīng)的答案:“完全不是,我們當(dāng)時(shí)的想法是,我們需要為處理器市場帶來一些與眾不同的東西,因此制造這些良率不高、價(jià)格昂貴的巨型芯片并不是大家想要的答案?!?/p>
source:ieeetv
第一代EPYC Zen-1架構(gòu)的服務(wù)器產(chǎn)品是由4個(gè)同樣結(jié)構(gòu)的Die(都含有計(jì)算核、DDR內(nèi)存和I/O功能,I/O主要包括PCIe、以太網(wǎng)、CPU片間互連等)通過 IFOP(Infinity Fabric on Package,一種片內(nèi)互連物理層技術(shù))相連而成。 雖然當(dāng)時(shí)AMD的Chiplet設(shè)計(jì)取得商業(yè)化成功,提升了CPU的市場份額,但Chiplet的技術(shù)發(fā)展一直面臨著各種挑戰(zhàn)。誠然,第一代產(chǎn)品整體的設(shè)計(jì)與制造降低了成本,采用的2D MCM設(shè)計(jì)改善了產(chǎn)品性能并增加了靈活性,然而增加芯片數(shù)目確會導(dǎo)致更大的片上系統(tǒng)(soc),由于組件之間的距離變大,導(dǎo)致了產(chǎn)品性能的延遲。
在7,8年前,要尋找到最合適的連接小芯片的封裝技術(shù)也同樣面臨難題。這是一個(gè)復(fù)雜的等式,涉及成本、性能、帶寬密度、功耗和制造能力。
在當(dāng)時(shí),大批量、低成本地生產(chǎn)它們和擁有封裝工藝技術(shù)是兩碼事。為了堅(jiān)持Chiplet的道路,AMD在制造工藝方面投入了大量的資金。
同年,NVIDIA創(chuàng)始人兼CEO黃仁勛在2017年Computex發(fā)布了 Tesla V100,號稱是當(dāng)年史上最強(qiáng)的GPU加速器。雖然 Tesla V100 在性能上極其優(yōu)秀,但仍存在不少缺點(diǎn)。比如芯片面積過大——高達(dá) 815 平方毫米,而過大的芯片面積,加上英偉達(dá)在該款芯片上巨額的研發(fā)投入(約30億美金)直接導(dǎo)致 Tesla V100 的價(jià)格異常昂貴,售價(jià)高達(dá) 14.9 萬美元。如此高的售價(jià)讓很多用戶望而卻步。 這也印證了隨著芯片面積的增大,制造成本越發(fā)昂貴,后續(xù)行業(yè)紛紛為了實(shí)現(xiàn)降本都轉(zhuǎn)向了Chiplet的設(shè)計(jì)架構(gòu)。
進(jìn)階:I/O Die架構(gòu)的誕生
Central I/O Die 的架構(gòu),成功地提高處理器性能的同時(shí),也提供了更高的能效比和更好的成本效益。
2018年AMD發(fā)布了下一代Zen 2 EPYC CPU。Zen 2架構(gòu)的EPYC Rome 包括8個(gè)CCD(Core Chiplet Die)和1個(gè)IOD(I/O Die),CCD中包括CPU核心、緩存,后者包括各類控制器和輸入輸出處理器使,通過Infinity Fabric技術(shù)實(shí)現(xiàn)Chiplet之間的高速連接,從而構(gòu)建出具有大量核心的高性能處理器。這種設(shè)計(jì)允許每個(gè)核心芯片擁有獨(dú)立的L3緩存,并且可以獨(dú)立地進(jìn)行性能擴(kuò)展和優(yōu)化。
source:ieeetv
AMD后續(xù)推出的Zen3和Zen 4 EPYC CPU均沿用了I/O Die 的架構(gòu),成功地在提高處理器性能的同時(shí),也提供了更高的能效比和更好的成本效益。
AMD的Zen3/ Zen4架構(gòu)CPU,采用CCD(compute)和CIOD(memory interface + I/O)組合的形式進(jìn)行不同Chiplets功能拆解。AMD Zen 4 EPYC 采用12個(gè)CDD+1個(gè)IO Die的方式,每個(gè)CDD包含12個(gè)核心,從而讓其達(dá)到了96核心的設(shè)計(jì)。
目前,IO Die架構(gòu)逐步成為Chiplet主流的一種形態(tài)被應(yīng)用。例如Huawei Lego架構(gòu)采用的是compute die(compute + memory interface)和I/O die組合的形式,不同的Chiplets的數(shù)量和組合形式都可以靈活搭配,從而組合出多種不同規(guī)格的云端高性能處理器產(chǎn)品。
奇異摩爾作為國內(nèi)首批自研I/O Die互聯(lián)芯粒的公司,其2.5D通用IO Die互聯(lián)芯粒集成了如D2DDDRPCIeCXL等大量存儲、互聯(lián)接口,最高可以支持10+Chiplets,提供更好的性能、更高的帶寬、更低的延遲及功耗,構(gòu)建全球領(lǐng)先的一流算力平臺。
復(fù)興:高性能計(jì)算和數(shù)據(jù)中心市場
“我們非常重視高性能計(jì)算和人工智能的 GPU 發(fā)展。實(shí)際上,這可能是我們開啟的一個(gè)非常重要的弧線,我們一直都在研究 GPU,這是下一個(gè)重大機(jī)遇。AMD的chiplet 策略可以構(gòu)建一個(gè)高度模塊化的系統(tǒng),可稱之為集成的 CPU 和 GPU,或者說它更像是實(shí)現(xiàn)了人們需要的令人難以置信的 GPU 功能。”Lisa Su在接受外媒訪談時(shí)表示。
正如Lisa描述的一樣,AMD這幾年聚焦于HPC和數(shù)據(jù)中心并交出了斐然的成績單。2020年, AMD官宣推出Instinct MI 100 加速卡全面進(jìn)軍高性能計(jì)算領(lǐng)域。在接下來的幾年中,AMD不斷升級其AI加速卡的性能。
圖:2023年Datacetner已經(jīng)成為AMD全球收入來源最大的板塊
2023年,AMD又推出了高性能GPU加速卡即Instinct MI300. Lisa 坦言AMD將AI視為第一戰(zhàn)略重點(diǎn),AI存在大量的市場機(jī)會,而最大機(jī)遇來自數(shù)據(jù)中心。MI300系列已成為AMD歷史上收入增長最快的產(chǎn)品。Instinct MI300 是 AMD 建立未來數(shù)據(jù)中心/ HPC級APU 的重要布局,結(jié)合了 AMD 的 CPU 和 GPU 技術(shù)的優(yōu)點(diǎn)。
值得注意的是,AMD從Zen3 架構(gòu)開始就實(shí)現(xiàn)了3D fabric封裝工藝,而I/O die作為系統(tǒng)基礎(chǔ)設(shè)施的一部分,通過AMD Infinity Fabric技術(shù)與其他芯片進(jìn)行互連,發(fā)揮著關(guān)鍵作用。在某些配置中,例如頂配版本,可能會包含4個(gè)I/O die,它們基于6nm工藝制造,并且可能包含I/O控制器、IP塊以及可能的緩存。
3D Base die(可理解為基于3D封裝的I/O Die)較2.5D IO die面積更大,除了IO die中的互聯(lián)模塊,還可以把原本集成在SoC中的Power、SRAM、I/O等非數(shù)字功能模塊拆分并拼搭進(jìn)去,從而構(gòu)成一個(gè)高度集成并節(jié)能的多核異構(gòu)計(jì)算架構(gòu),同時(shí)實(shí)現(xiàn)上層的邏輯芯片面積最大化和芯片單位面積的最小化。在互聯(lián)方面,3D Base die支持水平方向和垂直方向的異構(gòu)芯片互連。垂直方向,通過TSV、microbump等3D互連技術(shù)與頂層邏輯芯粒、substrate垂直通信,從而以最小限度實(shí)現(xiàn)die與die之間的互連、片外連接,顯著提高芯粒集成密度。
“
Kiwi Base Die 是奇異摩爾基于Chiplet及3D IC架構(gòu)所自研的基礎(chǔ)互聯(lián)芯粒。Kiwi Base Die 以高性能片上網(wǎng)絡(luò)Kiwi Fabric 為互聯(lián)核心,整合了PCle、HBM等高速互聯(lián)接口,并搭配大容量的片上近存,可實(shí)現(xiàn)高效的片內(nèi)數(shù)據(jù)傳輸調(diào)度與存儲??蛻艨蓪⑵渌δ軉卧怪倍询B在Kiwi Base Die之上,通過 3D Die2Die 接口實(shí)現(xiàn)芯粒間的高速互聯(lián)。
突破解耦:開源的芯世界
AMD Lisa Su在采訪中表明“ 如果你看看今天的半導(dǎo)體行業(yè),你會發(fā)現(xiàn)我們和競爭對手既有競爭的地方,也有合作的地方。行業(yè)沒有一種萬能的解決方案,因此模塊化和開放性將允許生態(tài)系統(tǒng)在他們想要?jiǎng)?chuàng)新的地方進(jìn)行創(chuàng)新。所以,比如英特爾,我們確實(shí)在某些領(lǐng)域競爭,但我們也在某些領(lǐng)域合作。英特爾是 UALink 聯(lián)盟的一部分,他們也是超級以太網(wǎng)聯(lián)盟UEC的一部分?!?/p>
AMD作為領(lǐng)先的國際芯片公司,倡導(dǎo)行業(yè)的開放開源,通過聯(lián)合生態(tài)伙伴建立國際互聯(lián)標(biāo)準(zhǔn)。
“目前國內(nèi)的Chiplet生態(tài)處于‘半開放生態(tài)’;一是大量產(chǎn)品開始采用Chiplet技術(shù),二是行業(yè)中誕生了一些專門從事Chiplet的企業(yè),無論是提供特定芯粒,還是將已有芯片產(chǎn)品中的某些功能模塊(芯粒)單獨(dú)分離出來,以獨(dú)立的Chiplet形式提供給其他企業(yè)使用。奇異摩爾就在此列。”奇異摩爾聯(lián)合創(chuàng)始人兼產(chǎn)品和解決方案副總裁??|此前在接受第一財(cái)經(jīng)采訪時(shí)提及。
未來科技還會出現(xiàn)很多有夢想有堅(jiān)持的企業(yè)如奇異摩爾,依托Chiplet架構(gòu),不斷探索下一代高性能計(jì)算及AI網(wǎng)絡(luò)的互聯(lián)芯粒技術(shù)。
寫在最后
摩爾在其 1965 年關(guān)于芯片、晶體管以及芯片設(shè)計(jì)未來的開創(chuàng)性論文中寫道,他最終能夠預(yù)見到芯片制造商將芯片分解成更小的部分,以使它們更容易制造。這也是半導(dǎo)體鼻祖對于未來芯片架構(gòu)的一個(gè)神奇的預(yù)測,也將預(yù)示行業(yè)對Chiplet技術(shù)賦予厚望,從而創(chuàng)造一個(gè)更簡單、更開源的芯世界。
-
amd
+關(guān)注
關(guān)注
25文章
5407瀏覽量
133751 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8897瀏覽量
85000 -
高性能計(jì)算
+關(guān)注
關(guān)注
0文章
81瀏覽量
13363 -
chiplet
+關(guān)注
關(guān)注
6文章
414瀏覽量
12538 -
奇異摩爾
+關(guān)注
關(guān)注
0文章
40瀏覽量
3306
原文標(biāo)題:Kiwi Talks | 突破與解耦:Chiplet技術(shù)讓AMD實(shí)現(xiàn)高性能計(jì)算與服務(wù)器領(lǐng)域復(fù)興
文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論