0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

突破與解耦:Chiplet技術(shù)讓AMD實(shí)現(xiàn)高性能計(jì)算與服務(wù)器領(lǐng)域復(fù)興

奇異摩爾 ? 來源:奇異摩爾 ? 2024-08-21 18:33 ? 次閱讀

改變企業(yè)命運(yùn)的前沿技術(shù)

本期Kiwi Talks 將講述Chiplet技術(shù)是如何改變了一家企業(yè)的命運(yùn)并逐步實(shí)現(xiàn)在高性能計(jì)算與數(shù)據(jù)中心領(lǐng)域的復(fù)興。

當(dāng)我們勇于承擔(dān)可控的風(fēng)險(xiǎn)、積極尋求改變世界的前沿技術(shù)時(shí),AMD 才會越來越好。

——AMD 董事會主席及首席執(zhí)行官 Lisa Su 博士

開端:Why Chiplet?

2017年對于AMD公司來說是一個(gè)非常關(guān)鍵的轉(zhuǎn)折點(diǎn)。在那之前的10年,AMD都面臨著強(qiáng)勁的競爭對手,糟糕的財(cái)務(wù)負(fù)擔(dān)。 那一年AMD實(shí)現(xiàn)了突破式的創(chuàng)新,以全新的Chiplet架構(gòu)誕生 EPYC第一代處理器,標(biāo)志著AMD在高性能計(jì)算領(lǐng)域的復(fù)興,也是其在服務(wù)器市場上的重要里程碑。

回顧2017年,Global Foundries 從AMD剝離,這意味著公司從一家擁有晶圓廠的公司變成芯片設(shè)計(jì)公司。

在被問及是否因?yàn)榫A協(xié)議才被迫選擇Chiplet賽道時(shí),首席執(zhí)行官Lisa Su回應(yīng)的答案:“完全不是,我們當(dāng)時(shí)的想法是,我們需要為處理器市場帶來一些與眾不同的東西,因此制造這些良率不高、價(jià)格昂貴的巨型芯片并不是大家想要的答案?!?/p>

source:ieeetv

第一代EPYC Zen-1架構(gòu)的服務(wù)器產(chǎn)品是由4個(gè)同樣結(jié)構(gòu)的Die(都含有計(jì)算核、DDR內(nèi)存和I/O功能,I/O主要包括PCIe、以太網(wǎng)、CPU片間互連等)通過 IFOP(Infinity Fabric on Package,一種片內(nèi)互連物理層技術(shù))相連而成。 雖然當(dāng)時(shí)AMD的Chiplet設(shè)計(jì)取得商業(yè)化成功,提升了CPU的市場份額,但Chiplet的技術(shù)發(fā)展一直面臨著各種挑戰(zhàn)。誠然,第一代產(chǎn)品整體的設(shè)計(jì)與制造降低了成本,采用的2D MCM設(shè)計(jì)改善了產(chǎn)品性能并增加了靈活性,然而增加芯片數(shù)目確會導(dǎo)致更大的片上系統(tǒng)(soc),由于組件之間的距離變大,導(dǎo)致了產(chǎn)品性能的延遲。

在7,8年前,要尋找到最合適的連接小芯片的封裝技術(shù)也同樣面臨難題。這是一個(gè)復(fù)雜的等式,涉及成本、性能、帶寬密度、功耗和制造能力。

在當(dāng)時(shí),大批量、低成本地生產(chǎn)它們和擁有封裝工藝技術(shù)是兩碼事。為了堅(jiān)持Chiplet的道路,AMD在制造工藝方面投入了大量的資金。

同年,NVIDIA創(chuàng)始人兼CEO黃仁勛在2017年Computex發(fā)布了 Tesla V100,號稱是當(dāng)年史上最強(qiáng)的GPU加速器。雖然 Tesla V100 在性能上極其優(yōu)秀,但仍存在不少缺點(diǎn)。比如芯片面積過大——高達(dá) 815 平方毫米,而過大的芯片面積,加上英偉達(dá)在該款芯片上巨額的研發(fā)投入(約30億美金)直接導(dǎo)致 Tesla V100 的價(jià)格異常昂貴,售價(jià)高達(dá) 14.9 萬美元。如此高的售價(jià)讓很多用戶望而卻步。 這也印證了隨著芯片面積的增大,制造成本越發(fā)昂貴,后續(xù)行業(yè)紛紛為了實(shí)現(xiàn)降本都轉(zhuǎn)向了Chiplet的設(shè)計(jì)架構(gòu)。

進(jìn)階:I/O Die架構(gòu)的誕生

Central I/O Die 的架構(gòu),成功地提高處理器性能的同時(shí),也提供了更高的能效比和更好的成本效益。

2018年AMD發(fā)布了下一代Zen 2 EPYC CPU。Zen 2架構(gòu)的EPYC Rome 包括8個(gè)CCD(Core Chiplet Die)和1個(gè)IOD(I/O Die),CCD中包括CPU核心、緩存,后者包括各類控制器和輸入輸出處理器使,通過Infinity Fabric技術(shù)實(shí)現(xiàn)Chiplet之間的高速連接,從而構(gòu)建出具有大量核心的高性能處理器。這種設(shè)計(jì)允許每個(gè)核心芯片擁有獨(dú)立的L3緩存,并且可以獨(dú)立地進(jìn)行性能擴(kuò)展和優(yōu)化。

source:ieeetv

AMD后續(xù)推出的Zen3和Zen 4 EPYC CPU均沿用了I/O Die 的架構(gòu),成功地在提高處理器性能的同時(shí),也提供了更高的能效比和更好的成本效益。

AMD的Zen3/ Zen4架構(gòu)CPU,采用CCD(compute)和CIOD(memory interface + I/O)組合的形式進(jìn)行不同Chiplets功能拆解。AMD Zen 4 EPYC 采用12個(gè)CDD+1個(gè)IO Die的方式,每個(gè)CDD包含12個(gè)核心,從而讓其達(dá)到了96核心的設(shè)計(jì)。

目前,IO Die架構(gòu)逐步成為Chiplet主流的一種形態(tài)被應(yīng)用。例如Huawei Lego架構(gòu)采用的是compute die(compute + memory interface)和I/O die組合的形式,不同的Chiplets的數(shù)量和組合形式都可以靈活搭配,從而組合出多種不同規(guī)格的云端高性能處理器產(chǎn)品。

奇異摩爾作為國內(nèi)首批自研I/O Die互聯(lián)芯粒的公司,其2.5D通用IO Die互聯(lián)芯粒集成了如D2DDDRPCIeCXL等大量存儲、互聯(lián)接口,最高可以支持10+Chiplets,提供更好的性能、更高的帶寬、更低的延遲及功耗,構(gòu)建全球領(lǐng)先的一流算力平臺。

復(fù)興:高性能計(jì)算和數(shù)據(jù)中心市場

“我們非常重視高性能計(jì)算和人工智能的 GPU 發(fā)展。實(shí)際上,這可能是我們開啟的一個(gè)非常重要的弧線,我們一直都在研究 GPU,這是下一個(gè)重大機(jī)遇。AMD的chiplet 策略可以構(gòu)建一個(gè)高度模塊化的系統(tǒng),可稱之為集成的 CPU 和 GPU,或者說它更像是實(shí)現(xiàn)了人們需要的令人難以置信的 GPU 功能。”Lisa Su在接受外媒訪談時(shí)表示。

正如Lisa描述的一樣,AMD這幾年聚焦于HPC和數(shù)據(jù)中心并交出了斐然的成績單。2020年, AMD官宣推出Instinct MI 100 加速卡全面進(jìn)軍高性能計(jì)算領(lǐng)域。在接下來的幾年中,AMD不斷升級其AI加速卡的性能。

圖:2023年Datacetner已經(jīng)成為AMD全球收入來源最大的板塊

2023年,AMD又推出了高性能GPU加速卡即Instinct MI300. Lisa 坦言AMD將AI視為第一戰(zhàn)略重點(diǎn),AI存在大量的市場機(jī)會,而最大機(jī)遇來自數(shù)據(jù)中心。MI300系列已成為AMD歷史上收入增長最快的產(chǎn)品。Instinct MI300 是 AMD 建立未來數(shù)據(jù)中心/ HPC級APU 的重要布局,結(jié)合了 AMD 的 CPU 和 GPU 技術(shù)的優(yōu)點(diǎn)。

值得注意的是,AMD從Zen3 架構(gòu)開始就實(shí)現(xiàn)了3D fabric封裝工藝,而I/O die作為系統(tǒng)基礎(chǔ)設(shè)施的一部分,通過AMD Infinity Fabric技術(shù)與其他芯片進(jìn)行互連,發(fā)揮著關(guān)鍵作用。在某些配置中,例如頂配版本,可能會包含4個(gè)I/O die,它們基于6nm工藝制造,并且可能包含I/O控制器、IP塊以及可能的緩存。

3D Base die(可理解為基于3D封裝的I/O Die)較2.5D IO die面積更大,除了IO die中的互聯(lián)模塊,還可以把原本集成在SoC中的Power、SRAM、I/O等非數(shù)字功能模塊拆分并拼搭進(jìn)去,從而構(gòu)成一個(gè)高度集成并節(jié)能的多核異構(gòu)計(jì)算架構(gòu),同時(shí)實(shí)現(xiàn)上層的邏輯芯片面積最大化和芯片單位面積的最小化。在互聯(lián)方面,3D Base die支持水平方向和垂直方向的異構(gòu)芯片互連。垂直方向,通過TSV、microbump等3D互連技術(shù)與頂層邏輯芯粒、substrate垂直通信,從而以最小限度實(shí)現(xiàn)die與die之間的互連、片外連接,顯著提高芯粒集成密度。

Kiwi Base Die 是奇異摩爾基于Chiplet及3D IC架構(gòu)所自研的基礎(chǔ)互聯(lián)芯粒。Kiwi Base Die 以高性能片上網(wǎng)絡(luò)Kiwi Fabric 為互聯(lián)核心,整合了PCle、HBM等高速互聯(lián)接口,并搭配大容量的片上近存,可實(shí)現(xiàn)高效的片內(nèi)數(shù)據(jù)傳輸調(diào)度與存儲??蛻艨蓪⑵渌δ軉卧怪倍询B在Kiwi Base Die之上,通過 3D Die2Die 接口實(shí)現(xiàn)芯粒間的高速互聯(lián)。

突破解耦:開源的芯世界

AMD Lisa Su在采訪中表明“ 如果你看看今天的半導(dǎo)體行業(yè),你會發(fā)現(xiàn)我們和競爭對手既有競爭的地方,也有合作的地方。行業(yè)沒有一種萬能的解決方案,因此模塊化和開放性將允許生態(tài)系統(tǒng)在他們想要?jiǎng)?chuàng)新的地方進(jìn)行創(chuàng)新。所以,比如英特爾,我們確實(shí)在某些領(lǐng)域競爭,但我們也在某些領(lǐng)域合作。英特爾是 UALink 聯(lián)盟的一部分,他們也是超級以太網(wǎng)聯(lián)盟UEC的一部分?!?/p>

AMD作為領(lǐng)先的國際芯片公司,倡導(dǎo)行業(yè)的開放開源,通過聯(lián)合生態(tài)伙伴建立國際互聯(lián)標(biāo)準(zhǔn)。

“目前國內(nèi)的Chiplet生態(tài)處于‘半開放生態(tài)’;一是大量產(chǎn)品開始采用Chiplet技術(shù),二是行業(yè)中誕生了一些專門從事Chiplet的企業(yè),無論是提供特定芯粒,還是將已有芯片產(chǎn)品中的某些功能模塊(芯粒)單獨(dú)分離出來,以獨(dú)立的Chiplet形式提供給其他企業(yè)使用。奇異摩爾就在此列。”奇異摩爾聯(lián)合創(chuàng)始人兼產(chǎn)品和解決方案副總裁??|此前在接受第一財(cái)經(jīng)采訪時(shí)提及。

未來科技還會出現(xiàn)很多有夢想有堅(jiān)持的企業(yè)如奇異摩爾,依托Chiplet架構(gòu),不斷探索下一代高性能計(jì)算及AI網(wǎng)絡(luò)的互聯(lián)芯粒技術(shù)。

寫在最后

摩爾在其 1965 年關(guān)于芯片、晶體管以及芯片設(shè)計(jì)未來的開創(chuàng)性論文中寫道,他最終能夠預(yù)見到芯片制造商將芯片分解成更小的部分,以使它們更容易制造。這也是半導(dǎo)體鼻祖對于未來芯片架構(gòu)的一個(gè)神奇的預(yù)測,也將預(yù)示行業(yè)對Chiplet技術(shù)賦予厚望,從而創(chuàng)造一個(gè)更簡單、更開源的芯世界。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5407

    瀏覽量

    133751
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8897

    瀏覽量

    85000
  • 高性能計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    81

    瀏覽量

    13363
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    414

    瀏覽量

    12538
  • 奇異摩爾
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    3306

原文標(biāo)題:Kiwi Talks | 突破與解耦:Chiplet技術(shù)讓AMD實(shí)現(xiàn)高性能計(jì)算與服務(wù)器領(lǐng)域復(fù)興

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    RISC-V在服務(wù)器方面的應(yīng)用與發(fā)展前景如何?剛畢業(yè)的學(xué)生才開始學(xué)來的及嗎?

    計(jì)算技術(shù)研究所等機(jī)構(gòu)發(fā)布的“香山”開源高性能RISC-V處理核,不僅性能卓越,而且有效匯聚了全球創(chuàng)新力量,加速了RISC-V在高性能
    發(fā)表于 04-28 08:49

    RISC-V在服務(wù)器方面應(yīng)用與發(fā)展前景

    計(jì)算技術(shù)研究所等機(jī)構(gòu)發(fā)布的“香山”開源高性能RISC-V處理核,不僅性能卓越,而且有效匯聚了全球創(chuàng)新力量,加速了RISC-V在高性能
    發(fā)表于 04-28 09:04

    服務(wù)器技術(shù)基礎(chǔ)

    中國高性能計(jì)算機(jī)標(biāo)準(zhǔn)1.1 什么是服務(wù)器服務(wù)器Server從功能上說,它負(fù)責(zé)偵聽網(wǎng)絡(luò)上其它客戶機(jī)(Client)提交的服務(wù)請求,并提供相應(yīng)的
    發(fā)表于 09-12 22:55

    解鎖高性能計(jì)算與區(qū)塊鏈應(yīng)用,阿里云Kubernetes服務(wù)召喚神龍

    ,將會有更多高性能計(jì)算的訴求,但自建高性能計(jì)算的成本以及發(fā)布復(fù)雜度高。依靠神龍(X-Dragon)彈性裸金屬服務(wù)器和容器
    發(fā)表于 06-13 15:52

    華為FPGA加速云服務(wù)器如何加速硬件應(yīng)用高效上云?

    華為FPGA加速云服務(wù)器“硬用”上云成為新增長點(diǎn)隨著通信和互聯(lián)網(wǎng)產(chǎn)業(yè)的快速發(fā)展,F(xiàn)PGA作為高性能計(jì)算加速在大數(shù)據(jù)、深度學(xué)習(xí)、圖像視頻處
    發(fā)表于 10-22 07:12

    高性能高并發(fā)服務(wù)器架構(gòu)分享

    由于自己正在做一個(gè)高性能大用戶量的論壇程序,對高性能高并發(fā)服務(wù)器架構(gòu)比較感興趣,于是在網(wǎng)上收集了不少這方面的資料和大家分享。希望能和大家交流 msn: ——————————————————————————————————————
    發(fā)表于 09-16 06:45

    算能重磅發(fā)布行業(yè)首款服務(wù)器級RISC-V CPU算豐SG2042,助力RISC-V邁向高性能計(jì)算

    ,算能也重磅發(fā)布了行業(yè)首款服務(wù)器級RISC-V CPU算豐SG2042,助力RISC-V 邁向高性能計(jì)算領(lǐng)域。首款服務(wù)器級RISC-V CP
    發(fā)表于 03-03 16:45

    同步時(shí)鐘服務(wù)器的應(yīng)用領(lǐng)域有哪些?

    隨著科學(xué)技術(shù)的不斷發(fā)展,同步時(shí)鐘服務(wù)器已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域。同步時(shí)鐘服務(wù)器是一種用來實(shí)現(xiàn)各種設(shè)備時(shí)間同步的網(wǎng)絡(luò)設(shè)備。它可以采用多種方式來確
    發(fā)表于 04-14 13:36

    AMD FirePro?服務(wù)器GPU支持惠普ProLiant DL380 Gen9服務(wù)器

    2月底AMD公司宣布,世界上最暢銷的服務(wù)器惠普ProLiant DL380 Gen9已經(jīng)采用為高性能計(jì)算而生的AMD FirePro?S91
    發(fā)表于 03-02 17:29 ?1535次閱讀

    Altera支持IBM電源系統(tǒng)服務(wù)器,客戶可以采用FPGA實(shí)現(xiàn)高性能計(jì)算解決方案

    Altera公司宣布,最新版Altera面向 OpenCL的SDK支持IBM電源系統(tǒng)服務(wù)器作為OpenCL系統(tǒng)主機(jī)??蛻衄F(xiàn)在可以采用Altera FPGA實(shí)現(xiàn)高性能計(jì)算解決方案,針對
    發(fā)表于 09-18 16:34 ?1192次閱讀

    AMD CTO Mark Papermaster暢談高性能計(jì)算

    去的18個(gè)月里,AMD在HPC領(lǐng)域東山再起。您認(rèn)為高性能計(jì)算的趨勢有哪些? 我們正處于高性能計(jì)算
    的頭像 發(fā)表于 06-11 14:50 ?1241次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別

     相比于傳統(tǒng)的CPU服務(wù)器,GPU服務(wù)器支持同時(shí)計(jì)算大量相似的計(jì)算操作,可以實(shí)現(xiàn)更強(qiáng)的并行計(jì)算
    的頭像 發(fā)表于 12-02 17:20 ?1811次閱讀

    人工智能服務(wù)器高性能計(jì)算需求

    人工智能(AI)服務(wù)器是一種專門為了運(yùn)行人工智能應(yīng)用和提供大數(shù)據(jù)處理能力而設(shè)計(jì)的高性能計(jì)算機(jī)。它既可以支持本地應(yīng)用程序和網(wǎng)頁,也可以為云和本地服務(wù)器提供復(fù)雜的AI模型和服務(wù)。
    的頭像 發(fā)表于 12-08 09:44 ?457次閱讀

    超微發(fā)布新款AMD H13代CPU服務(wù)器產(chǎn)品

    超微(Supermicro)近日宣布推出全新AMD H13代CPU服務(wù)器產(chǎn)品系列,再度鞏固其在人工智能、云技術(shù)、存儲和5G/邊緣計(jì)算領(lǐng)域的領(lǐng)
    的頭像 發(fā)表于 05-28 10:30 ?655次閱讀

    GPU高性能服務(wù)器配置

    GPU高性能服務(wù)器作為提升計(jì)算速度和效率的關(guān)鍵設(shè)備,在各大應(yīng)用場景中發(fā)揮著越來越重要的作用。在此,petacloud.ai小編為你介紹GPU高性能
    的頭像 發(fā)表于 10-21 10:42 ?106次閱讀