久久精品94久久精品,亚洲中文字幕强奸视频

改變企業(yè)命運(yùn)的前沿技術(shù)

本期Kiwi Talks 將講述Chiplet技術(shù)是如何改變了一家企業(yè)的命運(yùn)并逐步實(shí)現(xiàn)在高性能計(jì)算與數(shù)據(jù)中心領(lǐng)域的復(fù)興。

當(dāng)我們勇于承擔(dān)可控的風(fēng)險(xiǎn)、積極尋求改變世界的前沿技術(shù)時(shí)，AMD 才會越來越好。

——AMD 董事會主席及首席執(zhí)行官 Lisa Su 博士

開端：Why Chiplet？

2017年對于AMD公司來說是一個(gè)非常關(guān)鍵的轉(zhuǎn)折點(diǎn)。在那之前的10年，AMD都面臨著強(qiáng)勁的競爭對手，糟糕的財(cái)務(wù)負(fù)擔(dān)。那一年AMD實(shí)現(xiàn)了突破式的創(chuàng)新，以全新的Chiplet架構(gòu)誕生 EPYC第一代處理器，標(biāo)志著AMD在高性能計(jì)算領(lǐng)域的復(fù)興，也是其在服務(wù)器市場上的重要里程碑。

回顧2017年，Global Foundries 從AMD剝離，這意味著公司從一家擁有晶圓廠的公司變成芯片設(shè)計(jì)公司。

在被問及是否因?yàn)榫A協(xié)議才被迫選擇Chiplet賽道時(shí)，首席執(zhí)行官Lisa Su回應(yīng)的答案：“完全不是，我們當(dāng)時(shí)的想法是，我們需要為處理器市場帶來一些與眾不同的東西，因此制造這些良率不高、價(jià)格昂貴的巨型芯片并不是大家想要的答案?！?/p>

source：ieeetv

第一代EPYC Zen-1架構(gòu)的服務(wù)器產(chǎn)品是由4個(gè)同樣結(jié)構(gòu)的Die（都含有計(jì)算核、DDR內(nèi)存和I/O功能，I/O主要包括PCIe、以太網(wǎng)、CPU片間互連等）通過 IFOP（Infinity Fabric on Package，一種片內(nèi)互連物理層技術(shù)）相連而成。雖然當(dāng)時(shí)AMD的Chiplet設(shè)計(jì)取得商業(yè)化成功，提升了CPU的市場份額，但Chiplet的技術(shù)發(fā)展一直面臨著各種挑戰(zhàn)。誠然，第一代產(chǎn)品整體的設(shè)計(jì)與制造降低了成本，采用的2D MCM設(shè)計(jì)改善了產(chǎn)品性能并增加了靈活性，然而增加芯片數(shù)目確會導(dǎo)致更大的片上系統(tǒng)(soc)，由于組件之間的距離變大，導(dǎo)致了產(chǎn)品性能的延遲。

在7,8年前，要尋找到最合適的連接小芯片的封裝技術(shù)也同樣面臨難題。這是一個(gè)復(fù)雜的等式，涉及成本、性能、帶寬密度、功耗和制造能力。

在當(dāng)時(shí)，大批量、低成本地生產(chǎn)它們和擁有封裝工藝技術(shù)是兩碼事。為了堅(jiān)持Chiplet的道路，AMD在制造工藝方面投入了大量的資金。

同年，NVIDIA創(chuàng)始人兼CEO黃仁勛在2017年Computex發(fā)布了 Tesla V100，號稱是當(dāng)年史上最強(qiáng)的GPU加速器。雖然 Tesla V100 在性能上極其優(yōu)秀，但仍存在不少缺點(diǎn)。比如芯片面積過大——高達(dá) 815 平方毫米，而過大的芯片面積，加上英偉達(dá)在該款芯片上巨額的研發(fā)投入（約30億美金）直接導(dǎo)致 Tesla V100 的價(jià)格異常昂貴，售價(jià)高達(dá) 14.9 萬美元。如此高的售價(jià)讓很多用戶望而卻步。這也印證了隨著芯片面積的增大，制造成本越發(fā)昂貴，后續(xù)行業(yè)紛紛為了實(shí)現(xiàn)降本都轉(zhuǎn)向了Chiplet的設(shè)計(jì)架構(gòu)。

進(jìn)階：I/O Die架構(gòu)的誕生

Central I/O Die 的架構(gòu)，成功地提高處理器性能的同時(shí)，也提供了更高的能效比和更好的成本效益。

2018年AMD發(fā)布了下一代Zen 2 EPYC CPU。Zen 2架構(gòu)的EPYC Rome 包括8個(gè)CCD（Core Chiplet Die）和1個(gè)IOD（I/O Die），CCD中包括CPU核心、緩存，后者包括各類控制器和輸入輸出處理器使，通過Infinity Fabric技術(shù)實(shí)現(xiàn)Chiplet之間的高速連接，從而構(gòu)建出具有大量核心的高性能處理器。這種設(shè)計(jì)允許每個(gè)核心芯片擁有獨(dú)立的L3緩存，并且可以獨(dú)立地進(jìn)行性能擴(kuò)展和優(yōu)化。

source：ieeetv

AMD后續(xù)推出的Zen3和Zen 4 EPYC CPU均沿用了I/O Die 的架構(gòu)，成功地在提高處理器性能的同時(shí)，也提供了更高的能效比和更好的成本效益。

AMD的Zen3/ Zen4架構(gòu)CPU，采用CCD（compute）和CIOD（memory interface + I/O）組合的形式進(jìn)行不同Chiplets功能拆解。AMD Zen 4 EPYC 采用12個(gè)CDD+1個(gè)IO Die的方式，每個(gè)CDD包含12個(gè)核心，從而讓其達(dá)到了96核心的設(shè)計(jì)。

目前，IO Die架構(gòu)逐步成為Chiplet主流的一種形態(tài)被應(yīng)用。例如Huawei Lego架構(gòu)采用的是compute die（compute + memory interface）和I/O die組合的形式，不同的Chiplets的數(shù)量和組合形式都可以靈活搭配，從而組合出多種不同規(guī)格的云端高性能處理器產(chǎn)品。

奇異摩爾作為國內(nèi)首批自研I/O Die互聯(lián)芯粒的公司，其2.5D通用IO Die互聯(lián)芯粒集成了如D2DDDRPCIeCXL等大量存儲、互聯(lián)接口，最高可以支持10+Chiplets，提供更好的性能、更高的帶寬、更低的延遲及功耗，構(gòu)建全球領(lǐng)先的一流算力平臺。

復(fù)興：高性能計(jì)算和數(shù)據(jù)中心市場

“我們非常重視高性能計(jì)算和人工智能的 GPU 發(fā)展。實(shí)際上，這可能是我們開啟的一個(gè)非常重要的弧線，我們一直都在研究 GPU，這是下一個(gè)重大機(jī)遇。AMD的chiplet 策略可以構(gòu)建一個(gè)高度模塊化的系統(tǒng)，可稱之為集成的 CPU 和 GPU，或者說它更像是實(shí)現(xiàn)了人們需要的令人難以置信的 GPU 功能。”Lisa Su在接受外媒訪談時(shí)表示。

正如Lisa描述的一樣，AMD這幾年聚焦于HPC和數(shù)據(jù)中心并交出了斐然的成績單。2020年, AMD官宣推出Instinct MI 100 加速卡全面進(jìn)軍高性能計(jì)算領(lǐng)域。在接下來的幾年中，AMD不斷升級其AI加速卡的性能。

圖：2023年Datacetner已經(jīng)成為AMD全球收入來源最大的板塊

2023年，AMD又推出了高性能GPU加速卡即Instinct MI300. Lisa 坦言AMD將AI視為第一戰(zhàn)略重點(diǎn)，AI存在大量的市場機(jī)會，而最大機(jī)遇來自數(shù)據(jù)中心。MI300系列已成為AMD歷史上收入增長最快的產(chǎn)品。Instinct MI300 是 AMD 建立未來數(shù)據(jù)中心/ HPC級APU 的重要布局，結(jié)合了 AMD 的 CPU 和 GPU 技術(shù)的優(yōu)點(diǎn)。

值得注意的是，AMD從Zen3 架構(gòu)開始就實(shí)現(xiàn)了3D fabric封裝工藝，而I/O die作為系統(tǒng)基礎(chǔ)設(shè)施的一部分，通過AMD Infinity Fabric技術(shù)與其他芯片進(jìn)行互連，發(fā)揮著關(guān)鍵作用。在某些配置中，例如頂配版本，可能會包含4個(gè)I/O die，它們基于6nm工藝制造，并且可能包含I/O控制器、IP塊以及可能的緩存。

3D Base die（可理解為基于3D封裝的I/O Die）較2.5D IO die面積更大，除了IO die中的互聯(lián)模塊，還可以把原本集成在SoC中的Power、SRAM、I/O等非數(shù)字功能模塊拆分并拼搭進(jìn)去，從而構(gòu)成一個(gè)高度集成并節(jié)能的多核異構(gòu)計(jì)算架構(gòu)，同時(shí)實(shí)現(xiàn)上層的邏輯芯片面積最大化和芯片單位面積的最小化。在互聯(lián)方面，3D Base die支持水平方向和垂直方向的異構(gòu)芯片互連。垂直方向，通過TSV、microbump等3D互連技術(shù)與頂層邏輯芯粒、substrate垂直通信，從而以最小限度實(shí)現(xiàn)die與die之間的互連、片外連接，顯著提高芯粒集成密度。

“

Kiwi Base Die 是奇異摩爾基于Chiplet及3D IC架構(gòu)所自研的基礎(chǔ)互聯(lián)芯粒。Kiwi Base Die 以高性能片上網(wǎng)絡(luò)Kiwi Fabric 為互聯(lián)核心，整合了PCle、HBM等高速互聯(lián)接口，并搭配大容量的片上近存，可實(shí)現(xiàn)高效的片內(nèi)數(shù)據(jù)傳輸調(diào)度與存儲?？蛻艨蓪⑵渌δ軉卧怪倍询B在Kiwi Base Die之上，通過 3D Die2Die 接口實(shí)現(xiàn)芯粒間的高速互聯(lián)。

突破解耦：開源的芯世界

AMD Lisa Su在采訪中表明“ 如果你看看今天的半導(dǎo)體行業(yè)，你會發(fā)現(xiàn)我們和競爭對手既有競爭的地方，也有合作的地方。行業(yè)沒有一種萬能的解決方案，因此模塊化和開放性將允許生態(tài)系統(tǒng)在他們想要?jiǎng)?chuàng)新的地方進(jìn)行創(chuàng)新。所以，比如英特爾，我們確實(shí)在某些領(lǐng)域競爭，但我們也在某些領(lǐng)域合作。英特爾是 UALink 聯(lián)盟的一部分，他們也是超級以太網(wǎng)聯(lián)盟UEC的一部分?！?/p>

AMD作為領(lǐng)先的國際芯片公司，倡導(dǎo)行業(yè)的開放開源，通過聯(lián)合生態(tài)伙伴建立國際互聯(lián)標(biāo)準(zhǔn)。

“目前國內(nèi)的Chiplet生態(tài)處于‘半開放生態(tài)’；一是大量產(chǎn)品開始采用Chiplet技術(shù)，二是行業(yè)中誕生了一些專門從事Chiplet的企業(yè)，無論是提供特定芯粒，還是將已有芯片產(chǎn)品中的某些功能模塊（芯粒）單獨(dú)分離出來，以獨(dú)立的Chiplet形式提供給其他企業(yè)使用。奇異摩爾就在此列。”奇異摩爾聯(lián)合創(chuàng)始人兼產(chǎn)品和解決方案副總裁?？|此前在接受第一財(cái)經(jīng)采訪時(shí)提及。

未來科技還會出現(xiàn)很多有夢想有堅(jiān)持的企業(yè)如奇異摩爾，依托Chiplet架構(gòu)，不斷探索下一代高性能計(jì)算及AI網(wǎng)絡(luò)的互聯(lián)芯粒技術(shù)。

寫在最后

摩爾在其 1965 年關(guān)于芯片、晶體管以及芯片設(shè)計(jì)未來的開創(chuàng)性論文中寫道，他最終能夠預(yù)見到芯片制造商將芯片分解成更小的部分，以使它們更容易制造。這也是半導(dǎo)體鼻祖對于未來芯片架構(gòu)的一個(gè)神奇的預(yù)測，也將預(yù)示行業(yè)對Chiplet技術(shù)賦予厚望，從而創(chuàng)造一個(gè)更簡單、更開源的芯世界。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

amd

amd

+關(guān)注

關(guān)注
25

文章
5407

瀏覽量
133751
服務(wù)器

服務(wù)器

+關(guān)注

關(guān)注
12

文章
8897

瀏覽量
85000
高性能計(jì)算

高性能計(jì)算

+關(guān)注

關(guān)注
0

文章
81

瀏覽量
13363
chiplet

chiplet

+關(guān)注

關(guān)注
6

文章
414

瀏覽量
12538
奇異摩爾

奇異摩爾

+關(guān)注

關(guān)注
0

文章
40

瀏覽量
3306

原文標(biāo)題：Kiwi Talks | 突破與解耦：Chiplet技術(shù)讓AMD實(shí)現(xiàn)高性能計(jì)算與服務(wù)器領(lǐng)域復(fù)興

文章出處：【微信號：奇異摩爾，微信公眾號：奇異摩爾】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

搜索歷史

突破與解耦：Chiplet技術(shù)讓AMD實(shí)現(xiàn)高性能計(jì)算與服務(wù)器領(lǐng)域復(fù)興

評論

RISC-V在服務(wù)器方面的應(yīng)用與發(fā)展前景如何？剛畢業(yè)的學(xué)生才開始學(xué)來的及嗎？

RISC-V在服務(wù)器方面應(yīng)用與發(fā)展前景

服務(wù)器技術(shù)基礎(chǔ)

解鎖高性能計(jì)算與區(qū)塊鏈應(yīng)用，阿里云Kubernetes服務(wù)召喚神龍

華為FPGA加速云服務(wù)器如何加速讓硬件應(yīng)用高效上云？

高性能高并發(fā)服務(wù)器架構(gòu)分享

算能重磅發(fā)布行業(yè)首款服務(wù)器級RISC-V CPU算豐SG2042，助力RISC-V邁向高性能計(jì)算

同步時(shí)鐘服務(wù)器的應(yīng)用領(lǐng)域有哪些？

AMD FirePro?服務(wù)器GPU支持惠普ProLiant DL380 Gen9服務(wù)器

Altera支持IBM電源系統(tǒng)服務(wù)器，讓客戶可以采用FPGA實(shí)現(xiàn)高性能計(jì)算解決方案

AMD CTO Mark Papermaster暢談高性能計(jì)算

gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別

人工智能服務(wù)器高性能計(jì)算需求

超微發(fā)布新款AMD H13代CPU服務(wù)器產(chǎn)品

GPU高性能服務(wù)器配置