Ampere架構(gòu)和RDNA 2架構(gòu)顯存延遲測試 Infinity Cache顯示優(yōu)勢
- 來源:超能網(wǎng)
- 作者:超能網(wǎng)
- 編輯:豆角
經(jīng)過了多年的發(fā)展,GPU也具備了多層緩存的結(jié)構(gòu)。這些精心設(shè)計的緩存架構(gòu),可以填補顯存和計算單元之間讀寫速度不匹配的矛盾,與CPU的緩存有類似的作用。
由于GPU架構(gòu)的不同,不同芯片設(shè)計廠商對其緩存的設(shè)計也不一樣。在Ampere架構(gòu)上,英偉達仍然堅持使用相對傳統(tǒng)的L1和L2緩存兩級結(jié)構(gòu)。AMD在RDNA 2架構(gòu)上,則采用了L0、L1、L2和Infinity Cache,事實上Infinity Cache是充當(dāng)了L3緩存的角色。近期Chips and Cheese發(fā)布了一項新研究,比較了英偉達與AMD最新顯卡的顯存延遲情況。
Chips and Cheese采用了OpenCL編寫的指針追蹤基準,用于評估GPU顯存緩存中的延遲。在測試里,使用的是Radeon RX 6800 XT和GeForce RTX 3090顯卡。測試結(jié)果表明,RDNA 2架構(gòu)比Ampere架構(gòu)具有更低的顯存延遲。
在測試中,英偉達GA102的L1和L2緩存之間的延遲超過了100ns,而AMD Navi 21的L0至L2緩存之間的延遲為66ns,加上Infinity Cache僅增加了20ns的額外延遲。這可能可以解釋為什么RDNA 2架構(gòu)在較低分辨率的時候會有更出色的性能表現(xiàn),而Ampere架構(gòu)需要更多并行運算才能有更好的發(fā)揮。
無論英偉達還是AMD,都注意到了大型高效緩存的重要性。英偉達GA100(Ampere)的L2緩存已經(jīng)增加到了40MB,是GV100(Volta)的七倍。AMD則率先使用了高帶寬的設(shè)計,類似的結(jié)構(gòu)也有用于CDNA架構(gòu)的Instinct系列,在Radeon RX系列中(RDNA)為游戲開發(fā)了Infinity Cache。
Chips and Cheese還比較了英偉達和AMD較老的一些架構(gòu),總體而言都在不斷改善。不過AMD每一代架構(gòu)都隨有一定程度的降低,相對來說更明顯。

玩家點評 (0人參與,0條評論)
熱門評論
全部評論