您的位置：首頁 > 新聞 > 電腦配件 > 新聞詳情

Ampere架構(gòu)和RDNA 2架構(gòu)顯存延遲測試 Infinity Cache顯示優(yōu)勢

時間：2021-04-20 21:07:56

來源：超能網(wǎng)
作者：超能網(wǎng)
編輯：豆角

經(jīng)過了多年的發(fā)展，GPU也具備了多層緩存的結(jié)構(gòu)。這些精心設(shè)計的緩存架構(gòu)，可以填補顯存和計算單元之間讀寫速度不匹配的矛盾，與CPU的緩存有類似的作用。

由于GPU架構(gòu)的不同，不同芯片設(shè)計廠商對其緩存的設(shè)計也不一樣。在Ampere架構(gòu)上，英偉達仍然堅持使用相對傳統(tǒng)的L1和L2緩存兩級結(jié)構(gòu)。AMD在RDNA 2架構(gòu)上，則采用了L0、L1、L2和Infinity Cache，事實上Infinity Cache是充當(dāng)了L3緩存的角色。近期Chips and Cheese發(fā)布了一項新研究，比較了英偉達與AMD最新顯卡的顯存延遲情況。

Chips and Cheese采用了OpenCL編寫的指針追蹤基準，用于評估GPU顯存緩存中的延遲。在測試里，使用的是Radeon RX 6800 XT和GeForce RTX 3090顯卡。測試結(jié)果表明，RDNA 2架構(gòu)比Ampere架構(gòu)具有更低的顯存延遲。

在測試中，英偉達GA102的L1和L2緩存之間的延遲超過了100ns，而AMD Navi 21的L0至L2緩存之間的延遲為66ns，加上Infinity Cache僅增加了20ns的額外延遲。這可能可以解釋為什么RDNA 2架構(gòu)在較低分辨率的時候會有更出色的性能表現(xiàn)，而Ampere架構(gòu)需要更多并行運算才能有更好的發(fā)揮。

無論英偉達還是AMD，都注意到了大型高效緩存的重要性。英偉達GA100（Ampere）的L2緩存已經(jīng)增加到了40MB，是GV100（Volta）的七倍。AMD則率先使用了高帶寬的設(shè)計，類似的結(jié)構(gòu)也有用于CDNA架構(gòu)的Instinct系列，在Radeon RX系列中（RDNA）為游戲開發(fā)了Infinity Cache。

Chips and Cheese還比較了英偉達和AMD較老的一些架構(gòu)，總體而言都在不斷改善。不過AMD每一代架構(gòu)都隨有一定程度的降低，相對來說更明顯。