Thursday, November 14, 2019

顯卡參數詳解

一、顯卡芯片參數解析

首先一個重要的概念就是ROPs(Raster Operations Units),即光柵化處理單元,表示顯示GPU擁有的ROP光柵操作處理單元的數量。通常來說:3D圖形處理可以分成四個主要步驟,幾何處理、設置、紋理和光柵處理,而ROPs就是處理光柵單元。那麼光柵化處理單元的多少對顯卡性能有哪些影響了?

ROPs(光柵化處理單元)主要負責遊戲中的光線和反射運算,兼顧AA、高分辨率、煙霧、火焰等效果。遊戲里的AA(抗鋸齒)和光影效果越厲害,對ROPs(光柵化處理單元)的性能要求也就越高,否則就可能導致遊戲幀數急劇下降.比如同樣是某個遊戲的最高畫質效果,8個光柵單元的顯卡可能只能跑25幀.而16個光柵單元的顯卡則可以穩定在35幀以上。舉一個例子:GTX550Ti和HD6790前者是24個ROPs單元,後者是16個ROPs單元,雖然在大部分測試項目中,HD6790都是領先GTX550Ti的,但是在高AA(抗鋸齒)負載的情況下,HD6790的弱點即刻暴露出來,16個ROPs單元顯得有點力不從心。從FarCry 2中也印證出了這一點:遊戲中4xAA設置下HD 6790的落後幅度為4%左右,而開啟8xAA後性能落後幅度則擴大至15-17%之多。

需要注意的是,AMD顯卡和NVIDIA顯卡在ROPs的設計上是有區別的,N卡的ROPs單元和流處理器是“捆綁”的,即置於SIMD之內,所以倘若消減N卡的流處理數量,其ROPs單元也隨之消減;而A卡則不一樣,其ROPs單元和流處理器單元是沒有關聯的。

第二個重要的概念:Shaders。傳統管線架構:以往顯卡由頂點渲染管線和像素渲染管線組成,生成圖像的過程都是先由頂點渲染管線中的Vertex Shader(頂點着色器)生成基礎的幾何圖形骨架(由三角形構成),然後再由像素渲染管線中的Pixel Shader(像素着色器)進行填色,最後才是像素渲染管線中的紋理單元進行貼圖。而當新的統一渲染架構提出之後,頂點着色器和像素着色器被合二為一,成為流處理器(Shaders),它將同時負責頂點着色和像素着色,避免了負載不均衡的情況發生。最先提出統一渲染架構的是微軟的DirectX 10。步入DX10時代,shader單元數量成為衡量顯卡級別的重要參數之一。

需要說明的是,N卡和A卡的所採取的核心架構是不一樣的,N卡採用的是MIMD架構。多指令流多數據流(MultipleInstructionStreamMultipleDataStream,簡稱MIMD),它使用多個控制器來異步地控制多個處理器,從而實現空間上的並行性,所以N卡是一個發射器;A卡採用的是SIMD架構設計,即Single Instruction Multiple Data(單指令流多數據流),A卡是將4個簡單指令+1個複雜指令打包,再用一個發射器發出。所以A/N兩者不能進行流處理器數量的簡單對比。

最後我們要解析的是像素填充率(Pixel Fillrate)和紋理填充率(Texture Fillrate)。

像素填充率是指圖形處理單元在每秒內所渲染的像素數量,單位是GPixel/S(每秒十億紋理)
像素填充率=核心頻率×光柵單元數目/1000

紋理填充速率是指在多邊形每個面上填充的顏色的紋理,單位是GPixel/S(每秒十億像素)
紋理填充率=核心頻率×紋理單元數目/1000

這兩個參數的值在GPU-Z中自然是越大則越能表明顯卡所能處理的能力越強悍。並且核心頻率是像素填充率(Pixel Fillrate)和紋理填充率(Texture Fillrate)的計算因數,顯然顯卡核心頻率越高,這兩個值越大。而其中的光柵單元數目即ROPs的值,ROPs的值越大,像素填充率也就越大。

二、顯存參數別忘了“位寬兄弟”

Memory Type(顯存類型),現如今,最新的主流高端級顯卡都採用的是GDDR5的顯存顆粒,之前主流的GDDR3顯存顆粒也正式退役至二線,而GDDR4顯存顆粒僅僅是個過渡型產品,市售的顯卡所見不多。GDDR5相對於GDDR3的核心優勢在於顯存帶寬大幅度提升。

顯存帶寬(Bandwidth)=(顯存位寬 ×顯存工作頻率)/ 8

從上面的計算公式我們可以清楚的看到,由於GDDR5顯存顆粒具備兩條數據總線,所以雖然採用的是和GDDR3同樣的8位預取機制,但顯存的工作頻率可以到達GDDR3的兩倍。最為典型的一個例子就是:採用GDDR5顯存的GT240顯卡要比採用GDDR3顯存的GT240顯卡性能領先16%左右,所以憑藉強大的帶寬優勢,GDDR5在同位寬的情況下可以全面超越GDDR3。

Bus Width(位寬)往往是玩家最容易忽視的一個概念。顯存位寬是顯存在一個時鐘周期內所能傳送數據的位數,位數越大則瞬間所能傳輸的數據量越大。可以說顯存位寬對顯卡性能的影響相比顯存容量而言要大不少。

顯卡顯存位寬的權重到底有多大?當顯卡都採用GDDR5顯存顆粒的時候,顯存位寬就成為了影響性能的關鍵瓶頸。

最後我們需要提醒玩家注意的是顯存容量(Memory Size)這個最經典的“騙局”,就是利用A卡的Hyper Memory(HM)或N卡的Turbo Cache(TC)的動態共享系統內存技術來謊稱顯卡的顯存容量,想必這樣的招數在進過前些年的“洗禮”之後,現在的不少消費者也逐漸對這樣的雕蟲小技都能夠很快的精準識別。

三、顯卡頻率:核心頻率>顯存頻率

顯卡的頻率,我們主要關注的是核心頻率和顯存頻率。兩者相比較而言,核心頻率對顯卡性能的影響權重較大。所以我們玩家在超頻的時候先提升的核心頻率,再才是顯存頻率。為什麼說核心頻率的重要性更大一些了?打個比方,核心頻率就相當於個人自身能力,而顯存頻率好比外在條件,而一個人的成功往往取決於個人能力而外在條件僅在一定程度上對其有影響,簡而言之:一個是內因而另一個是外因。

需要說明的是由於核心架構的設計不同,N卡的GPU核心頻率和Shader頻率呈現2倍的關係,而A卡的GPU核心頻率和Shader頻率是一致的。

顯存頻率是指默認情況下,該顯存在顯卡上工作時的頻率,以MHz(兆赫茲)為單位。

關於GDDR5顯存頻率,由於以往GDDR1/2/3/4和DDR1/2/3的數據總線都是採用的DDR技術(通過差分時鐘在上升沿和下降沿各傳輸一次數據),官方標稱的頻率X2就是數據傳輸率,也就是通常我們所說的等效頻率。而GDDR5則不同,它有兩條數據總線,相當於Rambus的QDR技術,所以官方標稱頻率X4才是數據傳輸率。比如GTX590官方顯存頻率是854MHz,而大家習慣稱之為3416MHz。

四、驅動、交火和其他運算能力

顯卡的性能的表現在有些程度上與顯卡驅動存在着一定的關係,因為GPU廠商會對顯卡做針對性的優化。所以我們推薦玩家選擇最新版的WHQL版驅動來體驗你的顯卡。

SLI和Crossfire技術提供了多卡互聯的技術解決方案。關於什麼樣的顯卡組建多卡互聯繫統會顯得更具性價比了?個人建議採用中斷顯卡組建系統會顯的更划算一些,當然資金充裕的話,採用中高端顯卡來組建多卡互聯繫統也可以,如果採用低端的顯卡來組建交火的話,這樣就不大太划算,因為可能低端顯卡組建的平台性能優勢才僅僅相當於中端卡的能力,而價格卻已經超過了單塊中端顯卡的價錢。

最後我們來看看Computing計算能力這一項,OpenCL(全稱Open Computing Language,開放運算語言)、CUDA(通用並行計算架構)、PhysX(物理加速)和DirectCompute 5.0(是一種用於GPU通用計算的應用程序接口)。

對比A卡,N卡在Computing這項的表現上顯得更加出色,N卡全部支持四項運算能力,而A卡僅支持一項DirectCompute 5.0。倘若玩家對藉助CUDA技術實現高清轉碼或者玩的遊戲需要PhysX物理加速技術的支持,那麼玩家可以考慮購買N卡,因為這些正是N卡所強勢的地方。

五、總結:“顯卡性能參數排排坐”

進過了前面詳細的介紹與分析,我們對顯卡的主要性能參數有了一個相對全面的認識和了解。玩家在購買顯卡的時候,可能對這麼多性能參數“有點暈”,所以我們有必要對這些顯卡性能參數的權重進行一個高低順序的排序。下面是筆者所總結的一個相對簡潔的顯卡性能排序:

①顯卡核心和製程

顯卡核心是關鍵,核心不行其他再好都是浮雲,核心先進那麼顯卡的性能自然會提升一個很大的檔次;製程越先進,顯卡的發熱量和功耗越低。

②流處理器和ROPs

流處理器數量上的增加或縮減對顯卡的性能影響可謂是立竿見影,所以GPU廠商也常常利用這一方法來對顯卡產品進行市場細分。ROPs數量的多數影響在遊戲畫面中的AA(抗鋸齒)和光影特效等方面。

③核心頻率和顯存頻率

核心頻率影響的是像素填充速率和紋理填充率,而顯存頻率影響的是顯存帶寬,兩者同時都作為影響因子,所以參數值越大,自然顯卡性能越強悍。不過過高的頻率設定對顯卡自身有一定影響,合理的頻率設定是我們所要選擇的顯卡。

④像素填充速率和紋理填充率

像素填充率=核心頻率×光柵單元數目/1000
紋理填充率=核心頻率×紋理單元數目/1000

⑤顯存位寬和顯存帶寬

顯存帶寬=工作頻率×顯存位寬/8(顯存帶寬 =顯存位寬×顯存頻率/8/1024)
顯存位寬越大,那麼瞬間所能傳輸的數據量越大。顯存帶寬的作用好比橋樑一樣,為顯示核心和顯存提供了一條交換數據的通道。

⑥顯存大小和其他參數

顯存太小的話會導致在遊戲過程中有幀數不穩定的顯示。

本文選自:中關村在線

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.