|
|||
|
Radeon HD 5000 Evergreen長青木,Radeon HD 6000 Northern Islands(加勒比海)北方群島,不經不覺ATi已推出了六代具備高清能力的顯示晶片。2012年,Radeon昂然踏入HD 7000族系,AMD(ATi)較早前公布四個開發代號的名稱。這四個名都是地名,分別位於澳洲以東,南太平洋的島嶼,因此合稱為「Southern Islands」南方群島。四個名分別是Tahiti大溪地(高階)、Pitcairn皮肯特島(進階)、Cape Verde維德角(主流)及雙GPU的New Zealand紐西蘭,佔用型號名稱由7900至7700。至於更低階的7500/7600、7400及7350便分別由6000系列的Turks,Caicos及5000系列的Cedar PRO易名而來。由此可見,整個7000系列產品以7700為分水嶺,新產品集中在較高階的型號中(請參看附圖)。整體來說,四個新代號的產品除主介面由PCI Express 2.1改為PCI Express 3.0,速度由16GB/s上升一倍至32GB/s;支援DirectX 11.1及改用TSMC最新28mm high-K metal gate(TSMC的CLN28HP(HKMG))製程之外,在Front-End,運算架構,多媒體播放及輸出連接各部分都得到明顯的強化。 | |||
|
|
|||
|
GCN Front-End結構更緊密 先講講Front-End部分,其設計與上一代Radeon HD 6900 Cayman並不相同。Cayman的主要為分兩個Graphics Engine,每個Engine各有相同的部件。而Southern Islands Tahiti的Front-End部件經過重新編排,而且更為緊密:兩個ACE(Asynchronous Compute Engine),兩個Geometry Engine(內有Geometry、Vertex Assembler各一及一個第九代Tessellator密鋪平面器)和兩個Rasterizer(內有Scan Converter和Hierarchical-Z各一)。結構當中重點是第九代Tessellator,AMD聲稱其效能可達第八代的4倍,連同第八代Tesellator的效能是第七代(6870 Barts)的兩倍,Southern Islands產品的密鋪平面能力最高是Northern Islands的七至八倍。如果屬實,實際效果將會十分明顯。 | |||
|
|
|||
|
GCN結構更緊密 Southern Islands最主要的改變是轉用了GCN(Graphics Core Next)的運算架構,此架構早應用於Llano APU。負責運算的部件稱為「Graphics Core Next Compute Unit」,簡稱「Compute Unit」。設計者設計新引擎的出發點是需要一個「Scalable Multi-Task」的圖像引擎,注重擴充性(Scalability)及靈活性(Flexibility),於是放棄Evergreen及Northern Islands沿用的VLIW(VLIW5及VLIW4)運算模式,改用傳統x86 ISA的Scalar及Vector運算模式,這亦是新引擎的核心。每個GCN Compute Unit內大可以分為六個部分:1. Branch and Message Unit;2. Scheduler;3. Scalar Unit連Register;4. Vector Unit連Register;5. Texture部件及6. CU Data L1 Cache。Branch and Message Unit專負處理Branch程序及輸出信息(包括Debug或同步信息);雖然在上一代Cayman的TeraScale 3架構中,將Ultra-Threaded Dispatch Processor的數量增加一倍至兩個,而在Tahiti的GCN架構中,每個GCN各有一個Scheduler,即Scheduler數量與所開動的Compute Unit數量掛鈎。以效能最高的Tahiti XT為例,Scheduler數量與GCN Compute Unit數量一樣共有32個。根據APU的GCN架構,這個Scheduler應該包括以下幾個部分:Instruction Fetch Arbitrator,4個SIMD PC(Program Counter)& IB(Instruction Buffer),Intruction Arbitrator和4個Decoder(Export/GDS Decode,LDS Decode,Scalar Decode和Vector Decode)。即是指令經過Prefetch預取及Decode解碼後,便會按屬性泵入不同的地方進行暫存或處理。 | |||
|
GCN運算部件是x86 ISA設計 Compute Unit內的Scalar Unit及Vector Unit就是負責運算的核心。Scalar Unit內有一個ALU,配以4KB Register(APU時發表的GCN卻是8KB),負責處理32/64bit Scalar整數運算;Vector Unit採用新型的「SIMD-16」,配以64KB Register。SIMD-16是Multi-Precision(MP,多精度)設計,每個時脈可同時處理16個32bit單精度(Single Precision)IEEE浮點(IEEE 754-2008)或32bit整數運算。根據官方資料,如果將GCN Compute Unit(4x SIMD-16)與TeraScale 3引擎的SIMD引擎(16x VLIW4)比較,大家同是64 Single Precision MAC(multiply-accumulate)運算,前者只需要標準的編寫器及優化方法,較容易Debug和分析,開發的時間及成本也較少,而且效果較能預料,更有利於軟件商開發複雜的遊戲。新設計在效能上亦有所提升,以7970為例,32個Compute Unit行925MHz,單精度運算效能(Single Precision Compute Power)達到3790GigaFLOPs/s,比上一代6970 Cayman高得多(2700GigaFLOPS/s),而雙精度運算效能(Double Precision Compute Power)便達到947 GigaFLOPS/s,比6970 Cayman(683 GigaFLOPS/s)提升接近40%;與Cayman一樣,TMU(Texture Mapping Unit)貼住運算部件,每個GCN的Compute Unit都有4個Texture Filter Unit和4x4個Texture Fetch Load/Store Unit,大可以睇成為「4個TMU」。以最高規格的7970 Tahiti XT,內有32個Compute Unit,即一共有128個TMU,比6970(24 x4 = 96個);最後還有16KB(4組,每組64 line,每line 64Byte)的L1 Read/Write Cache,同來暫存Vector Unit的資料。 | |||
|
|
|||
|
|
|||
| 查詢: AMD: http://www.amd.com |
| 歡迎光臨 SAY討論區 (http://say.go2tutor.com/) | Powered by Discuz! X2 |