AMD nastavlja sa optimizacijama
Ne sumnjamo da je ovogodišnja ponuda grafičkih akceleratora ostavila bilo koga ravnodušnim. AMD sa svojim „refresh“-om i aktuelnom serijom 6850 i 6870 grafičkih karti, sa druge strane nVIDIA sa svojim čuvenim Fermi čipom (GF100) i njenim derivatima (GF110), ostavili su veliki broj korisnika u nedoumici šta pazariti. Izbor definitivno nije bio lak…
DirectX 11, 40 nm proizvodnja, korišćenje GDDR5 memorije su već uveliko postali standard kada je reč o poslednjim generacijama grafičkih karti. AMD je pre nepunih dva meseca predstavio Northern Island verziju čipa, koja je ustvari unapređena verzija uveliko poznate i dosada najuspešnije serije grafičkih čipova – Evergreen. Uhodani 40 nm proces, dodatna optimizacija već odličnog GPU-a, doneli su nam Barts čipove, tačnije Barts PRO i Barts XT koji su činili seriju 6850/6870. O unapređenjima arhitekture i primeni novih tehnologija mogli ste da čitate u testu AMD Radeon HD6850 i HD6870, dok je pred Vama AMD Radeon HD6950.
Oko predstavljanja Cayman čipa koji treba da pokreće Radeon HD6900 seriju bilo je dosta špekulacija širom interneta, dosta pisanja po forumima, a sa obzirom šta je AMD postigao optimizacijom već postojećeg Evergreen čipa, očekivanja mase su bila zaista velika.
Da situacija bude još napetija, potrudila se i nVIDIA predstavljanjem svojih optimizovanih, i možemo slobodno reći, Fermi GPU-ova u punom sjaju, gde je konačno predstavljena grafička karta sa svih 512 CUDA jezgara koliko je Fermi ćip trebao inicijalno da ima. Predstavljen je GTX 580, nedugo zatim i GTX 570 sa manjim brojem CUDA jedinica, ali opet bolji od prethodnika, GTX 480 grafičke karte.
Mnogi su sa razlogom počeli da razmišljaju na glas, koliko daleko može otići AMD sa svojim Cayman čipovima i koliko sirove snage i novih unapređenja može doneti Cayman GPU, odnosno nova 6900 serija.
NVIDIA je rekla svoje, a dugo očekivani naslednik Evergreen serije je konačno tu pred nama u svom punom sjaju, dame i gospodo – AMD Radeon HD6950.
Prilikom konstruisanja novog GPU-a AMD je išao napred sa jasnim ciljem; napraviti efikasnu grafičku i compute arhitekturu, masivne performanse u iscrtavanju poligona, nova poboljšanja u kvalitetu prikaza i za kraj naravno, novi power menadžment kao dobar odnos performansa po W.
Dok je na seriji 6800 upotrebljena VLIW5 arhitektura (VLIW – very long instruction word, shader jedinice 5-way tipa), kod serije 6900 je primenjen nešto jednostavniji VLIW4 (4-way shader jedinice) ali je njihov broj dosta veći. Tačnije Radeon HD6950 poseduje 1408 stream processing jedinice, ima 32 ROP-a i radi na prilično visokih 800MHz, dok memorija ima klokove od 1250MHz (5GHz efektivno!). Naravno, komunikacija sa memorijom je i dalje 256bit-na.
Tu su 22 SIMD (Single Instruction Multiple Data)bloka, od kojih svaki ima po 16 thread processing jedinice i unutar svakog od njih po četiri aritmetičke jedinice (tako i dolazimo do konačnih 1408 streaming procesor jedinica ( 22 x 16 x 4 = 1408,) 88 teksturnih jedinica, 256bit magistrala, te 32 ROP-a i 128 Z-Stencil jedinica, kao i double engine processing jedinice sa asinhronim dispatch jedinicama.
Pošto se radi o 4-way instrukcijama i gore spomenutoj matematici procesorskih jedinica ( 22 x 16 x 4 = 1408), sada je jasno zašto Cayman čipovi neće imati u slučaju HD 6970 grafičke karte 1920 streaming processor jedinica, već broj od 1536 ( 24 x 16 x 4 = 1536). Za „dvostruki čip“ koji bi trebao biti predstavljen početkom sledeće godine, kodnog imena Antilles, spominje se brojka od 2 x 1920 procesorskih jedinica, što nam govori da će verovatno biti primenjene VLIW5 instrukcije, kao kod serije 6800 i Barts jezgra. Antilles – 2 x 6800 ili 2 x 6900, ostaje da vidimo!
Novi dizajn jezgra je omogućio upotrebu nešto jednostavnije VLIW4 arhitekture koja je ovaj put bolje optimizovana i bolje iskorišćena. Zahvaljujući novim dispatch jedinicama omogućeno je da se sve operacije unutar jednog thread-a paralelno izvršavaju u svakoj SIMD jedinici. Unapređenei su i Render Back End funkcije što je doprinelo dodatnom unapređenju performansi i kvalitetu Antialiasing-a. Kod Cayman generacije više neće biti T-unit-a, dakle bez posebne jedinice za ALU proračune, tako da će sada sve procesorske jedinice raditi zajedno i imati podjednake mogućnosti proračuna što je dosta efikasnije rešenje (i jednostavnije) od jedne zasebne jedinice za takve proračune. Texture i Vertex Fetch operacije se kao i u slučaju serije HD 6800 izvršavaju odvojeno, dakle tu nije bilo nekih bitnih promena. Reorganizacijom čipa postignuto je i 10% poboljšanja u performansama po mm2 u odnosu na Barts.
Poboljšanji Render Back-End (Z-Stencil keš memorija, kao i keš za boje) nam donose 16-bit integer (unorm/snorm) gde su proračuni dva puta brži, kao i 32-bit FP (single/double) ops koji su u proseku 2-4 puta brži u odnosu na prethodnu generaciju.
Tu su i unapređenja u segmentu GPU compute-a, novi čip donosi podršku za asinhroni „dispatch“ – u svakom SIMD bloku moći će da se izvršavaju paralelno višestruki računarski kerneli; svaki kernel će imati svoj komandi „queue“ i možemo tako reći, „zaštićeni“ virtuelni prostor i adresu gde će se izvršavati. Dvostruki (bidirectional) DMA endžini (eng: engine) omogućavaju mnogo bržu komunikaciju pri upisu i čitanju iz sistemske memorije kao i nešto brže double precision operacije.
Memorijski kontroler nije pretrpeo značajne promene u odnosu na Cypress, te su tu i dalje četiri memorijska kontrolera širine 64 bita. Dodatnom optimizacijom omogućen je rad sa još većim radnim frekvencijama memorije, ali i još napredniji power menadžment koji je omogućio dosta niže napone potrebne za rad u 2D okruženju, Radeon HD 6950 u idle modu troši svega 20W!
Jedna od boljki Evergreen serije čipova, pa možemo slobodno reći i Barts-a, bio je Massive Geometry Performanse – narodski rečeno teselacija. Barts i serija 6800 jesu doneli značajno ubrzanje u odnosu na Cypress ali opet ne dovoljno da bi bilo konkurentno rešenjima suparničkog tabora. Hardverski tesselator-i su prisutni već neko vreme u AMD čipovima (RV870), ali do sada nije bio toliki akcenat na istima.
AMD koristi teselaciju na specifičan način – Tesselatre the right way – objekti koji su u blizini posmatrača se ekstremno proračunavaju u samom tesellation endžinu, dok se objekti koji su u daljini i van fokusa posmatrača teseluju u dosta manjoj količini.
Ako je kod Barts-a ubrzanje bilo dobro u odnosu na Cypress, sada je još bolje. Dual-rate geometry čip za teselaciju osme generacije donosi prilično vidljiv dobitak u performansama. Možemo slobodno reći da je AMD naučio lekciju na pravi način!
Da Vas ne bi previše zamarali tehničkim specifikacijama teselatora, demistifikovaćemo Vam sve kroz bateriju testova koja će uslediti.
Dodaj komentar