RDNA u punom sjaju
Jedna od prvih stvari koju je AMD odradio izradom nove generacije čipova u 7nm je pre svega optimizacija potrošnje energije, tj. povećanjem energetske efikasnosti u odnosu na poslednju generaciju GCN Vega 10/20 čipova.
PPC iliti performance per clock donosi do 50% veće performanse uz istu potrošnju energije, kao i redukovane latencije kroz ceo čip koje povećavaju sam bandwidth za veću iskoršćenost resursa i pipeline optimizacije koje nam donose već spomenuti PPC koji je svakako za pohvalu. Generalno, samim prelaskom na 7nm proizvodni proces (Infinity fabrics) nova NAVI arhitektura i nova RDNA (Radeon DNA) tehnologija nam donose performanse koje su generalno bolje u odnosu na Vega grafičke karte uz daleko manje potrebne energije. Samo posmatrajući duplo manji proizvodni proces, PPC i redukovane latencije na celom čipu, ovo već izgleda prilično impresivno.
NAVI i RDNA su u potpunosti nov grafički čip i nova generacija koja nam predstavlja i potpuno nove računarske jedinice (CU / computing units) koje bukvalno isporučuju duplo veći instruction rate uz pomoć duplo više jedinica za skaliranje i duplo više scheduler-a za izvršavanje. Sada imamo situaciju gde dve CU jedinice mogu biti paralelno iskorišćene za izvršavanje proračuna gde svaki CU poseduje 64 streaam procesora – ovo znači da NAVI 10 čip sa 40 CU-ova u slučaju RX 5700XT karte ima 2560 jezgara / stream procesora.
Ako posmatramo Vega 64 čip koji ima 4096 sttream procesora, ova brojka deluje ne tako impresivno, ali šta to konkretno znači? Ako uporedimo GCN i NAVI arhitekturu, sada imamo grafičke karte koje su do 14% procenata u odnosu na Vega 64 grafičke čipove sa dosta manjom potrošnjom.
Gledano u broj SP-ova, lako dolazimo do zaključka da je nova rDNA tehnologija donela fantastično ubrzanje, 2560 stream procesora je brže od 4096 stream procesora prethodne generacije uparene sa HBM memorijom i uz to daleko manju potrošnju energije.
Sama površina grafičkog čipa je sa 495mm2 „spala“ na svega 251mm2 uz skoro pa isti broj tranzistora (10.3 milijarde) uz pomoć 7nm litografije.
RDNA arhitektura donosi i dosta novih rešenja te sa NAVI generacijom čipova imamo podršku za PCIe 4.0 verziju, te po prvi put korišćenu GDDR6 memoriju na AMD Radeon grafičkim kartama uz već spomenutu 7nm litografiju.
Korićenjenje 7nm procesa, GDDR6 memorije nam donosi masivnih 448GB/s memorijskog bandwidth-a, kao i do dva puta veći propusni opseg na PCIe liniji u odnosu na PCIe treće generacije.
Radeon Display Engine nam donosi i podršku za nove visoke rezolucije uz HDR podršku, kao i novi nivo kompresije. Radeon MultimeMedia endžin predstavlja novi perfektno konzitentni i koherentni streaming, kao i unapređeni enkoding.
Sama RDNA arhitektura je predstavila i potpuno nove compute unit-e, multilevel cache hijerarhiju kao i potpuno nov grafički endžin za streaming. Model RX 5700Xt ima 40 RDNA CU-ova, 80 scalar procesora, 2560 stream procesora i 160 bilinear filter unit-a. Takođe, dobili smo i oprimizaciju multilevel cache-a kao i Delta Color Compression (DCC everywhere). Streamlined grafički endžin sada poseduje ii geometrijski endžin sa 4 primarna shader-a za izlaz i 8 primarnih shader-a za ulaz, kao i 64 pixel jedinice. Nova reoganizacija podrazumeva i četiri asinhrona compute endžina što sve zajedno omogućava izbalansiranu distribuciju i redistribuciju radnih zadataka unutar čipa uz dizajn za rad na visokim frekvencijama pri niskoj potrošnji.
Tu je i dva puta brža vektorska i skalarna instrukciona količina podataka, novi single cycle instruction za rešavanje problema i dual wave 32/64 nodovi.
Novom reorganizacijom računarskih jedinica su dodatno optimitovane i performanse u radu sa single thread zadacima a RDNA CU je sa ovim dizajnom dobio scheduler-e između vektorske i skalarne jedinice pored TMU jedinica i jedinica za teksture koji sada koriste skalabilni cache za podatke uz lokalni cache koji je share-ovan unutar CU-a.
Jedinice za izvršavanje su dobile dve SIMD32 (single input, multiple data) jedinice, 2 dve SIMD 8 kedomococe za specijalne funkcije te po dve jedinice za skalarni i vektorski dekoding, te 256KB VPGR.
Sve radne jedinice u wave64 ciklusu sada imaju priliku da obrađuju zadatke na svaka četiri takta zbog hardverskog interleaving-a. SFU (Special Function Unit) jedinice sada mogu da alternativno izvršavaju proračune na ¼ svakog takta a talas informacija sa SIMD jedinica ima priliku da završi svaku skalarnu instrukciju na svaka četiri takta.
Vectorske jedinice u wave32 za razliku od skalarnih sada mogu da izvršavaju naredbe prilikom svakog takta dok SFU kod njih može preuzeti jedan „issue“ cycle i izvršiti ga paralelno. Ovo je omogućeno time što svaka je SIMD jedinica „opremljena“ skalarnom jediniciom za izvršavanje instrukcija pri svakom ciklusu instrukcija.
Kada je novi multilevel cache u pitanju, sada su unificirane sve aplikativne funkcije što uz bolji cache menadžment smanjuje ukupnu latenciju i omogućava dosta viši bandwidth uz smanjenu potrošnju energije kao i ono najbitnije, obezbeđuje najkraći mogući put za ivršavanje instrukcija uz redukovanje pomeranje podataka.
Radeon Display Engine predstavlja i FreeSync 2.0 uz HDMI 2.0 i Display Port 1.4 portove sa podrškom za HDR kako i mogućnost direktnog iščitavanja DCC compresovanih površina. HDR displeji visoke rezolucije podrazumevaju 4K podršku do 240Hz ili 8k 60Hz uz pomoć jednog kabla.
Što se tiče striminga, ni tu nije prošlo bez noviteta te je dosta unapređeno i enkodiranje streaming sadržaja. Predstavljen je novi HDR/WCG encode (HEVC), 8k encode (HEVC & VP) uz povećanje brzine enkodiranja od 40%.
Naravno, nisu zapostavljena ni razna poboljšanja unutar AMD Adrenalin softvera, te putem istog možete uraditi sve što poželite – od standardnog podešavanja profila sve do overkloka. Kad smo kod overkloka, aplikacija Wattman vam nudi zaista atraktivne opcije i overklok „on the fly“.
To znači da čak i tokom igranja možete pozvati Wattman aplikaciju i dok igra radi, uraditi overklok grafičke karte, ali i undervolt. To znači da možete smanjivati radni napon samog GPU-a pre ili tokom igranja radi testiranja. Odlična opcija i što je najbolje od svega, radi perfektno.
Ah, da, da ne zaboravimo. Putem Wattman-a imate i opcije za manuelni overklok ukoliko ste dovoljno iskusni a ukoliko ipak zazirete od ovakvih avantura, aplikaciji možete prepustiti da automatski overklokuje GPU ili memoriju – sjajno rešenje i praktično bezbolno, na svega par klikova.
Dodaj komentar