| Hardver | Procesori | AMD A10 7850K
Procesori

AMD A10 7850K


Analiza performansi

 

Steamroller vs Piledriver

AMD nam je sa Steamroller-om obećao prevashodno bolje single thread performanse, međutim izjava PR zvaničnika izgleda da ne „drži vodu“ baš uvek. Ako bolje pogledamo, sam single thread nije previše unapređen. I dalje je tu 16KB L1-D keša, dve integer ALU, dve 128-bitne FMA FP jedinice, identična keš arhitektura. Neke optimizacije su zaista urađene – poboljšan branch prediction, veći L1 instrukcijski keš, veći „store“ bandwidth, itd…

 

IPC-singlethread

 

Ubrzanje u single thread-u se ogleda najviše u integer workload-ima, kao što su svakodnevne operacije, gejming isl i tu razlika iznosi oko 10%, a u većini slučajeva ta razlika je od 0-15% za single thread, dok je za multithread priča nešto drugačija:

 

IPC-multithread

 

Multithreading je naravno znatno unapređen u modulu zbog manje deljenih resursa i više paralelizma. Integer operacije su svakako brže jer troše manje deljenih resursa, dok je floating point nešto manje ubrzan, što svakako ima smisla – dva jezgra u modulu dele jedan FPU blok. Takođe i operacije koje zahtevaju dosta rada sa memorijom nisu naročito ubrzane. Tako na primer 7-Zip daje relativno malo ubrzanje od nekih 6,4 % klok za klok, dok je WinRAR sporiji zbog povećane latencije memorijskog kontrolera. Razlog za povećanje latencije najverovatnije leži u translaciji memorijskih adresa za GPU, odnsono HSA implementaciji. Sa druge strane, ako pogledamo kakve beneficije dobijamo uz pomoć HSA, usporenje u WinRAR-u od nekoliko procenata ne predstavlja toliki problem.

 

Uticaj RAM-a na GPU

Grafički čipovi su oduvek na diskretnim grafičkim kartama koristili memoriju ogromne brzine, ali i dizajn samo diskretnog GPU-a je takav da koristi nekoliko 64-bitnih memorijskih kontrolera za komunikaciju sa lokalnim RAM-om. CPU, odnosno APU koji koristi standardnu JEDEC specifikaciju za memorijske module je teško upariti sa četvorokanalnom GDDR5 memorijom iz prostog razloga jer bi u tom slučaju imali integrisanu memoriju na matičnoj ploči. To bi svakako povećalo cenu matične ploče jer implementacija većeg broja memorijskih kanala zahteva i komplikovaniji dizajn, koji bi na najoptimalniji način sproveo vodove do memorijkih čipova. Možda bi u nekoj praksi bilo izvodljivo da imamo APU sa 8 GB GDDR5 memorije i APU „zalemljenim“ na PCB, ali to ovde ipak nije slučaj, jer je ovo desktop matična ploča, a ne Sony Playstation. Na desktop platformi smo ograničeni memorijskim standardom, tako da kao izbor imamo memorijske module brzine do nekih 2400 MHz, a u nekim slučajevima i više. FM2+ platforma bez problema podržava brzine memorije do ovih 2400 MHz, a za više od toga neophodan je overklok BCLK-a, što ne preporučujemo. Evo kako brzina RAM-a utiče na performanse u pojedinim gemerskim naslovima:

 

GPUvsRAM

GPUoc vs RAM

 

Ako malo bolje pogledamo videćemo da je razlika u performansama GPU-a na stock vrednostima sa DDR3 1600 i overklokovanim na 2400 čak 40%, dok je na default podešavanjima ta razlika oko 30%. Dakle, za dobro skaliranje pri overklokingu veoma je preporučljivo da imate i brz RAM, inače dobici neće biti previše veliki. Tako na primer pri overkloku GPU-a razlika između DDR3 2400 i DDR3 1600 je u Bioshock-u oko 38%, dok je default vrednostima ta razlika iznosi 31%. Dakle, jasno je da se potreba za memorijskim protokom povećava sa povećanjem brzine GPU-a.

 

AMD Kaveri A10 7850K 08 T

 

A sad možemo da sumiramo utiske…

 

Ivan Vujić

Software, storage, network etc editor @ AXE
Database migration @ RC ETF

Dodaj komentar

Kliknite ovde da biste poslali komentar