Specifikacije i hardverski deo
Naziv | AMD Elite A10 6790K | Intel i5 4670K |
Kodni naziv jezgra | Richland | Haswell |
CPU Mikroarhitektura | 15h – Piledriver | Haswell/Broadwell |
Bazna frekvencija [MHz] | 4000 | 3400 |
Maksimalni turbo [MHz] | 4300 | 3800 |
Turbo na svim modulima [MHz] | 4200-4300 (u zavisnosti od temperature) | 3800 (u zavisnosti od potrošnje) |
Turbo na svim jezgrima [MHz] | 4200-4300 (u zavisnosti od temperature) | 3800 (u zavisnosti od potrošnje) |
Frekvencija northbridge-a | 1,5 GHz, Garlic & Onion BUS | 3,4-3,8 GHz |
L1 instrukcijski keš | 64KB L1 instrukcijski 2-way deljen u modulu | 32K L1 instrukcijski 8-way |
L1 Data keš | 16KB L1 za podatke 4-way separatni, dva u modulu | 32K L1 instrukcijski 8-way |
L2 keš | 2048 KB 16-way, deljen u modulu | 256K L2 8-way |
L3 keš | N/A | 6144K L3 12-way |
Proizvodni proces | GloFo 32nm HighK metal gate FD-SOI | Intel 22nm HighK Metal Gate |
Radni napon | 0,8-1,4125 V (~1,37V u full load-u) | 0,6-1,2V |
Deklarisani TDP [W] | 100 | 84 |
Broj modula | 2 | Nije modularna arhitektura |
Broj jezgara/threadova | 4 | 4 |
Broj FPU operacija po kloku | 16 DP FLOP za FMA4 i FMA3, 8 DP FLOP za SSE i AVX | 64 DP FLOP za FMA3, 32 DP FLOP za AVX, 16 DP FLOP za SSE |
Peak FLOPS za CPU (32-bit Single Precission za FMA) | 128 | 435,2 |
Peak FLOPS za CPU (64-bit Double za FMA) | 64 | 217,6 |
Broj „tredova“ | 4 | 4 |
Broj tranzistora | 1,3 milijarde (uključujući integrisani GPU) | 1,44 milijarde (uključujući integrisani GPU) |
Površina čipa | 246 mm kvadratnih | 177 mm kvadratnih |
Ukupno cache-a | 2x64K L1 instrukcijski + 4x16KB L1 data + 2×2048 KB L2 (4288K total cache) | 4x32K L1 instrukcijski + 4x32K L1 data + 4x256K L2 + 6144K L3 (7424K total cache) |
Memorijski kontroler | 2×64 bit 1866 MHz DDR3 | 2×64 bit 1866 MHz DDR3 |
Platforma | Virgo | Lynx Point |
Podnožje | 904 pin uPGA FM2 | Socket LGA 1150 |
GPU deo | ||
GPU arhitektura | Northern Island VLIW4 | Intel GT2 HD 4600 |
Stream procesora / ALU’s | 384 | 160 |
EU/SIMD jedinica | 6 x SIMD array (svaki po 64 FMA) | 20 EU (svaka po 8 ALU) |
Teksturne jedinice (tekstura po kloku) | 6x4x2 (48) | 4x2x2 (16) |
Teoretski Texel Fill Rate | 40,512 Gtex/s | 20 Gtex/s |
Render Back Ends | 2 | 2 |
Z/Stencil ROP-ova | 32 | 4 |
Color ROP-ova | 8 | 2 |
Teoretski Pixel Fill Rate | 6,752 GPIX/s | 5 GPIX/s |
Klok | 844 MHz | 1250 MHz |
FP performanse | 648,2 SP GFLOPS | 400 SP GFLOPS |
FP performanse CPU + GPU | 779,4 SP GFLOPS | 835,2 SP GFLOPS |
Max. brzina memorije | 29,76 GB/s | 29,76 GB/s |
I/O link magistrala | PCI Express 16x v3.0 | PCI Express 16x v3.0 |
BCLK klok | 100 MHz | 100 MHz |
Dužina garancije [god.] | 3 | 3 |
Cena ~ [€] | 105 | 185 |
Kontakt | www.amd.com | www.intel.com |
Specifikacije jasno pokazuju kakav je balans između CPU i GPU blokova kod Richland i Haswell jezgara. FP performanse kada se računa CPU i GPU su otprilike jednake kod oba procesora, ali je CPU deo mnogo snažniji kod Intelovog procesora. Osim siroviih FP performansi, AMD-ov GPU ima znatno veći pixel i texel fill rate, što u prevodu znači da u slučaju korišćenja antialiasing-a, Devastator GPU bukvalno „devastira“ Intelov GT2. Sa ovakvom GPU arhitekturom Intelov integrisani GPU, čak i u najsnažnijoj Iris 5200 verziji ima premali fill rate za visoke rezolucije, pa je ovo ujedno i potencijalna limitacija što se tiče same skalabilnosti GPU-a.
Richland koristi dva Piledriver modula, koja po količini hardvera otprilike odgovaraju onome što se može naći u dva Haswell jezgra. Jedan modul sadrži jedan FPU blok, a broj FP operacija u PD modulu je dvostruko manji nego u Haswell jezgru, a praktično jednak kao u Sandy Bridge/Ivy Bridge-u ukoliko se kod Piledrivera koriste FMA3 instrukcije, a kod SB/IB AVX.
Haswell koristi po jezgru po dva 256-bitna FMA bloka koja su u stanju da obrade ukupno četiri 256-bitna vektora, dakle, ukupno 4×256-bita po jezgru vs 2×256-bita po PD modulu za FMA3. Ukupan broj jezgara je četiri, što znači da imamo 4x4x256-bita, u odnosu na A10 koji ima 2x2x256-bita, što daje teoretski četiri puta veću FP propusnu moć kod Haswell-a. Uz pomoć moćne Intelove kompajlerske podrške, učinjeno je da i sofver koji je optimizovan za FMA3 ne radi na AMD-ovim arhitekturama, odnosno radi, ali uz korišćenje starih 128-bitnih SSE2 instrukcija, što povećava razliku za još dva puta.
GPU, CPU i OpenCL kompajleri koriste sve prednosti i CPU i GPU bloka. GPU kod AMD-a poseduje 384 Stream procesora, od kojih svaki može da izvrši po jednu 32-bit FP FMA operaciju, što je ukupno 768 32-bitnih FP operacija po ciklusu, odnosno 650 GFLOPS-a na deklarisanom kloku. Intel Haswell GT2 sa 20 izvršnih jedinica, od kojih svaka poseduje po osam ALU-ova, može da izvrši maksimalno 160 FMA operacija po kloku, odnosno 320 FP operacija po kloku, što na deklarisanom taktu daje throughput od solidnih 400 GFLOPS-a, ali opet dosta manje nego što je slučaj kod AMD Devastator GPU-a. Naš overklokovan A10 ima teoretski „peak“ od 1120 GFLOPS-a, dok overklokovan Haswell daje teoretskih 1075 GFLOPS-a.
Dodaj komentar