Specifikacije i hardverski deo
| Naziv | AMD Elite A10 6790K | Intel i5 4670K |
| Kodni naziv jezgra | Richland | Haswell |
| CPU Mikroarhitektura | 15h – Piledriver | Haswell/Broadwell |
| Bazna frekvencija [MHz] | 4000 | 3400 |
| Maksimalni turbo [MHz] | 4300 | 3800 |
| Turbo na svim modulima [MHz] | 4200-4300 (u zavisnosti od temperature) | 3800 (u zavisnosti od potrošnje) |
| Turbo na svim jezgrima [MHz] | 4200-4300 (u zavisnosti od temperature) | 3800 (u zavisnosti od potrošnje) |
| Frekvencija northbridge-a | 1,5 GHz, Garlic & Onion BUS | 3,4-3,8 GHz |
| L1 instrukcijski keš | 64KB L1 instrukcijski 2-way deljen u modulu | 32K L1 instrukcijski 8-way |
| L1 Data keš | 16KB L1 za podatke 4-way separatni, dva u modulu | 32K L1 instrukcijski 8-way |
| L2 keš | 2048 KB 16-way, deljen u modulu | 256K L2 8-way |
| L3 keš | N/A | 6144K L3 12-way |
| Proizvodni proces | GloFo 32nm HighK metal gate FD-SOI | Intel 22nm HighK Metal Gate |
| Radni napon | 0,8-1,4125 V (~1,37V u full load-u) | 0,6-1,2V |
| Deklarisani TDP [W] | 100 | 84 |
| Broj modula | 2 | Nije modularna arhitektura |
| Broj jezgara/threadova | 4 | 4 |
| Broj FPU operacija po kloku | 16 DP FLOP za FMA4 i FMA3, 8 DP FLOP za SSE i AVX | 64 DP FLOP za FMA3, 32 DP FLOP za AVX, 16 DP FLOP za SSE |
| Peak FLOPS za CPU (32-bit Single Precission za FMA) | 128 | 435,2 |
| Peak FLOPS za CPU (64-bit Double za FMA) | 64 | 217,6 |
| Broj „tredova“ | 4 | 4 |
| Broj tranzistora | 1,3 milijarde (uključujući integrisani GPU) | 1,44 milijarde (uključujući integrisani GPU) |
| Površina čipa | 246 mm kvadratnih | 177 mm kvadratnih |
| Ukupno cache-a | 2x64K L1 instrukcijski + 4x16KB L1 data + 2×2048 KB L2 (4288K total cache) | 4x32K L1 instrukcijski + 4x32K L1 data + 4x256K L2 + 6144K L3 (7424K total cache) |
| Memorijski kontroler | 2×64 bit 1866 MHz DDR3 | 2×64 bit 1866 MHz DDR3 |
| Platforma | Virgo | Lynx Point |
| Podnožje | 904 pin uPGA FM2 | Socket LGA 1150 |
| GPU deo | ||
| GPU arhitektura | Northern Island VLIW4 | Intel GT2 HD 4600 |
| Stream procesora / ALU’s | 384 | 160 |
| EU/SIMD jedinica | 6 x SIMD array (svaki po 64 FMA) | 20 EU (svaka po 8 ALU) |
| Teksturne jedinice (tekstura po kloku) | 6x4x2 (48) | 4x2x2 (16) |
| Teoretski Texel Fill Rate | 40,512 Gtex/s | 20 Gtex/s |
| Render Back Ends | 2 | 2 |
| Z/Stencil ROP-ova | 32 | 4 |
| Color ROP-ova | 8 | 2 |
| Teoretski Pixel Fill Rate | 6,752 GPIX/s | 5 GPIX/s |
| Klok | 844 MHz | 1250 MHz |
| FP performanse | 648,2 SP GFLOPS | 400 SP GFLOPS |
| FP performanse CPU + GPU | 779,4 SP GFLOPS | 835,2 SP GFLOPS |
| Max. brzina memorije | 29,76 GB/s | 29,76 GB/s |
| I/O link magistrala | PCI Express 16x v3.0 | PCI Express 16x v3.0 |
| BCLK klok | 100 MHz | 100 MHz |
| Dužina garancije [god.] | 3 | 3 |
| Cena ~ [€] | 105 | 185 |
| Kontakt | www.amd.com | www.intel.com |
Specifikacije jasno pokazuju kakav je balans između CPU i GPU blokova kod Richland i Haswell jezgara. FP performanse kada se računa CPU i GPU su otprilike jednake kod oba procesora, ali je CPU deo mnogo snažniji kod Intelovog procesora. Osim siroviih FP performansi, AMD-ov GPU ima znatno veći pixel i texel fill rate, što u prevodu znači da u slučaju korišćenja antialiasing-a, Devastator GPU bukvalno „devastira“ Intelov GT2. Sa ovakvom GPU arhitekturom Intelov integrisani GPU, čak i u najsnažnijoj Iris 5200 verziji ima premali fill rate za visoke rezolucije, pa je ovo ujedno i potencijalna limitacija što se tiče same skalabilnosti GPU-a.
Richland koristi dva Piledriver modula, koja po količini hardvera otprilike odgovaraju onome što se može naći u dva Haswell jezgra. Jedan modul sadrži jedan FPU blok, a broj FP operacija u PD modulu je dvostruko manji nego u Haswell jezgru, a praktično jednak kao u Sandy Bridge/Ivy Bridge-u ukoliko se kod Piledrivera koriste FMA3 instrukcije, a kod SB/IB AVX.
Haswell koristi po jezgru po dva 256-bitna FMA bloka koja su u stanju da obrade ukupno četiri 256-bitna vektora, dakle, ukupno 4×256-bita po jezgru vs 2×256-bita po PD modulu za FMA3. Ukupan broj jezgara je četiri, što znači da imamo 4x4x256-bita, u odnosu na A10 koji ima 2x2x256-bita, što daje teoretski četiri puta veću FP propusnu moć kod Haswell-a. Uz pomoć moćne Intelove kompajlerske podrške, učinjeno je da i sofver koji je optimizovan za FMA3 ne radi na AMD-ovim arhitekturama, odnosno radi, ali uz korišćenje starih 128-bitnih SSE2 instrukcija, što povećava razliku za još dva puta.
GPU, CPU i OpenCL kompajleri koriste sve prednosti i CPU i GPU bloka. GPU kod AMD-a poseduje 384 Stream procesora, od kojih svaki može da izvrši po jednu 32-bit FP FMA operaciju, što je ukupno 768 32-bitnih FP operacija po ciklusu, odnosno 650 GFLOPS-a na deklarisanom kloku. Intel Haswell GT2 sa 20 izvršnih jedinica, od kojih svaka poseduje po osam ALU-ova, može da izvrši maksimalno 160 FMA operacija po kloku, odnosno 320 FP operacija po kloku, što na deklarisanom taktu daje throughput od solidnih 400 GFLOPS-a, ali opet dosta manje nego što je slučaj kod AMD Devastator GPU-a. Naš overklokovan A10 ima teoretski „peak“ od 1120 GFLOPS-a, dok overklokovan Haswell daje teoretskih 1075 GFLOPS-a.



Podeli ovo! 









Dodaj komentar