drfedja
CPU Guru
- Učlanjen(a)
- 01.04.2009.
- Poruka
- 3.084
- Rezultat reagovanja
- 14
Moja konfiguracija
PC / Laptop Name:
Dell n5010, Intel Core i3 370M 2.4 GHz, 4 GB DDR3 1333
CPU & cooler:
Intel Core i7 4790K @ 4.5 GHz
Motherboard:
Biostar Hi-Fi Z97WE
RAM:
16GB Kingston HyperX Beast 2400
VGA & cooler:
Sapphire AMD Radeon R9-280X
Display:
Viewsonic VA2342 23" LED, LG 25"Ultrawide, Samsung VA2342 23"
HDD:
Samsung SSD850 Evo 250GB, Kingston 120GB V300 SSD, 2x1GB WD Caviar black
Sound:
Altec Lansing 5100E
Case:
Cooler Master 690-III
PSU:
Cooler Master G650M modular
Optical drives:
N/A
Mice & keyboard:
Keyboard/Mouse Cooler Master Storm
Internet:
Cable
OS & Browser:
Windows 10 Pro 64-bit
Other:
iPhone 6S 64GB
Gledaj ovako.... sa 33% istih jezgara vise ne dobijas 33% performansi, zbog ogranicenja kao sto su memorijski protok, paralelizovanost podataka itd...Znam da su stari, video sam skorije screenshotove, koji pokazuju jos gore skaliranje. Imaju izgleda problema sa tim procesorom, nazalost. Ne mogu da nadjem te slike, mozda su obrisani.
Oni gledaju da dobiju 33% bolje performanse od phenoma X6, po recima Johna Frueha, jer toliko ima vise jezgara (octo core), cemu onda drndanje oko nove arhitekture...
I jednostavno, ako smatraju da pariraju intelu u ozbiljnim aplikacijama (iako se u principu za to koriste Tesle), moraju vise da iskoriste FP.
U slucaju dobre paralelizacije sa 33% jezgara mozes dobiti oko 22-25% performansi sa istim jezgrima. Za CMT arhitekturu 33% vece perfromanse u proseku su dobar rezultat.
Throughput je nesto sasvim drugo. To je kolika je maksimalna propusna moc ovih jezgara. Tako npr. sa 33% vise jezgara imas oko 30-33% veci throughput u zavisnosti od frekvencije tih jezgara.
AMD je najavio 50% veci throughput sa 33% vise jezgara. Dakle u ovo ulazi i veca frekvencija. Npr. ako Magny Cours radi na 2.2 GHz, a Interlagos sa 16c radi na 2.3 GHz, on bi trebalo da da oko 35% vise performansi i 50% veci throughput, sto je ekvivalentno broju od 18 K10 jezgara.
Fermi ima manji FP throughput od npr. Caymann arhitekture, ali ima fancy apple like marketing.
I to je potpuno druga strana medalje, na kojoj AMD takodje radi - GPGPU procesoranje. Npr. Interlagos moze da napuni 8x2.3x16 GigaSP operacija, tj. oko 294 GFLOPS-a. Ako imas server sa 4 socketa, taj ti daje FP throughput od 1.1 TFLops. Caymann GPU npr. 6970 gura 2.7 TFLOPS-a u SP, ali DP - double precision ima "675" GFLOPS-a.
Poredjenja radi 4P Interlagos ima 588 GFLOPS-a i daleko bolje serijske performanse nego GPU. Dakle, CPU se koristi za serijske workloade, a GPU za paralelizovane. OpenCL u principu koristi snagu i procesora i GPU-a.
Kada porede Interlagos i MC, MC daje po procesoru 48 DP operacija / ciklusu , dok Interlagos daje 64 DP operacije po ciklusu. To je FP throughput. Ako ima 13% veci klok, to ti je okruglo 50% veci throughput. Npr, 2.5 GHz Interlagos vs 2.3 GHz Opteron MC.
Poslednja izmena: