drfedja
CPU Guru
- Učlanjen(a)
- 01.04.2009.
- Poruka
- 3.084
- Rezultat reagovanja
- 14
Moja konfiguracija
PC / Laptop Name:
Dell n5010, Intel Core i3 370M 2.4 GHz, 4 GB DDR3 1333
CPU & cooler:
Intel Core i7 4790K @ 4.5 GHz
Motherboard:
Biostar Hi-Fi Z97WE
RAM:
16GB Kingston HyperX Beast 2400
VGA & cooler:
Sapphire AMD Radeon R9-280X
Display:
Viewsonic VA2342 23" LED, LG 25"Ultrawide, Samsung VA2342 23"
HDD:
Samsung SSD850 Evo 250GB, Kingston 120GB V300 SSD, 2x1GB WD Caviar black
Sound:
Altec Lansing 5100E
Case:
Cooler Master 690-III
PSU:
Cooler Master G650M modular
Optical drives:
N/A
Mice & keyboard:
Keyboard/Mouse Cooler Master Storm
Internet:
Cable
OS & Browser:
Windows 10 Pro 64-bit
Other:
iPhone 6S 64GB
256-bitna operacija ce morati da ide u 2 ciklusa, jer je sirina portova L1 kesa 128-bitna. Zbog toga se 256-bitna instrukcija dekodira u 2 makroopa. Kako je fectch 32 bajta, odnosno 256 bita, to dozvoljava 2x128-bit load iz L1 kesha. Tako je moguce ucitati 1x128bit instrukciju i 1/2x256-bit. Za drugu polovinu 256-bitne instrukcije bice potreban jos jedan ciklus, pa se ovakva instrukcija deli na dva makroopa - double dispatch.Mene zanima kako se Bulldozer snalazi sa SSE instrukcijama. Bulldozer bi tu terbao da donese drasticno unapredjenje u odnosu na K10, zahvaljujuci FMAC-ovima od 2x128 bitova (koji se po potrebi unifikuju u jedan monstrouzni sirine 256 bita).
Kod K8 128-bit SSE se dekodirao u 2x64-bitna makroopa. K8 je imao 2x64-bit portove od L1 kesha i 16-byte fetch, pa je u ciklusu mogao da ucita 128-bita instrukcija i to u komadima od 2x64-bit, odnosno 1x64 i 1/2x128-bit.
Dakle, troughput je za double dispatch operacije 0.5. Latencija zavisi mnogo i do same implementacije.
Kod K10 je fetch bandwidth povecan na 32 bajta, t.j. 2x128-bita. Isto ce biti i kod Bulldozera. Bulldozer ce kao i Nehalem imati loop detector, koji sluzi da se pristedi fetch bandwidth za operacije koje se obavljaju u petlji, a vecina algoritama vrti nesto u petljama. Loop detector kod Nehalema ima kapacitet od 28 µOp-ova, koliko ce imati kod BD-a ostaje da se vidi.