GPGPU i sintetika
Za sintetičko merenje sirovih performansi i gigaflopsa koristili smo GPGPU test iz AIDA64 softverskog paketa.
Osim što Intelova HD grafika ne podržava izvestan broj testova, performanse u kodu koji je podržan deluju anemično u odnosu na Kabini APU. Dva GCN CU su bukvalno devastirala ovaj Intelov integrisani GPU. Osim ovoga AMD-ov CPU je znatno jači kada su u pitanju sirove performanse, što se vidi iz priloženog.
Kada su u pitanju keš(cache) performanse, ne čudi mnogo da je Intel ovde u prednosti, naročito kada je u pitanju latencija L2 keša. Doduše read iz L2 keša je brži na Jaguaru, ali je upis sporiji. Oba procesora čitaju 128-bita po ciklusu iz L1 keša i isto toliko upisuju, a u prednosti je Bay Trail Celeron, koji radi na nešto većem kloku zbog čega je očitana niža latencija L1 keša. U ciklusima gledano, oba procesora imaju 3 cycle L1. Memorijska latencija je znatno veća na AMD procesoru, a razlog tome leži u relativno niskoj frekvenciji northbridge-a, ali i u implementaciji HSA arhitekture. Upis u memoriju je naravno sporiji na AMD procesoru, što je i logično donekle zbog sporijeg upisa u L2 keš.
Basemark CL v1.1
Basemark CL je benčmark alat razvijen od strane Rightware-a, koji služi za merenje performansi OpenCL 1.1 implementacija na različitim uređajima od desktop platforme do SoC sistema. Basemark CL koristi OpenGL ES 2.0 i OpenGL 2.1 za rendering u zavisnosti od platforme. Basemark CL meri performanse prilikom obrade slike, kao i pomeranje podataka između CPU-a i GPU-a, uz korišćenje OpenCL biblioteke. Ovaj test meri i računsku snagu prilikom izvođenja simulacija fizike. Tu je i merenje performansi prilikom izvođenja popularnih algoritama kao što je rekurzivno računanje Mandelbrot fraktala, ali u 3D, zatim računanje Julia fraktala, a tu je i online compiler.
Da li treba previše trošiti reči kada je u pitanju OpenCL optimizacija? Naravno da ne. AMD APU je ovde bio u proseku od 2-4x brži od Intel Celeron J1900 procesora sa integrisanim HD GPU-om.
HSA JPEG decoder
Uz Kaveri AMD je predstavio i optimizovani JPEG dekoder koji koristi prednosti HSA arhitekture. Ovo može da bude značajno na primer za web rendering, ali i za brz pregled velikih slika.
Kabini naravno podržava HSA i to se jako dobro reflektuje kroz ovaj test. Nažalost ne znamo kada će browser-i masovno da počnu da koriste ovakve optimizacije, ali ako malo bolje pogledamo, Athlon 5350 je u ovom testu sa HSA optimizacijom veoma blizu performansi desktop procesora.
Fritz chess
Fritzchess je benchmark koji simulira brzinu izvršavanja poznatog istoimenog šahovskog programa (Made in Germany J). Ovaj program je pokazatelj brzine izvršavanja ALU operacija procesora i pokazatelj performansi prediktora grananja u procesoru. Takođe je dobar pokazatelj rada mikroarhitekture procesora sa radnom memorijom (RAM).
I ovde AMD Athlon 5350 izvlači minimalnu pobedu uz hendikep od nekoliko stotina MHz. Može se reći da su u AMD-u obavili odličan posao kada je u pitanju optimizacija prediktora grananja i pipeline-a uopšte.
Linpack
LinPack je softverska biblioteka za izvršavanje numeričkih operacija sa matricama. Originalno je pisana u Fortran-u 70. godina prošloga veka. Linpack koristi BLAS biblioteke (Basic Linear Algebra Subprograms) za izvođenje osnovnih matričnih i vektorskih operacija. LinPack testovi mere koliko brzo FPU i CPU rešava sisteme linearnih jednačina „n x n“ koje predstavljaju jednu od glavnih operacija u inžinjeringu. Rešenja su dobijena Gausovom eliminacijom (Gausova metoda) i LU dekompozicijom (LU dekompozicija). Rezultat koji se dobija se predstavlja kao broj operacija sa pokretnim zarezom, tj Gflops. Ovaj test se koristi za rangiranje 500 najbržih superkompijutera, ali je takođe i dobar pokazatelj performasni „klasičnih“ računara koje svi mi koristimo. Na desktop i laptop računarima LinPack demonstrira koliko je maksimum performansi koji ti računari mogu da isporuče (peak performasne). LinPack u potpunosti upošljava sve hardverske resorse unutar sistema „procesor&memorija“. Treba napomenuti da LinPack nije uvek realan pokazatelj prosečnih performasni celokupnog računara.
Linpack radi sa double precision FP operacijama, što znači da je Jaguar jezgro u izvesnom hendikepu po pitanju realizacije sirovih GFLOPS-a. FPU jedinica je malo asimetrična, pa ukoliko radi sa double precision brojevima, radi dvostruko sporije operacije vektorskog množenja. Iako Jaguar podržava rad sa AVX instrukcijama, nije bilo moguće pokrenuti AVX verziju na ovom procesoru. Identičan slučaj je važio i za specijalno patch-ovanu verziju za FX Piledriver i Bulldozer arhitekture, jer ta verzija koristi FMA4 set. Ipak, kako u radu sa single precision, tako i u radu sa double precision operacijama Athlon 5350 je oko 50% brži, što nije malo.
Geekbench 3
Još jedan sintetički test. Ono po čemu je interesantan je to da je postoji na više platformi, uključujući Mac OSX, Windows, Linux, Android i iOS. Bukvalno možete porediti vaš „fancy“ pametni telefon i desktop PC. Ovaj sintetički benčmark meri integer, floating point i memorijske performanse. Integer, odnosno celobrojne performanse procesora mere se tako što se izvršavaju algoritmi za tekst kompresiju, dekompresiju, kompresiju i dekompresiju slika, kao i izvršavanje programskog koda Lua jezika. Program testira single i multithread performanse. Brzinu rada sa pokretnim zarezom, odnosno Floating Point performanse testira tako što izvršava algoritme za računanje Mandelbrotovih fraktala, skalarni proizvod, kao i proizvod matrica.
Interesovalo nas je da uporedimo Krait 300 Quad Core CPU unutar Nexus 4 smartphonea sa ovim procesorima i došli smo do zaključka da je klok za klok između AMD Jaguara i Krait CPU-a razlika ipak dosta velika, delimično jer je Krait optimizovan da radi u okvirima od 2,5-3W, a delimično i zbog Android platforme koja vrti sve aplikacije preko virtuelne mašine, odnosno runtime-a. Opet, ako posmatramo performanse po W, mobilni procesori su bez premca.
Dodaj komentar