Softverska podrška i kompajleri
Jedna od najznačajnijih je Java podrška, koja će izlaskom Jave 8 da iskoristi pun potencijal Kaveri APU-ova sa HSA arhitekturom.
Trenutno Java 7 ima podršku za OpenCL, dok će u verziji 8 biti dodata podrška za Stream i Lambda API-je, CPU multicore paralelizam, a konkurentan rad će biti obezbeđen kroz paralelno korišćenje APARAPI i Lambda API-ja, uz HSAIL sloj nižeg nivoa koji ima podršku za HSA arhitekturu (HSA-Intermediate Layer). Java 9 će dodatno olakšati korišćenje HSA arhitekture tako što će Java virtuelna mašina automatski generisati HSAIL, preko GRAAL Just In Time kompajlera.
AMD je razvio svoje razvojno okruženje koje bi trebalo da olakša developerima pristup GPU programabilnim komponentama kroz APP SDK 2.9 i Media SDK 1.0. APP SDK v2.9 poseduje podršku za OpenCL i C++ AMP. Kroz razvojni alat CODE XL V1.3 omogućeno je korišćenje performance profajlera za CPU i GPU, GPU kernel debugger-a, kao i GPU kernel analajzera. Od open source biblioteka HSA za sada ima podršku za OpenCV (biblioteka za vizuelizaciju), Bolt, clMath sa BLAS i FFT bibliotekama koje se mogu koristiti iz Fortrana, C i C++ jezika, kao i Aparapi za Javu, koji isključuje potrebu za učenjem OpenCL-a da bi se iskoristile prednosti paralelne obrade uz pomoć GPU-a i CPU-a. Dakle, ovo što smo ispričali do sada je nešto što bi zanimalo eventualne developere, kao i sve one koje interesuje kako se dolazi do GPGPU softvera. U praksi za sada od HSA arhitekture nema prevelike koristi, ali prema ovome što dalje sledi u tekstu budućnost ovakvih rešenja je veoma izvesna:
Primena je moguća na najrazličitije moguće načine. Počev od video enkodinga, preko JPEG dekodera, softvera za obradu slike, softvera za arhiviranje, preko gejming biblioteka za rad sa fizikom i LibreOffice paketa.
Primera radi, ubrzanje u takozvanim Smart Sharpen i Smart Blur filterima u Photoshopu CC je praktično dvostruko u odnosu na CPU. LibreOffice u Calc aplikaciji (zamena za Excel) donosi drastično ubrzanje u odnosu na CPU. Da ne bi prepustili slučaju, našu bateriju testova smo osvežili sa testovima koje je AMD predstavio i zaista ima ubrzanja, ali kolikog to je već posebna priča koju ćemo pričati u odeljku sa testovima. PCMark8 u verziji 2.0 je najnoviji benchmark alat koji meri sistemske performanse OpenCL platforme. Pored njega tu se nalazi još i Basemark CL. X265 video kodek je takođe ubrzan uz pomoć OpenCL platforme.
AMD A10 7850K bi mogao da bude veoma popularan izbor svih onih koji se bave datamining-om, odnosno koji zarađuju novac na ovaj način. Prevashodno zbog niske potrošnje i dosta velikog hash bandwidth-a koji isporučuje GCN jezgro unutar Kaveri APU-a. Ne treba previše da trošimo reči zbog čega je Mining toliko popularan…. prosudite sami. Ono zbog čega su GCN bazirani grafički čipovi veoma snažni za potrebe Mining-a je mogućnost obrade velikog broja celobrojnih (integer) operacija.
Mantle endžin omogućava potpuno iskorišćenje svih APU resursa, što znači adekvatno iskorišćenje GPU resursa, skaliranje sa većim brojem CPU jezgara, ali i skaliranje sa većim brojem GPU jezgara, odnosno asimetrični rendering. Da ne bi neko pogrešno shvatio, ovde se ne radi o hibridnom crossfire-u, već o softverskom API (Application Programming Interface) interfejsu koji služi da maksimalno iskoristi adekvatan hardver. Mantle endžin će naravno raditi i na non-HSA APU-ovima, kao i na CPU-ovima, ali će dobit biti znatno manja nego što je to ovde slučaj. Ipak, naglasićemo da je to i dalje domen teorije, jer još uvek nismo videli kako radi Mantle na AMD Kaveri APU-ovima.
Dodaj komentar