| Rubrike | Edukacija | AMD na Hotchips simpozijumu
Edukacija

AMD na Hotchips simpozijumu


Ciljevi HSA

 

Kao što smo već više puta spominjali u raznim tekstovima vezanim za APU i HSA, glavni ciljevi ovakve arhitekture predstavljaju bolje iskorišćenje hardverskih resursa CPU-a i GPU-a. Dakle, cilj je obavljanje istog ili većeg obima posla u jedinici vremena, uz naravno znatno nižu potrošnju ili obavljanje znatno većeg obima posla uz identičnu potrošnju. AMD po prvi put planira spuštanje APU koncepta u serversku primenu, tako da će takav pristup najverovatnije imati veoma ozbiljne posledice i na razvoj desktop i na kraju krajeva i mobilne platforme.

 

01 T

 

Razvoj arhitekture daje rezultate do određenih granica, tako je priča oko pumpanja performansi u „single-thread“ aplikacijama odavno završena priča. Ograničenja poput povećanja potrošnje po jezgru i kompleksnosti ili povećanja potrošnje po kvadratnom milimetru jezgra, jednostavno u određenom trenutku stvara veći problem nego što od toga zaista imamo koristi.

Kada obratimo pažnju na razvoj multicore procesora opet dolazimo do problema paralelizacije softvera, prevelike potrošnje velikog broja jezgara, a možda najveći problem leži u sklabilnosti thread-ova odnosno Amdahal-ovom zakonu koji kaže da se performanse povećavaju logaritamski sa povećanjem broja jezgara. Drugim rečima, ako imate 16 jezgara, da bi povećali dva puta performanse, biće vam potrebno 256 jezgara ukoliko imate odlično paralelizovan softver sa stepenom paralelizacije od 95%. Za manje od toga skaliranje će biti znatno niže i postavlja se pitanje za šta će vam sva ta silna jezgra?

Zbog toga se pristupilo HSA, koji donosi obilan paralelizam podataka i energetski efikasne GPU-ove. Ograničenja poput komplikovanih programskih modela i problema u komunikaciji su nešto što će biti u skorije vreme prevaziđeno.

 

02 T

 

Kao što smo već pisali, HSA donosi jedinstven adresni prostor za GPU i CPU, što znači da GPU može da pristupa „paging“ sistemu, odnosno memoriji koja je keširana. Lepota ovakvog rešenja leži u tome što nije potrebno kopiranje podataka iz sistemskog RAM-a u GPU RAM i obrnuto, već se sve nalazi na jednom mestu, a raspodela se vrši sistemski, preko „user mode-a“, a ne „divljački“. U pitanju je potpuno otvoren standard.

 

Ivan Vujić

Software, storage, network etc editor @ AXE
Database migration @ RC ETF

Dodaj komentar

Kliknite ovde da biste poslali komentar