| Hardver | Procesori | AMD Llano A8 3850
Procesori

AMD Llano A8 3850

 

Sistemska arhitektura – Garlic i Onion

 

GPU koristi sistemski RAM kao framebuffer. Standardno, koristi 512MB grafičke memorije, dok ostatak uzima CPU. U ovoj generaciji sistemski RAM i framebuffer ne koriste jednak memorijski prostor. Mapiranje grafičke memorije je određeno drajverom kroz operativni sistem.

Integracija procesora i grafičkog procesora obično podrazumeva da se podaci prosleđuju kroz memoriju. Fusion GPU poseduje odvojen ne-koherentni interfejs ka memorijskom kontroleru – Garlic (beli luk) – odnosno Radeon Memory BUS. Ovo je bi-direkcioni link, koji omogućuje 2×32 bajta čitanja i 2×32 bajta upisivanja po ciklusu. Garlic radi na radnom taktu northbridge-a, što daje nekoliko puta veći bandwidth od sistemske memorije. Ovo je neophodno za brzo učitavanje tekstura i velike količine podataka u nizu. Ovaj link ima toliko propusne moći da može da uguši kompletan sistemski protok.

Fusion compute link – Onion (crni luk) – koristi se ukoliko GPU treba da signalizira promenu koherentnih podataka u procesorskom kešu (snoop), pa je ovo koherentni link. Koristi se za pristup keširanoj sistemskoj memoriji.

 

llano_backend2

 

Zero Copy i Pin-in-Place su praktično „APU only features“. Teksture se kreiraju u sistemskoj memoriji i kopiraju se u virtualnu memoriju. Kada sistem zahteva učitavanje teksture, prvo je traži u virtuelnoj memoriji, a onda je operativni sistem kopira u RAM, odakle se kopiraju putem PCI-express magistrale u GPU memoriju a samim tim omogućen direktan pristup GPU-u. APU nema potrebu da kopira delove memorije iz sistemskog RAM-a u framebuffer, zato što GPU i CPU dele istu memoriju. Zero Copy pristupa virtualnim memorijskim adresama direktno putem osvežavanja podataka o adresama u page tabeli i jednostavnom promenom pokazivača (pointera) na odgovarajuću memorijsku lokaciju, bez ikakve potrebe za kopiranjem. Poređenja radi, čitanje iz lokalne memorije kod Llano-a odvija se brzinom od 12-14 GB/s, dok kod diskretne grafike, putem PCI-Express magistrale, kopiranje tekstura se vrši brzinom od maksimalno 6 GB/s. Kod OpenCL primene, CPU čitanja iz framebuffera su veoma spora, jer ta memorija nije keširana – nije pod pagetable sistemom procesora, TLB ne kešira memorijske lokacije i pretraga ovog dela memorije je veoma spora. Pomoću ZC moguće je čitanje iz framebuffer-a jednostavnom promenom pointera. Ono što važi za teksture, važi i za podatke nad kojima se vrši obrada OpenCL programom. Odsustvo kopiranja iz virutalne memorije u framebuffer i obrnuto je naročita prednost kod APU-a jer je memorijski protok deljen.

 

Ivan Vujić

Software, storage, network etc editor @ AXE
Database migration @ RC ETF

Dodaj komentar

Kliknite ovde da biste poslali komentar