Nagyon nehéz bevezetőt írni, ha már ismeri az eredményeket, és túl korai megosztani azokat. Szóval messziről kezdem. A GCN architektúra megjelenése óta AMD magasra tette a mércét a verseny előtt.

hirdető

Sajnos idővel, bár a GCN-alapú megoldások új változatokat kaptak, elkezdtek lemaradni. Ekkor az Nvidiának két betegségből sikerült felépülnie: áttörést ért el a videokártyák energiafogyasztásának csökkentésében, és az intelligens GPU Boost vezérlőalgoritmusok bevezetésével jelentősen megnövelte a frekvenciákat.

Az AMD várt a megfelelő alkalomra, és most meg is érkezett. A gyártó egy csapásra kiadta a megfizethető áron kínált grafikus kártyát, melynek grafikus processzora elérte az 1,25 GHz-es frekvenciát (a korábbi referenciafrekvenciák kb. 1,0 GHz-esek voltak), 8 GB-os videomemóriával szerelték fel. 8 GHz-es frekvenciát, és 200-250-ről 150 W-ra csökkentette az energiafogyasztási sávot.

hirdető

Új lehetőségek

Egy új grafikus megoldás kidolgozásakor az AMD egyszerre több területre is odafigyelt. Közöttük:

  • A multiGPU (Crossfire) szabvány nyílt lett (GPUopen);
  • XConnect támogatás megvalósítása videokártyák külső dobozba történő csatlakoztatásához;
  • AMD LiquidVR API szabvány a VR többfelbontású rendereléséhez;
  • Nagyobb pufferek és shader utasítások előzetes letöltésének optimalizálása;
  • Aszinkron számítástechnika (a végrehajtás prioritásainak meghatározása és előre ütemezése);
  • Hardveres támogatás a 4K60 HEVC kodekhez és a H.265 Main 10 dekódoláshoz;
  • HDR monitorok támogatása.

Kevesebb változás történik az építészetben. A GCN korábbi verzióinak skálázhatóságával kapcsolatos fő probléma a végrehajtási egységek alacsony fajlagos terhelése volt. Emiatt a hatékonyság csökkent, amikor a GPU egy része tétlen volt munka nélkül.

A GCN 1.4-es verziójának szinte minden szűk keresztmetszetet el kell távolítania. Ennek érdekében számos fontos részletet frissítettek benne:

  • Az utasítások gyorsítótárazása javult;
  • Továbbfejlesztett shader utasítások előzetes letöltése;
  • Jobb teljesítmény az egyszálas feladatokban;
  • Mostantól lehetőség van a kérések csoportosítására az L2 gyorsítótárban;
  • Csökkentett gyorsítótár válaszidő;
  • Akár 15%-os teljes átviteli teljesítmény CU-nként a GCN 1.0-hoz képest;
  • Frissített memóriavezérlő;
  • Hatékonyabb módszerek a textúra tömörítésére;
  • Az L2 gyorsítótár mennyisége megduplázódott;
  • Hardveres ütemező az aszinkron számítástechnikához.

A GPU új érzékelőkkel és frekvencia- és CU vezérlőáramkörökkel rendelkezik. Figyelembe veszik a videómag egyes blokkjainak energiafogyasztását és hőmérsékletét, és ezen adatok alapján szabályozzák a teljes GPU frekvenciáját.

Az AMD szerint ennek a módszernek köszönhetően egy bizonyos fogyasztáson belül 15-20%-kal lehet növelni az effektív frekvenciát. A 14 nm-es folyamattechnológia és a GPU-k fejlesztése során az energiafogyasztás csökkentésére irányuló kezdeti összpontosítás kombinációja közel háromszorosára javította a sebesség/energiafogyasztás mutatót a GCN 1.0-hoz képest.

Műszaki adatok

NévRadeon R9 380XRadeon R9 390Radeon RX 480 GeForce GTX 960
kód névTongaHawaiiPolarisGM206
VáltozatGCN 1.2GCN 1.1GCN 1.4Maxwell 2.x
Folyamat technológia, nm 28 28 14 28
Magméret/magok, mm 2 366 438 232 227
Tranzisztorok száma, millió 5000 6200 ??? 2940
Magfrekvencia, MHz 1220 1126
Magfrekvencia (Turbo), MHz 970 1000 1266 1178
Shaderek száma (PS), db. 2048 2560 2304 1024
Textúra egységek száma (TMU), db. 128 160 144 64
Raszterezési blokkok száma (ROP), db. 32 64 32 32
Maximális kitöltési sebesség, Gpix/s 31 64 40.5 36
Maximális textúra lekérési sebesség, Gtex/s 124 160 182 72.1
Memória típusaGDDR5GDDR5GDDR5GDDR5
Effektív memóriafrekvencia, MHz 1425 1500 2000 1750
Memória mérete, GB 4 8 8 2
Memóriabusz, bit 256 512 256 128
Memória sávszélesség, GB/s 182 384 256 112.2
Tápellátás, tűs csatlakozók 6 + 6 6 + 8 6 6
Energiafogyasztás (2D / 3D), Watt -/190 -/275 -/150 -/120
CrossFire/SliVVVV
Hirdetési ár, $ 229 329 229 200
Cserélendő modellRadeon R9 280XRadeon R9 290Radeon R9 380(X)GeForce GTX 760

A legköltséghatékonyabb versenyképes megoldás a AMD Radeon Az RX 480 grafikus kártyákká válik

Egy új középső motor, amely felzárkózik az előző generáció csúcsgyorsítóihoz

  • 2. rész - Gyakorlati ismerkedés

Az alapvető részletes anyag bemutatása az AMD Radeon RX 480 tanulmányozásával.

A vizsgálat tárgya: Gyorsító 3D grafika(videókártya) AMD Radeon RX 480 8 GB 256 bites GDDR5 PCI-E

Fejlesztői részletek: Az ATI Technologies-t (ATI védjegy) 1985-ben alapították Kanadában Array Technology Inc. néven. Ugyanebben az évben átnevezték ATI Technologies-re. Székhelye a torontói Markham. 1987 óta a vállalat a PC-khez készült grafikus megoldások kiadására összpontosít. 2000 óta a Radeon az ATI grafikus megoldások fő márkája, amely alatt a GPU-kat asztali PC-khez és laptopokhoz egyaránt gyártják. 2006-ban az AMD felvásárolta az ATI Technologiest, amely létrehozta az AMD Graphics Products Group-ot (AMD GPG). 2010 óta az AMD elhagyta az ATI márkát, és csak a Radeon maradt. Az AMD központja a kaliforniai Sunnyvale-ben található, míg az AMD GPG továbbra is az AMD korábbi irodájában, a kanadai Markhamben marad. Nincs termelés. Az AMD GPG alkalmazottainak teljes száma (a regionális irodákkal együtt) körülbelül 2000 fő.

1. rész: Elmélet és építészet

Korábbi cikkeinkben többször kifogásoltuk a GPU-k terén tapasztalható stagnálást, ami az új technológiai folyamatokhoz szükséges GPU-k gyártásában bekövetkezett késésekhez és ezek egyikének – a 20 nm-es folyamattechnológiának – tényleges elhagyásához köthető. nem alkalmas összetett videochipek tömeggyártására. Hosszú öt (!) éve mindkét GPU-gyártó cég a már nagyon régi 28 nm-es folyamattechnológián alapuló megoldásokat gyárt.

A mikroelektronikai chipek gyártói csak az év közepén tudtak új FinFET technikai eljárásokkal (gyártótól függően 14 és 16 nm) ilyen összetett és nagy chipeket tömegesen gyártani. Nem is olyan régen az Nvidia visszalőtt, meglehetősen drága videokártyákat adott ki a sora csúcsára, most pedig eljött az AMD ideje, amely a maga útját járta, először nem a legdrágább, nagyjából a Radeon HD-hoz hasonló videokártyákat adott ki. 4850 és HD 4870 modellek, akkoriban igen népszerűvé váltak.

Hogy jobban megértsük az AMD versenytársaikétól eltérő gondolkodásmódját, nézzük meg elképzeléseiket a piacon legkeresettebb videokártyákról. Az AMD szerint a PC-s játékosok viszonylag kis hányada vásárol drága grafikus kártyákat, amelyek nagy felbontás és maximális beállítások mellett is kényelmet biztosítanak, és a legtöbbjük nagyon elavult GPU-t használ. A játékosok 84%-a 100 és 300 dollár közötti videokártyát vásárol az AMD szerint, és csak a többi játékos választja a drágábbat.

Egyértelmű, hogy a többség, ha úgy kívánja, ki sem próbálhatja a mostanra oly népszerű virtuális valóság témáját, mert a VR nagyon tisztességes számítási teljesítményt igényel. Ráadásul az AMD szerint nem minden felhasználó hajlandó beruházni olyan berendezésekbe, amelyek pár éven belül elavulnak. Igaz, nem valószínű, hogy mindegyik rohanni fog VR-sisakok vásárlásával... Másrészt elavult videokártyákkal még a virtuális valóság kipróbálására sem lesz lehetőségük. Világszerte mindössze 13 millió számítógép van elég erősen konfigurálva a VR-alkalmazások futtatásához – ez mindössze 1%-a a közel 1,5 milliárd felhasználó rendelkezésére álló PC-nek.

Az AMD által idézett felmérések szerint a felhasználók kétharmada éppen az ilyen konfiguráció magas költsége miatt nem tervez VR-berendezések vásárlását. Ez kiegészíti a meglehetősen ésszerű érveket, például azokkal, hogy a sisakok még mindig túl terjedelmesek és zavaró vezetékekkel, és a virtuális valóság elvileg csak a játékalkalmazások kis részére alkalmazható. A VR bevezetésének legfontosabb akadálya azonban a hardver ára. Az AMD pedig ígéretes lehetőségnek tartja magát arra, hogy a következő néhány évben PC-k millióit biztosítsa a szükséges teljesítményű GPU-kkal. Igaz, továbbra is homályos, hogy az AMD miért tartja hozzáférhetetlen alkatrésznek a videokártyát, ha maguk a VR-sisak és a kontrollerek drágábbak? A VR-be való belépés küszöbét azonban valóban lejjebb tudják vinni, ha viszonylag kevés pénzért megfelelő teljesítményű megoldásokat kínálnak.

Az AMD pedig sok szempontból éppen olyan produktív és energiatakarékos videokártyákként népszerűsíti új megoldásait, amelyek egy meglehetősen drága virtuális valóság „demokratizálására” készültek, elegendő GPU-teljesítményt biztosítva a vágyóknak. A cég új grafikus megoldásainak másik célja pedig az ultraalacsony fogyasztású kompakt PC-k, ill játék laptopok, amelyhez ma már könnyedén biztosítható a játékkonzolokéhoz hasonló vagy akár jobb teljesítmény. Például a junior Polaris chip nemcsak alacsony fogyasztású, hanem kifejezetten kompakt laptopokhoz is készült - ennek a GPU-nak a teljes csomagmagassága mindössze 1,5 mm, szemben a Bonaire 1,9 mm-esével, ami segít az AMD-nek megnyerni a kellékért folyó versenyeket. megoldások mobil PC-k számára.

Az ilyen követelmények egyértelmű teljesítése érdekében az AMD úgy döntött, hogy két GPU-modellt tervez: a Polaris 10-et és a Polaris 11-et, amelyek megfelelnek bizonyos képesség- és teljesítményszinteknek. A régebbi Polaris sorozatú chip elegendő energiát biztosít majd a PC-s játékosoknak a VR-alkalmazásokhoz és az összes modern játékhoz, míg az alsó kategóriás junior GPU-t vékony és könnyű laptopokhoz tervezték, de a játékkonzolokét felülmúlja a funkciókat és a teljesítményt.

Ennek megfelelően a bejelentés időpontjában az AMD a következő megoldásokat kínálja asztali számítógépekhez:
Radeon RX 460- Energiatakarékos grafikus kártya alacsony energiafogyasztással a nem igényes játékokhoz és a jövőhöz mobil megoldások, több mint 2 teraflop kapacitással, 2 GB videomemóriával, amely 128 bites buszon keresztül van csatlakoztatva;
Radeon RX 470- egy nagyon versenyképes középkategóriás grafikus kártya megfizethető áron, Full HD felbontású játékokhoz elegendő teljesítménnyel, több mint 4 teraflop teljesítménnyel, 4 GB videomemóriával és 256 bites busszal;
Radeon RX 480- az új család eddigi legnagyobb teljesítményű megoldása, VR-hez és modern játékokhoz tervezve, több mint 5 teraflop teljesítménnyel, 4 vagy 8 gigabájt memóriával 256 bites busszal, kevesebb mint 150 watt fogyasztással.

Ma a Radeon RX 480 modellt nézzük meg, amely prémium szolgáltatásokat kínál a játékosok számára - Premium HD Gaming. Mit jelent ez a kifejezés az AMD értelmezésében? Ez magában foglalja az új grafikus API-k képességeit, például az aszinkron végrehajtást a DirectX 12-ben, valamint a FreeSync és a CrossFire technológiákat. De a legfontosabb dolog az előny a hasonló árú versenytárs megoldásokkal szemben a modern játékokban, DirectX 12 támogatással:

A legtöbb DirectX 12 játék ebben az évben (Ashes of the Singularity, Hitman, totális háború: Warhammer, Quantum Break, Gears of War és Forza APEX), még az előző generációs AMD Radeon grafikus kártyák is gyakran felülmúlják az Nvidia társaikat árban: megjegyeztük a Fury X előnyét a 980 Ti, az R9 390 a GTX 970 és az R9 380 a GTX ellenében. 960, és még a Polaris 10-en alapuló legújabb modell is biztosan még jobban teljesít.

A DirectX 12 mellett még egy API-t lehet megjegyezni - Vulkan. A Doom megfelelő verziójában az AMD akár 45%-os növekedést követel a Radeon RX 480-on a játék OpenGL-es verziójához képest, bár a régebbi videokártyákon a különbség várhatóan valamivel kisebb lesz - körülbelül 20-25%.

Mit szólsz virtuális valóság, valóban megfelelő teljesítményre képes az AMD új terméke a VR alkalmazásokhoz? A GPU nagy teljesítményének és az olyan funkciók támogatásának köszönhetően, mint az Asynchronos Time Warp, kényelmesen megtekintheti a releváns VR-alkalmazásokat, még alacsony energiafogyasztás mellett is. Tehát a SteamVR Performance Test teljesítményének értékelésére szolgáló általánosan elfogadott teszt egyértelmű fölényt mutat az előző generáció megoldásaival szemben (nem világos azonban, hogy miért hasonlították össze a Radeon R9 380-al?):

Mivel a Radeon RX 480 modell alapja a Polaris 10 GPU, amely a negyedik generációs GCN architektúrával rendelkezik, amely sok részletében hasonlít a korábbi AMD megoldásokhoz, a cikk elméleti részének elolvasása előtt hasznos lesz megismerkedni korábbi anyagainkkal a cég korábbi videokártyáiról, az előző generációs GCN architektúrán:

  • AMD Radeon R9 Fury X: Új AMD zászlóshajó HBM támogatással
  • AMD Radeon R9 285: Tahiti 256 bites buszt kap, és Tonga lesz
  • AMD Radeon R9 290X: Érje el Hawaiit! Szerezzen új csúcsokat a sebesség és a funkcionalitás terén
  • AMD Radeon HD 7970: Az új, egyfoglalatos 3D grafikus vezető

Fontolgat részletes specifikációk Radeon RX 480 grafikus kártya, amely az új generációs Polaris 10 GPU teljes verzióján alapul.

Radeon RX 480 grafikus gyorsító
ParaméterJelentése
Chip kódnévPolaris 10XT (Ellesmere)
Gyártástechnológia14 nm-es FinFET
A tranzisztorok száma5,7 milliárd
Alapterület232 mm²
ÉpítészetEgységesített, egy sor közös processzorral számos típusú adatfolyam feldolgozásához: csúcsok, pixelek stb.
DirectX hardver támogatásDirectX 12, a 12_0 funkciószint támogatásával
Memóriabusz256 bites: Nyolc független 32 bites memóriavezérlő támogatja a GDDR5 memóriát
GPU frekvencia1120 (1266) MHz
Számítási blokkok36 GCN számítási egység 144 SIMD magból, összesen 2304 lebegőpontos ALU-ból (egész és lebegőpontos formátumok támogatottak, FP16, FP32 és FP64 pontossággal)
Textúra blokkok144 textúraegység, támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
Raszterezési egységek (ROP)32 ROP élsimítási módok támogatásával, képpontonként több mint 16 minta programozható mintavételezésére, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 32 minta óránként, színtelen módban (csak Z) - 128 minta óránként
Monitor támogatásIntegrált támogatás akár hat DVI-n, HDMI 2.0b-n és DisplayPort 1.3/1.4-re kész monitoron keresztül csatlakoztatott monitorhoz

Radeon RX 480 referencia grafikus specifikációk
ParaméterJelentése
Magfrekvencia1120 (1266) MHz
Univerzális processzorok száma2304
Textúra blokkok száma144
Keverési blokkok száma32
Hatékony memóriafrekvencia7000-8000 (4×1750-2000) MHz
Memória típusaGDDR5
Memóriabusz256 bites
Memória méret4/8 GB
Memória sávszélesség224-256 GB/s
Számítási teljesítmény (FP32)5,8 teraflopig
elméleti maximális sebességárnyékolás41 gigapixel/s
Elméleti textúra mintavételi sebesség182 gigatexel/s
GumiPCI Express 3.0
CsatlakozókEgy HDMI és három DisplayPort
Energia fogyasztás150 W-ig
Extra ételEgy 6 tűs csatlakozó
A rendszerházon elfoglalt helyek száma2
Ajánlott ár199 USD/229 USD (USA piac)

Az AMD ma kiadott grafikus kártya modelljének neve teljesen megegyezik a jelenlegi elnevezési rendszerükkel. Elnevezése az index első részében szereplő megváltozott szimbólum és a generációszám - RX 480 -ban tér el az elődeitől. Ha a második változtatásnál minden világos, mert a generáció valóban új, akkor az R9 lecserélése RX-re nem teljesen logikus. , véleményünk szerint azért, mert ez az ábra a videokártya szintjét mutatta: az R7 lassabb volt, mint az R9, de mindegyiket ugyanabban a generációban gyártották. És most nem világos, először is, miért magasabb ez a szám az RX 480-nál, mint például az R9 390X-nél, és milyen számok lesznek a névben az R után az új GPU-kra épülő junior megoldásokban.

Az új Radeon 400 család első modellje a korábbi megoldások helyét veszi át a cég jelenlegi vonalában, hasonló pozicionálással, felváltva azokat a piacon. Mivel a kiadott videokártya árban és sebességben is inkább átlagos szintű, az új generációt is figyelembe véve, úgy döntöttek, hogy a 490-es indexet meghagyják a jövőbeli megoldásoknak a még erősebb GPU-kon.

A referencia Radeon RX 480 ajánlott áron 199 dollár a 4 GB-os változatért és 229 dollár a 8 GB-os modellért, és ezek az árak nagyon vonzóak! Az előző generáció csúcskategóriás videokártyáihoz képest ez nagyon jó árcédula, hiszen a Radeon RX 480 sebességében nem maradhat el az olyan modellektől, mint a Radeon R9 390 és a GeForce GTX 970. Az új termék versenyezni fog velük, legalábbis életútja kezdetén, egészen a hamarosan megjelenő GeForce GTX 1060 megjelenéséig. De megjelenése idején a mai új termék abszolút a legjobb teljesítményt kínálja kategóriájában.

A referencia Radeon RX 480 grafikus kártyákat 4 GB GDDR5 memóriával szállítják 7 GHz-es effektív frekvencián és 8 GB memóriát 8 GHz-en. De ahogy az AMD partnerei saját videokártyái is forgalomba kerülnek, más lehetőségek is megjelennek, de mindegyik legalább 7 GHz-es GDDR5 memóriával lesz felszerelve – ez az AMD akarata.

A 4 és 8 GB memória telepítése nagyon bölcs döntés. A fiatalabb verzió lehetővé teszi a megtakarítást, mert a 4 GB jelenleg az "arany középútnak" tekinthető, a Radeon RX 480 második verziójának 8 GB memória előnye pedig a jövőben derül ki. A videokártya 4 GB-os változata ugyan elfogadható teljesítményt nyújt a modern játékokban, de a 8 GB-os memória megfelelő mozgásteret tesz lehetővé a jövőre nézve, hiszen a játékokban a videomemória iránti igény folyamatosan nő. Példaként, amelyben már érezhető az előny, a Rise of játékot említhetjük a sír Raider DirectX 12-ben, nagyon magas beállításokkal és 2560x1440 pixeles felbontással:

A Radeon RX 480 8 GB-ban és a Radeon R9 390-ben található több videomemória segít elkerülni a rendkívül kellemetlen teljesítménycsökkenést és az FPS-rándulásokat a 4 GB-os opciókhoz képest, beleértve a versenytársak GeForce GTX 970 és GTX 960 megoldásait is. A Radeon RX 480 8 GB az, ami lehetővé teszi a zökkenőmentes játékmenetet anélkül, hogy lassulást okozna a helyi videomemóriába nem férő adatok betöltése. És mivel a játékkonzolok jelenlegi generációja 8 GB-tal rendelkezik megosztott memória, a több memória előnye idővel csak nőni fog, és a Radeon RX 480 8 GB-os változata nagyszerű lesz a következő években megjelenő játékokhoz.

Az alaplap egyetlen 6 tűs csatlakozót használ a további teljesítményhez, és a Radeon RX 480 modell jellemző energiafogyasztása a Polaris 10 GPU-n 150 watt. A valóságban túlhúzás nélkül a tábla még kevesebbet, körülbelül 120 W-ot fogyaszt, de egy kis teljesítménytartalék javítja a túlhajtási potenciált. Az AMD partnerei egyébként ennek a videokártyának a gyárilag túlhúzott verzióinak kiadását tervezik, amelyek hűtési és tápellátási rendszerekben is különböznek egymástól.

építészeti jellemzők

A Polaris 10 GPU a Graphics Core Next architektúra negyedik generációjához tartozik, amely jelenleg a legfejlettebb. Az architektúra alapvető építőeleme a Compute Unit (CU), amelyből az összes AMD GPU össze van állítva. A CU számítási egység rendelkezik egy dedikált helyi adattárolóval az adatcseréhez vagy a helyi regiszter verem bővítéséhez, valamint egy első szintű olvasási-írási gyorsítótárral és egy teljes értékű textúra pipeline mintavevő és szűrő egységekkel, alszekciókra oszlik. , amelyek mindegyike a saját parancsfolyamán működik. Ezen blokkok mindegyike önállóan foglalkozik a munka tervezésével és elosztásával.

Lényegében a Polaris architektúra nem változott túl sokat, bár a videochip fő blokkjai nem változtak észrevehetőbben - a videoadatok kódolására és dekódolására, valamint az információk megjelenítő eszközökre való kibocsátására szolgáló blokkok komoly fejlesztésen estek át. Egyébként ez a jól ismert Graphics Core Next (GCN) architektúra következő generációja, már a negyedik a sorban. Eddig két chip volt a családban: a Polaris 10 (korábbi nevén Ellesmere) és a Polaris 11 (korábbi nevén Baffin).

És mégis, néhány hardvermódosítás történt a GPU-n. A fejlesztések és változtatások listája a következőket tartalmazza: továbbfejlesztett geometriai feldolgozás, több vetítés támogatása a VR különböző felbontású renderelésekor, frissített memóriavezérlő továbbfejlesztett adattömörítéssel, módosított utasítások előzetes letöltése és javított pufferelés, számítási feladatok ütemezése és prioritása aszinkron módban, támogatás műveletek az FP16/Int16 formátumú adatokkal. Tekintsük az új GPU sémáját (a képre kattintva az illusztráció nagyított változata érhető el):

A teljes Polaris 10 GPU tartalmaz egy grafikus parancsprocesszort, négy aszinkron számítási motort (ACE), két hardverütemezőt (HWS), 36 számítási egységet (CU), négy geometriai processzort, 144 textúrát egy TMU-t (amely négy LSU-t tartalmaz TMU-nként) és 32 darabot. ROP-ok. Az AMD új GPU-memória-alrendszere nyolc 32 bites GDDR5 memóriavezérlőt tartalmaz, amelyek 256 bites memóriabuszon osztoznak és 2 MB L2 gyorsítótár.

Bejelentik a Polaris geometriájú motorjainak fejlesztését - különösen megjelent az úgynevezett Primitive Discard Accelerator, amely a grafikus folyamat legelején működik, és eldobja a láthatatlan háromszögeket (például nulla területtel). Szintén az új GPU-ban került bevezetésre a duplikált (példányos) geometria új indexgyorsítótára, amely optimalizálja az adatmozgást és felszabadítja a belső adatátviteli buszok erőforrásait, valamint növeli a memória sávszélesség felhasználásának hatékonyságát a geometria duplikálásakor (példányosítása).

A geometria-eldobási gyorsító segít felgyorsítani a geometria-feldolgozást, különösen az olyan feladatoknál, mint a többmintavételes tesszelláció. A diagram azt mutatja, hogy különböző körülmények között új blokk lehetővé teszi a termelékenység akár háromszoros növelését. Ezek azonban az érdeklődő szintetikus adatai, érdemesebb független tesztek játékeredményeit nézni.

A GCN negyedik generációjában is javult a shader végrehajtásának hatékonysága – bevezették az utasítások előzetes letöltését, amely javítja az utasítások gyorsítótárazását, csökkenti a folyamat üresjárati idejét és növeli az általános számítási hatékonyságot. Növelték az utasítástömb (hullámfront) utasításpufferének méretét is, növelve az egyszálú teljesítményt, bevezették az FP16 és Int16 formátumú adatokkal végzett műveletek támogatását, ami segít csökkenteni a memóriaterhelést, növelni a számítási sebességet, ill. javítja az energiahatékonyságot. utolsó esély sokféle grafikai, gépi látási és tanulási feladatra alkalmazható.

Ismét továbbfejlesztették az aszinkron számítástechnikában használt hardveres ütemező (HWS) feladatütemezőt. Feladatai a következők: a CPU tehermentesítése az ütemezési feladatokból, a valós idejű feladatok rangsorolása (virtuális valóság vagy hangfeldolgozás), a feladatok és folyamatok párhuzamos végrehajtása, erőforrás-kezelés, koordináció és a végrehajtási egységek terhelésének kiegyensúlyozása. Ezeknek a blokkoknak a funkcionalitása mikrokóddal frissíthető.

Amellett, hogy az L2 cache méretét megduplázták 2 MB-ra, módosult az adatok feldolgozása és gyorsítótárazása az L2 cache-ben, valamint nőtt a gyorsítótár alrendszer és a helyi videomemória általános hatékonysága. A memóriavezérlő GDDR5 memória támogatást kapott akár 8 GHz-es effektív órajellel, ami a Polaris esetében azt jelenti áteresztőképesség memóriabuszok 256 GB/s-ig. Az AMD azonban nem állt meg itt, tovább javította a veszteségmentes adattömörítési algoritmusokat (Delta Color Compression - DCC), amelyek támogatják a 2:1, 4:1 és 8:1 arányú tömörítési módokat.

A chipen belüli adattömörítés javítja az általános teljesítményt, jobban kihasználja az adatbuszt, és javítja az energiahatékonyságot. Különösen, ha a Radeon R9 290X nem rendelkezett belső információtömörítéssel, és az effektív sávszélesség megegyezik a fizikai sávszélességével, akkor a Fiji chipre épülő megoldás esetén a tömörítés a memória sávszélességének közel 20%-át tette lehetővé, a Polaris esetében pedig akár 35-40%.

Ha a Radeon RX 480-at a Radeon R9 290-hez hasonlítjuk, az új megoldás észrevehetően kevesebb energiát fogyaszt, hogy ugyanolyan hatékony sávszélességet biztosítson, mint az előző generációs grafikus kártya. Ennek eredményeként az új termék bitenkénti teljesítménye érezhetően nagyobb - bár a Radeon R9 290 csúcssávszélessége nagyobb, a Polaris 10-ben sokkal energiatakarékosabb - a memória interfész teljes energiafogyasztása 58%-a a memória interfészének. régi GPU.

Általánosságban elmondható, hogy a Polaris GPU-ban a GCN negyedik generációjának változtatásai a fejlett 14 nm-es FinFET folyamattechnológiát, a mikroarchitektúra változtatásait, a fizikai tervezés optimalizálását és az energiagazdálkodási technikákat foglalják magukban. Mindez meghozta gyümölcsét a termelékenység és a hatékonyság jelentős növekedésében a korábbi megoldásokhoz képest. A legalacsonyabb szinten a Polaris 10 (Radeon RX 480) CU-i körülbelül 15%-kal gyorsabbak, mint a Hawaiiban (Radeon R9 290).

Nehéz megítélni, hogy egy-egy optimalizálás mekkora mértékben járul hozzá a teljes sebességnövekedéshez, de ha figyelembe vesszük az összes optimalizálást a komplexumban, akkor a Radeon RX 470 és a Radeon R9 270X energiahatékonysági különbsége a szerint. AMD specialisták, eléri a 2,8-szeresét. Sőt, a FinFET folyamattechnológia hozzájárulását kisebbre becsülik, mint az optimalizálásaik hozzájárulását. Valószínűleg a legkedvezőbb összehasonlítást választották, más modelleknél pedig valamivel kisebb az energiahatékonyság növekedése. Például, ha összehasonlítjuk az RX 480 és az R9 290 teljesítményét, akkor az energiahatékonyság különbsége megközelíti a kétszeresét. Mindenesetre ilyen hatalmas nyereség néhány évente egyszer megtörténik, így nincs kétségünk afelől, hogy a Radeon RX 480 értékesítése sikeres lesz.

Technológiai folyamat és optimalizálása

Mint már említettük, a Polarisban nem a hardverblokkok változása a lényeg, hanem egy nagy előrelépés, ami egy új, 14 nm-es gyártási eljárásnak köszönhető ennek a GPU-nak a függőlegesen elhelyezett kaputranzisztorok (FinFET - Fin Field) gyártásában. Effect Transistor), más néven 3D kapuszerkezet tranzisztorok vagy 3D tranzisztorok.

A dinamikus fogyasztás lineárisan növekszik a számítási egységek számával, és köbösen a frekvencia növekedésével a feszültség növekedésével (így 15%-os frekvencia- és feszültségnövekedés több mint felére növeli a fogyasztást!), és ennek eredményeként a GPU-k gyakran alacsonyabban működnek. órajelen, de nagyobb sűrűségű chipeket használnak, hogy több párhuzamosan működő számítástechnikai eszközt is elférjenek.

Az elmúlt öt évben 28 nm-es technológiával gyártottak grafikus processzorokat, a köztes 20 nm nem adta meg a szükséges paramétereket. A még fejlettebb technikai folyamatok fejlesztésére elég sokat kellett várni, és most a Polaris családból származó GPU-k gyártásához az AMD a Samsung Electronics és a GlobalFoundries gyártását választotta a 14 nm-es FinFET folyamattechnológiájukkal, amely biztosítja a gyártást. a legsűrűbb mikroprocesszorok közül. A FinFET tranzisztorok használata kritikus fontosságú az energiafogyasztás csökkentése és a GPU feszültség mintegy 150 mV-os csökkentése érdekében az előző generációhoz képest, ami harmadával csökkenti a teljesítményt.

Az illusztráció sematikusan mutatja ugyanazon GPU feltételes átméretezését, különböző technikai folyamatok felhasználásával. A Samsung Electronics és a GlobalFoundries megosztja a 14 nm-es CPU-k és GPU-k gyártását az AMD-től, mivel ugyanazt a műszaki folyamatot végzik, és nem nehéz az egyidejű gyártást beállítani, a megrendeléseket a megfelelő chipek hozama és egyéb paraméterek alapján osztva fel közöttük. , aminek lehetővé kell tennie a nem megfelelő termelési mennyiségekkel kapcsolatos esetleges problémák megoldását.

A Polaris architektúrát eredetileg a FinFET folyamatok képességeihez fejlesztették ki, és ki kell használnia minden képességüket. Röviden, a FinFET tranzisztor egy olyan tranzisztor, amelynek csatornája három oldalról egy szigetelőrétegen keresztül van körülvéve - egy sík tranzisztorhoz képest, ahol az illeszkedő felület egy sík. A FinFET tranzisztorok bonyolultabb eszközzel és megvalósítási nehézségekkel rendelkeznek új technológia elég volt, öt évbe telt a megfelelő technikai folyamatok elsajátítása.

A tranzisztorok új formája azonban nagyobb hozamot, kisebb szivárgást és észrevehetően jobb energiahatékonyságot biztosít, ami a modern mikroelektronika fő feladata. A GPU-k területének négyzetmilliméterenkénti tranzisztorainak száma nagyjából kétévente megduplázódott, és ezzel együtt a statikus szivárgás is. E problémák egy részének megoldására speciális eszközöket alkalmaztak, például különböző tápfeszültségű tranzisztorok szigeteit és órajel-vezérlő áramköröket (órakapuzás), amelyek segítettek csökkenteni a szivárgási áramokat üresjárati vagy alvó üzemmódban. Ezek a technikák azonban nem segítenek az aktív munkaállapotokban, és csökkenthetik a maximális teljesítményt.

A FinFET folyamatok számos problémát megoldanak, lehetővé téve a teljesítmény és az energiafogyasztás forradalmi javulását a korábbi hagyományos chipekhez képest. Az új technikai eljárások nemcsak a teljesítmény növelését teszik lehetővé, hanem a karakterisztikák változékonyságának csökkentését is (azonos modell összes gyártott chipje karakterisztikájának különbségét) - hasonlítsa össze a 14 nm-es FinFET eljárás és a szokásos 28 nm-es paraméterek terjedését a TSMC-től:

Ez a diagram egyszerre mutatja a FinFET termékek nagyobb átlagos teljesítményét, átlagosan kisebb szivárgásokat, valamint kisebb eltérést a teljesítményben és a szivárgási arányban a minták között. Ezen jellemzők jobb változékonysága a GPU-k esetében a FinFET esetében azt jelenti, hogy minden terméknél lehetséges a végfrekvencia növelése, míg a sík tranzisztoroknál nagyobb figyelmet kellett fordítani a legrosszabb teljesítményre és csökkenteni a referenciakarakterisztikát minden végre. Termékek.

Ennek eredményeként a FinFET gyártási eljárásokkal gyártott GPU-k alapvető teljesítmény- és energiahatékonyság-növekedést biztosítanak a hagyományos sík tranzisztorok gyártásánál használt társaikhoz képest. Az AMD szakértői szerint a FinFET technikai folyamatok használatával vagy 50-60%-kal alacsonyabb fogyasztás, vagy 20-35%-kal nagyobb teljesítmény érhető el, minden más körülmény mellett.

Az új FinFET gyártási folyamatok nemcsak csökkentik az energiafogyasztást és jelentősen javítják az energiahatékonyságot, hanem új formai tényezőket és formátumokat is megnyitnak a jövőbeli GPU-alkalmazások számára. Így a jövőben megjelenhetnek olyan viszonylag vékony és könnyű gamer laptopok, amelyeknél nem kell jelentősen csökkenteni a 3D-s grafika minőségi beállításait, a kellően erős, ultrakompakt asztali PC-k, és az ismert játékvideókártyák kevesebb tápcsatlakozóval is kezelhetők lesznek. .

A nagyobb energiahatékonyság eléréséhez azonban nem elég a chipet „vékonyabb” technológiai technológiára átvinni, számos változtatásra van szükség annak kialakításában. Például a Polaris adaptív GPU órajelet használ. A GPU-k alacsony feszültségen és nagy áramerősséggel működnek, és meglehetősen nehéz minőségi feszültséget szolgáltatni az áramkörökről. A feszültség ingadozása elérheti a névleges érték 10-15%-át, és ennek a különbségnek a fedezéséhez az átlagos feszültséget növelni kell, és erre rengeteg energia megy el.

Az AMD-megoldások adaptív órajelezése ezeket a veszteségeket az energiaköltségek negyedével csökkenti. Ehhez a már meglévő energiafogyasztás- és hőmérséklet-érzékelők mellé egy frekvenciaérzékelőt is adnak. Az algoritmus eredményeként a maximális energiahatékonyság érhető el a teljes chipre vonatkozóan.

A tápegység a rendszer indításakor is kalibrálva van. A processzor tesztelésekor speciális kódot futtatnak a feszültség elemzésére, és a feszültségértéket az integrált teljesítményfigyelők rögzítik. Ezután, amikor a PC elindul, ugyanaz a kód fut le, és megmérik a kapott feszültséget, és a kártyán lévő feszültségszabályozók ugyanazt a feszültséget állítják be, mint a tesztelés során. Ez kiküszöböli a rendszerek különbségei miatt pazarló energiaköltségeket.

A Polaris adaptív tranzisztor-öregedés-kompenzációval is rendelkezik – jellemzően a GPU-k 2-3% körüli órajel-magasságot igényelnek a chiptranzisztorok öregedésének befogadásához, és más alkatrészek is mutatják az öregedést (pl. a GPU kisebb feszültséget kap a rendszertől). A modern AMD megoldások képesek önkalibrálni és alkalmazkodni a változó körülményekhez az idő múlásával, ami biztosítja a videokártya megbízható működését hosszú ideig és némileg jobb teljesítményt.

Radeon WattMan – új túlhajtási és felügyeleti lehetőségek

Minden modern videó-illesztőprogram fontos összetevője a túlhajtási beállítások, amelyek lehetővé teszik, hogy minden képességét kipréselje a GPU-ból. Korábban ezt az AMD Overdrive szekció kezelte a cég megoldási meghajtóiban, és az új megoldások megjelenésével együtt az AMD úgy döntött, hogy radikálisan frissíti ezt az illesztőprogram-szekciót, Radeon WattMan néven.

A Radeon WattMan az új AMD segédprogram túlhajtáshoz, amely lehetővé teszi a GPU feszültségének, a GPU és a videomemória frekvenciájának, a hűtőventilátor sebességének és a célhőmérséklet módosítását. A Radeon WattMan a Radeon Software-ben korábban látott funkciókra épít, de számos új, finom túlhajtási funkciót kínál – különböző GPU feszültség- és frekvenciaszabályozási lehetőségekkel. Ezenkívül a WattMan kényelmesen követi a GPU aktivitását, az órajeleket, a hőmérsékletet és a ventilátor sebességét.

Ez kényelmesen megtehető, mint más Radeon beállításoknál Szoftver Crimson Edition, egyéni túlhajtási profilt állíthat be minden egyes alkalmazáshoz vagy játékhoz, amely az indításkor kerül alkalmazásra. Az alkalmazás lejárta után a beállítások visszaállnak a globális alapértelmezettre. A Radeon WattMan a Radeon beállításokban található, felváltotta a jelenlegi AMD OverDrive panelt, és kompatibilis az AMD Radeon RX 400 sorozattal.

Mind az egyszerű GPU-frekvencia-vezérlés, mind a frekvenciagörbe finomhangolása lehetséges. Az egyszerű frekvenciahangolás alapértelmezés szerint működik, és lehetővé teszi az AMD mérnökei által beállított értékek megváltoztatását, amelyek optimálisak a GPU minden állapotához. A frekvencia görbe megváltoztatása 0,5%-os pontossággal lehetséges. A frekvenciagörbe is dinamikus változást mutat, amikor a GPU mag és a videomemória órajel-frekvenciája állapotonként változhat, a feszültség változásával együtt. A GPU és a memória feszültségei egymástól függetlenül vannak beállítva.

A WattMan fejlett ventilátorsebesség-szabályozással is rendelkezik a hűtőrendszerben, amikor be van állítva a minimális fordulatszám, a célsebesség és a minimális akusztikus határ. Ebben az esetben a célfordulatszám az a maximum, amelyen a ventilátor a célnál nem magasabb hőmérsékleten fog forogni. A továbbfejlesztett hőmérséklet-szabályozás lehetővé teszi a maximális és célhőmérséklet beállítását. Az energiafogyasztási korláttal együtt ez finomabb beállításokat tesz lehetővé.

A maximális hőmérséklet az az abszolút maximum, amelynél a grafikus chip frekvenciája nem csökken, de elérése után a frekvencia csökkenni kezd. A célhőmérséklet pedig az az érték, amelynek elérésekor a ventilátor sebessége nő. A GPU teljesítménykorlátja akár 50%-kal is növelhető vagy csökkenthető (Radeon RX 480 modell esetén).

Úgy tűnik, valahol már láttuk a frekvenciák és feszültségek görbéjének finom változásának lehetőségét, és egészen mostanában, igaz? Amit azonban még nem láttunk, az a kényelmes megfigyelési felület és a beállítások magukban az illesztőprogramokban, nem pedig harmadik féltől származó segédprogramok, és az AMD-t csak dicsérni lehet, hogy ennyire gondoskodik a felhasználókról.

Az új felügyeleti felület lehetővé teszi a GPU aktivitásának, hőmérsékletének, ventilátorsebességének és frekvenciájának rögzítését és megtekintését. Ezenkívül létezik globális figyelés (Global WattMan) és a felhasználói profilok külön megfigyelése, amely csak az alkalmazás megnyitásakor figyeli a csúcs- és átlagadatokat. Az adatok gyűjtése a háttérben is történik, a Radeon Settings segédprogramnak nem kell futnia, maximum 20 perces alkalmazásműködésig gyűjtenek adatokat.

Általánosságban elmondható, hogy az AMD-nek van még tennivalója a WattMan interfész kényelmének javításán, mivel például nem billentyűzetvezérlésre készült, de magát a kezdeményezést csak üdvözölni lehet - kényelmes konfigurációs és felügyeleti eszközök közvetlenül az illesztőprogramokban további plusz új megoldások Radeon RX 400 család.

Új lehetőségek a kép megjelenítésére

Korábban már beszéltünk arról, hogy az AMD új megoldásai a legújabb DisplayPort és HDMI szabványok támogatását fogják tartalmazni. Az új Radeon RX család grafikus kártyái az elsők között vannak, amelyek támogatják a DisplayPort 1.3 HBR3 és a DisplayPort 1.4-HDR szabványokat. A szabvány újabb verziói meglévő kábeleket és csatlakozókat használnak, de ezek hosszára további korlátozások vonatkozhatnak.

A DisplayPort 1.3 HBR3 szabvány fő előnye az akár 32,4 Gbps-os sávszélesség-növekedés (80%-kal több, mint a HDMI 2.0b), ami visszaszorítja a DisplayPort 1.2 előző generációjának sávszélesség-korlátját. Az új szabvány lehetővé teszi 5K RGB-monitorok csatlakoztatását 60 Hz-en egyetlen kábellel (most már néhány csatlakozót és kábelt kell csatlakoztatnia), valamint 8K felbontású (7680x4320) UHDTV-tévéket 4:2:0-s színalmintavétellel. 60 Hz-en. Ezenkívül a DisplayPort 1.3 120 Hz-es és 4K felbontású sztereó kijelzőket is csatlakoztathat. Az egykábeles 5K kijelzők és a HDR-kompatibilis 4K kijelzők még ebben az évben várhatók.

A Polaris készen áll a DisplayPort 1.4-HDR szabvány bevezetésére is, amely akár 10 bites színmélységet is támogat 4K felbontásban és 96 Hz-es frissítési gyakoriságot. Az új cég támogatja az ITU Rec.2020 színtér ajánlásait az UHDTV-hez, valamint a CTA-861.3 és az SMPTE 2084 EOTF szabványokat a HDR adatátvitelhez.

Az új DisplayPort 1.3 szabvány a FreeSync technológia népszerűsítésében is hasznos lesz a 4K monitorok számára. Az AMD várakozásai szerint az első ilyen eszközök 2016 végére támogatják a 120 Hz-es dinamikus frissítési technológiát. Ezek a monitorok 4K felbontásra képesek lesznek a FreeSync technológiával 30-120 FPS-sel, és támogatják az alacsony képkockaszám-kompenzációt.

Íme a DisplayPort 1.3 új, kiterjesztett sávszélességű verziója által elérhető következő generációs monitorfunkciók listája: 1920x1080 monitorok: 240 Hz SDR és 240 Hz HDR, 2560x1440 monitorok: 240 Hz SDR és 170 Hz HDR, SDR 120, 5Hz monitorok, 120, 5Hz monitorok : 60Hz SDR.

Ha már a FreeSync-ről kezdtünk beszélni, akkor meg kell említeni, hogy a Polaris architektúra megoldásaiban ez a technológia olyan monitorokkal is működni fog, amelyek HDMI 2.0b csatlakozóval rendelkeznek. A vállalat jelenleg partnereivel, köztük az Acerrel, az LG-vel, az Mstarral, a Novatekkel, a Realtek-kel és a Samsunggal dolgozik azon, hogy lehetővé tegye a dinamikus frissítési gyakoriságú technológiát, többek között HDMI-n keresztül. A megjelenésre tervezett monitorok listája 20-tól 34 hüvelykig terjedő képernyőmérettel és különböző felbontású termékeket tartalmaz.

A Polaris egyik legérdekesebb és legígéretesebb kimeneti képessége az HDR támogatás-megnövelt dinamikatartománnyal rendelkező kijelzők. A kiváló minőségű kép eléréséhez széles színtartományban kell kiadnia a képeket megnövelt kontraszttal és maximális fényerővel, és a jelenlegi kijelzőkön az ember csak egy kis részét látja annak, amit a saját szemével megfigyelhet a körülötte lévő világban. . Az általunk észlelt fényerő- és színtartomány sokkal nagyobb, mint amit a jelenlegi kimeneti eszközök képesek adni.

Sok rajongó várja a High Dynamic Range bevezetését a képfeldolgozási folyamat minden szakaszában minőségi kép. Annak érdekében, hogy az emberi látás képességeit még csak megközelítsük, a televíziók új iparági szabványát vezették be - a HDR UHDTV-t, amely 0,005 és 10 000 nit közötti fényerő-tartományt biztosít. Az első HDR-eszközök fényereje akár 600-1200 cd/m 2, a nagy dinamikatartomány (HDR) támogatással és a jövőben helyi háttérvilágítással rendelkező LCD-monitorok pedig akár 2000 nit, az OLED-kijelzők pedig 1000 nit-ig terjedhetnek, de ideális feketével és nagyobb kontraszttal.

A HDR használatakor a felhasználók számára is kibővült színtartomány jelenik meg, mivel a jelenleg elterjedt sRGB színtér messze elmarad az emberi látás képességeitől. A jelenlegi tartalom szinte mindegyike a BT.709, sRGB, SMPTE 1886 (Gamma 2.4) szabványokon belül készült, az új HDR-10 szabvány, a Rec.2020 (BT.2020), SMPTE 2084 pedig több mint egymilliárd megjelenítésére képes. komponensenként 10 bites színeket, ami közelebb hozza a színminőséget a természeteshez.

A HDR képességekkel rendelkező megjelenítő eszközök témáját nem szabad összetéveszteni azzal, ami már régóta megjelent a játékokban, és amit HDR renderingnek hívnak. Valójában sok modern játékmotorok használja a nagy dinamikatartományú renderelést, hogy megőrizze az adatokat az árnyékokban és a csúcsfényekben, de ez kizárólag az információk megjelenítése előtt történik. Ezután a kép továbbra is a szokásos dinamikatartományra csökken, hogy SDR-monitoron jelenítse meg.

Ehhez speciális hangleképező algoritmusokat használnak ( hangszínleképezés) - tónusértékek átalakítása széles tartományról szűkre. Tekintettel a HDR-eszközök megjelenésére, mind a továbbfejlesztett tónusleképezési algoritmusokra, mind a HDR-kijelzőkre való tájolásukra szükség van. A Polaris hardveres színadatmotor programozható gamma-vezérlési és színskála-újraképezési lehetőségekkel rendelkezik, minden számítás nagy pontossággal történik, és az eredmény teljes mértékben összhangban lesz a megjelenítési képességekkel.

Míg a jelenlegi Radeon grafikus kártyák bizonyos mértékig HDR-kompatibilisek, a megjelent új modellek észrevehetően magasabb frissítési gyakoriságot és színmélységet kínálnak. A Polaris GPU-k készen állnak a komponensenként 10 bites és 12 bites színmélységű HDR monitorokhoz, bár az első ilyen kijelzők csak 10 bitet támogatnak majd, de következnek a fejlettebbek, amelyek felülmúlják az emberi látás képességeit.

Ahhoz, hogy a játékalkalmazásokban jó minőségű HDR-képeket kaphassunk, nem csak a játékmotor grafikus részét, hanem a tartalom egy részét is újra kell készíteni: ugyanazokat a textúrákat olyan formátumban is el kell tárolni, amely lehetővé teszi egy széles szín- és fényerőskála. Az AMD a játékfejlesztőkkel együttműködve gondoskodik arról, hogy a jövőbeli játékok már teljes mértékben kihasználhassák a HDR-kijelzők előnyeit, ehhez pedig kiadtak egy speciális Radeon Photon SDK-t.

És van min dolgozni. A játékokban a tónusleképezést a grafikus motornak kell elvégeznie, mivel ez a folyamat, amelyet a kijelző hajt végre, jelentősen növeli a késleltetést. Az AMD ezt javasolja: lekérdezik a monitor színét, kontrasztját és fényerejét, majd ezt az információt figyelembe véve a játékmotor tónusleképezést készít, és kész formában jeleníti meg a kijelzőn. Mivel a játékmotorok már SDR-ben végeznek hangleképezést, csak hozzá kell adniuk a HDR kimeneti képességet.

A Photon SDK már elérhető a fejlesztők számára, készen áll a HDR-támogatás a videoadatokhoz és a DirectX 11-es alkalmazásokban történő megjelenítéshez az illesztőprogramban, a DirectX 12 támogatását pedig egy jövőbeli frissítéssel tervezik. Hozzá kell tenni, hogy a Polaris támogatja a HDMI 2.0b csatlakozón keresztül (HDCP 2.2-vel) csatlakoztatott HDR kijelzőket 1920x1080 192Hz-en, 2560x1440-en 96Hz-en és 3840x2160-on 60Hz-en és színkódolást 4 :2:2. Ha DisplayPort 1.4-HDR-en keresztül csatlakozik (HDCP 2.2-vel is), a lehetőségek szélesebbek: 1920x1080 240 Hz-en, 2560x1440 192 Hz-en és 3840x2160 96 Hz-en. Várni kell az ilyen monitorokra, amelyek ára alacsonyabb, mint az öntöttvas hídé.

Továbbfejlesztett videó kódolás és dekódolás

Ahogy az gyakran megesik, a GPU-k új generációiban a hardveres videófeldolgozó egységeket is továbbfejlesztették. Hiszen az idő nem áll meg, minden új formátum és felhasználási feltétel megjelenik (képkockaszám, színmélység stb.) Ezért nem meglepő, hogy a Polaris némi fejlesztést hajtott végre a videó adatok dekódolásában és kódolásában.

Ha a korábbi megoldások képesek voltak H.264 formátumban videót kódolni 4K felbontásig 30 vagy akár 60 FPS mellett, akkor a Polaris először tanulta meg a videó kódolását HEVC (H.265) formátumban. Az új GPU hardveres videókódoló egysége a következő felbontásokat és képsebességet támogatja: 1080p 240 FPS-nél, 1440p 120 FPS-nél és 4K 60 FPS-nél.

Ezenkívül a Radeon RX sorozatú grafikus kártyákhoz hozzáadták a játékokból származó streaming videók kiváló minőségű kódolásának támogatását. Hiszen mindig is a kódolás minősége volt a streaming videó gyenge pontja, a gyorsan változó kép mellett pedig a minősége is komolyan megsérült. Kiváló képminőség érhető el az első lépésben képanalízissel ellátott kétmenetes kódolással, amelyet a Polarisban valósítottak meg. A hardveres kétmenetes kódolás mind a H.264, mind a HEVC formátummal működik, és ez a megközelítés észrevehetően jobb minőségű videofolyamot ad.

A Polaris architektúra hardveres képességeinek kibontakoztatásához kívülről is támogatásra van szükség. szoftver. A játékokhoz való minőségi hardveres kódolót a következő segédprogramok támogatják: Plays.TV, AMD Gaming Evolved, Nyissa meg a Broadcastert Szoftver.

A Polaris a legfejlettebb hardveregységgel is fel van szerelve, amely dekódolja a videoadatokat. Az AMD videodekóder HEVC formátummal és Main-10 kódolási profillal működik 4K-ig 60 FPS-en, MJPEG-ig 4K felbontáson 30 FPS-en, H.264-ig 4K felbontáson 120 FPS-ig, MP4-P2-ig 1080p-ig 60 FPS-ig FPS és VC1 1080p-ig 60 FPS-en.

Virtuális valóság rendszerek támogatása

Az elmúlt néhány évben a virtuális valóság sisakjainak jelenlegi reinkarnációja nagy utat tett meg, folyamatosan javítva fogyasztói tulajdonságait (bár még mindig nagyon messze van az ideálistól). Ha 2014-ben az egész úgy kezdődött, hogy 2014-ben mindkét szemnél kisebb, mint 30 FPS-es Full HD felbontás, mostanra 1080 × 1200 pixeles felbontás érhető el minden szemnél 90 FPS és 10 ms-os késleltetés mellett. És most a VR érzése sokkal kényelmesebb és valósághűbb.

Az AMD a maga részéről a VR-hez kapcsolódó teljesítményt is javítja. Így a LiquidVR technológia magában foglalja néhány olyan funkció megvalósítását, amelyek javítják a VR-t a vállalat megoldásaiban. A legújabb változtatások közé tartozik a TrueAudio Next audiotechnológia támogatása, a számítási blokkok redundanciája bizonyos feladatokhoz, a Quick Response Queue aszinkron számítástechnika, a változó felbontás és a renderelés minősége a VR-hez, a DirectX 12 és a Vulkan támogatása.

Így a TrueAudio Next fejlett hangfeldolgozási technológiája magában foglalja a GPU-n valós idejű hangokkal végzett munkát – a terjedés fizikai törvényeinek megfelelően. hang hullámokés sugárkövetés (sugárkövetés) alkalmazása több hangforrásra. Ez lehetővé teszi, hogy alacsony késleltetéssel és beállítások segítségével (a feldolgozott források száma és a hanghullámok visszaverődésének száma) kiváló minőségű hangot kapjunk, hogy jól skálázható megoldást kapjunk.

Egy másik, a közelmúltban megjelent VR-képesség az volt, hogy több számítási egységet különböző feladatokra, például hangfeldolgozásra szánnak – ebben az esetben ezek a CU-k kizárólag ezekkel a feladatokkal foglalkoznak, hogy elkerüljék a különböző feladatok számítógépen történő egyidejű végrehajtásával kapcsolatos problémákat. Valós idejű GPU – Ez a megoldás a kritikus kódok azonnali végrehajtását biztosítja, és bármilyen típusú shaderrel, számítással vagy grafikával működik.

A Polaris architektúra pedig továbbfejlesztett parancsprocesszor – a szolgáltatásminőség új technikája (QoS – a szolgáltatás minősége), az úgynevezett Quick Response Queue. Ez a technika lehetővé teszi a fejlesztők számára, hogy egy API-n keresztül magas prioritást rendeljenek bizonyos számítási feladatokhoz. Mindkét típusú (normál és prioritásos) feladat ugyanazon a GPU-erőforráson osztozik, de a magasabb prioritás biztosítja, hogy az ilyen feladatok több erőforrást használnak fel, és először fejeződnek be anélkül, hogy a héjat alacsonyabb prioritású feladatokra váltanák.

Kifejezetten a LiquidVR-ben ezt a technikát az Asynchronous Time Warp-ban használják, amelyet a VR-rendszerekben használnak, hogy elkerüljék a kiesett képkockákat, amelyek rontják a folyamat zökkenőmentességét - VR-ben ez nagyon megerőltető feladat a késések szempontjából, és a feladatok priorizálása segít abban, hogy győződjön meg arról, hogy a torzítás időzítése pontosan akkor történik, amikor szükséges. A Quick Response Queue (QRQ) technika pontos szabályozást biztosít az időzítések felett azáltal, hogy minimalizálja azokat.

A virtuális valóság rendszerekben az aszinkron időtorzítás technikájának alkalmazása nélkül kiderül, hogy a GPU a képkockák körülbelül 5%-át dobja el működés közben, és az Asynchronous Time Warp funkcióval ezek a képkockák nem kerülnek eldobásra, ami csökkenti a "jittert" (eltérő renderelés szomszédos képkockák ideje) több tucatszor. Jelenleg a funkció már a GPUOpen webhelyén elérhető könyvtár része.

Ismerünk már egy másik, a VR-hez kapcsolódó optimalizálást – a többszörös vetítést, amikor a virtuális valóság jeleneteit különböző felbontásokkal rendereljük. Korábban már többször beszéltünk erről a funkcióról, amely optimalizálja a VR-megjelenítést azáltal, hogy független beállításokat használ a felbontáshoz és a felbontás minőségéhez több vetítésen keresztül, ami utánozza a VR-fejhallgatókban használt tölcséres megjelenítési típust. Ebben az esetben a rendszer a nagy felbontású renderelést a keret közepére alkalmazza, és a teljesítmény optimalizálása érdekében a perifériára csökkenti.

A LiquidVR támogatja a DirectX 12-t, a virtuális környezet ideális grafikus API-ját, mivel lehetővé teszi a rajzhívási funkciók számának növelését egy jelenetben, segít csökkenteni a CPU-terhelést, natív támogatással rendelkezik a számítások aszinkron végrehajtásához és a több chipes megjelenítéshez. , és néhány lehetőséget biztosít a GPU-hoz való alacsony szintű hozzáféréshez. Példák a DirectX 12 LiquidVR részeként történő használatára, valamint a kapcsolódó dokumentáció a GPUOpen.com webhelyen érhető el.

Radeon Software Technologies

Az AMD nemcsak termékei hardverkomponensét fejleszti tovább, hanem azt is szoftver komponensek. Ismét úgy döntöttek, hogy optimalizálják az új videó-illesztőprogram-kiadások gyakoriságát, mivel néhány felhasználó elégedetlen volt a tavaly történtekkel. Sok éven át havonta adtak ki frissített WHQL illesztőprogramokat, de néhány felhasználó úgy érezte, hogy ez túl gyakori. Miután csökkentették az illesztőprogram-kiadások gyakoriságát, más felhasználók elégedetlenek lettek az amúgy is ritka kiadásokkal.

Tehát 2015-ben három WHQL illesztőprogramokés 9 béta verzió, a 2016-os terv pedig évi hat teljes értékű WHQL-tanúsítvánnyal rendelkező meghajtó + annyi speciális verzió, amennyire szükség van játékokra optimalizálva (ideális esetben WHQL is). Eddig szinte mindig sikerül, a játékok megjelenése óta a Radeon Software Crimson Edition illesztőprogramjai már elérhetőek játékok osztály, Far Cry Primal, Hitman, Quantum Break és még sok más. A Doom játékkal és a GCN chipek korábbi generációira épülő videokártyákkal volt egy kis probléma, de ki nem?

Az AMD továbbra is figyelmet fordít az illesztőprogram-optimalizálásokra, amelyeket a zökkenőmentes keretváltások érdekében terveztek, különösen a többchipes konfigurációkban. Például a DirectX 11 CrossFire API-ja bekerült a GPUOpenbe, és néhány DirectX 12-alkalmazás esetében a tervek szerint támogatni fogja a többlapkás renderelést zökkenőmentes keretváltásokkal és a szomszédos képkockák megjelenítési idejének kis eltérésével, és nem csak magas FPS.

A jövőbeli Radeon Software DX12 játékokhoz készült illesztőprogramjai kifejezetten támogatni fogják az AFR frame ingerlést, egy olyan technológiát, amely kifejezetten késlelteti a kép megjelenítését a képernyőn, ami javítja a simaságot és kiküszöböli a akadozást a több chipes renderelésnél.

Fontos, hogy egyre nagyobb figyelmet fordítsanak rá operációs rendszer, a Windows kivételével. Tehát bemutatásra kerül a Polaris nyílt forráskódú Linux disztribúciók támogatása - ezek az illesztőprogramok például már támogatják a Dota 2 játék Vulkan verzióját.

A kíváncsiak közül kiemelünk egy speciális programot a Radeon Software Beta Program béta tesztelésére. Ezt a programot a Minőségbiztosítási (QA) részleg adminisztrálja, és bárki beiratkozhat az alábbi címre írt írással. [e-mail védett] további információért.

A legfontosabb változtatások az új meghajtóhoz tartozó Radeon beállításokban történtek. Megjelent a Crossfire és az energiahatékonyság globális támogatása, a HDMI-skálázás és az alkalmazás-specifikus skálázás, a színhőmérséklet-váltás, a felhasználói felület nyelvének kiválasztása és még sok más – a túlhajtásról és a monitorozási lehetőségekről fentebb már volt szó.

Ez a végfelhasználókról szól, de a fejlesztőknek szánt szoftvertámogatásban mindig vannak változások. A GPUOpen kezdeményezés régóta ismert, mint egy kényelmes módszer az SDK-k, könyvtárak és nyílt forráskódú példák biztosítására a fejlesztőknek. Csak az elmúlt hónapban 14 jelentős frissítés jelent meg a portálon, négy hónap alatt 41 blogot írtak a fejlesztők, és több mint 60 kódpéldát, SDK-t, könyvtárat és segédprogramot tettek közzé a kezdeményezés végi indulása óta. január.

A legújabb példák közé tartozik a ShadowFX DirectX 12 támogatással, a GeometryFX fejlesztései a DirectX 11-hez, a frissített TressFX 3.1 (DirectX 11). Új könyvtárak, SDK-k és példák vannak a DirectX 12-ben a többchipes renderelésre, egy rendellenes raszterezési példa a Vulkanhoz, a FireRays for Vulkan és az OpenCL, valamint a CrossFire API támogatás a DirectX 11-hez. Emellett az AMD lett az első hardvergyártó, aki kiadott egy kiterjesztés a SPIR-V-hez - shader nyelv a grafikában Vulkan API a GCN utasítások támogatásával). Szintén bemutatásra került a Radeon támogatása az OpenVX-hez, amely egy nyílt, többplatformos szabvány a gépi látás alkalmazások gyorsítására.

Az AMD pedig a közelmúltban mutatta be a GPUOpen könyvtárhoz a Shader Intrinsic Functions bővítményt, amely megkönnyíti a játékok PC-s verzióinak optimalizálását, megkönnyítve a többplatformos alkalmazások és a portos játékok fejlesztését konzolokról. A Shader Intrinsic Functions használatakor a fejlesztő közvetlenül hozzáférhet az alacsony szintű utasításokhoz, mint a konzolokon, alacsony szintű kód beszúrásával a magas szintű forrásokba. Ez a funkció olyan alkalmazásokban használható, amelyek támogatják a DirectX 11, DirectX 12 és Vulkan technológiát.

Következtetések az elméleti részről

A Radeon RX 480 grafikus kártya az első a Polaris családból, az első olyan modell, amely az AMD 14 nm-es FinFET eljárással tervezett és épített grafikus processzorai közül az első piacra került. Ez az építészeti optimalizálásokkal együtt lehetővé tette az új megoldás energiahatékonyságának komoly növelését, és ennek eredményeként ebben a mutatóban az új termék kétszer-háromszor jobb, mint a korábbi AMD videokártyák.

Bár a Polaris 10 GPU felépítése nagyon hasonlít a korábbi chipekhez, és nagyrészt megismétli azok megoldásait és grafikus architektúráját különböző generációk A GCN-ek nem különböznek túlságosan egymástól, az új GPU-ban számos fejlesztés történt a különféle típusok hatékonyabb számítása érdekében, beleértve az aszinkron kódvégrehajtást, a képkimeneti képességeket, valamint a videó kódoló és dekódoló egységek funkcionalitását.

A Polaris 10 az AMD legjobb grafikus magja, amely új funkciókat hoz, de ami a legfontosabb, sokkal hatékonyabb lett. Tehát a számítási magok fejlesztése a matematikai számítások teljesítményének 15%-os növekedését eredményezte az előző generációk GCN architektúrájához képest. Az új, 14 nm-es FinFET folyamattechnológiával és egyéb optimalizálásokkal együtt ez jelentősen javította az energiahatékonyságot – a vállalat szerint akár 2,8-szorosára. Ez pedig jobb felhasználói teljesítményt jelent a hőelvezetés és a hűtőrendszer zajának tekintetében.

A funkcionális változtatások és fejlesztések listája tartalmazza a modern videoformátumok kódolásának és dekódolásának támogatását új funkciókkal: nagyobb bitsebességű és fejlett formátumok támogatása, készenlét az online szolgáltatásokból streamelt HDR-videók dekódolására, a játékmenet menet közbeni rögzítése a CPU-teljesítmény részvétele nélkül, kiváló minőségű videó kódolási mód két lépéssel stb. Szintén figyelemre méltó a képkimeneti szabványok támogatásának megjelenése, amelyek a jövőben nagyon fontosak lesznek: 10 bites és 12 bites kimeneti formátumok HDR TV-k és monitorok számára, valamint a nagy felbontású és frissítési gyakoriságú kijelzők támogatása.

De a ma bemutatott Radeon RX 480 termékben a legfontosabb az ára. Bár egyesek számára úgy tűnhet, hogy a Polarisban nincs túl sok funkcionális újítás és optimalizálás, ez az új termék egy modern technológiai eljárást alkalmazva jelentősen csökkentette a videokártya árát, amely mindkét legújabb játékhoz elegendő, kiváló minőségben. beállítások és a virtuális valóság rendszerekben való használatra, meglehetősen igényes a GPU teljesítményére.

A viszonylag alacsony ár és a meglehetősen nagy teljesítmény kombinációja a Radeon RX 480-at ár és teljesítmény tekintetében az egyik legsikeresebb grafikus kártyává teszi a kiadás idején, ha nem a legjövedelmezőbb. Fontos, hogy az átlagot célozza meg árszegmens, sokkal nagyobb számú potenciális vásárlót vonz, mint a csúcsmegoldások, és eleve egy ilyen modell megjelenése pozitív hatással lehet az AMD piaci részesedésére a játék videokártyák szegmensében.

Cikkünk következő részeiben a teljesítményt értékeljük új videokártya Az AMD Radeon RX 480 a gyakorlatban, sebességét összehasonlítva az Nvidia és az AMD hasonló árú gyorsítóival. Először is megnézzük a szintetikus tesztsorozatunk során kapott adatokat, majd áttérünk a legérdekesebb részre - a játéktesztekre.

Tápegység Thermaltake DPS G 1050W a cég által biztosított próbapadhoz ThermaltakeA tesztpadhoz a Corsair Obsidian 800D Full Tower tokot a cég biztosította KalózG.Skill Ripjaws4 F4-2800C16Q-16GRK memóriamodulok a cég által biztosított tesztpadhoz G.SkillCorsair Hydro SeriesT H100i CPU-hűtő tesztpadhoz, Corsair Kalóz
A Dell UltraSharp U3011 tesztpadi monitort szállítja UlmartASRock Fatal1ty X99X Killer tesztágyas alaplap Az ASRock által biztosított ASRockMerevlemez Seagate Barracuda 7200.14 3 TB a cég által biztosított tesztpadon Seagate2 SSD meghajtó Corsair Neutron SeriesT 120 GB a cég által biztosított tesztpadhoz Kalóz

AMD Radeon RX 480 8GB áttekintés | Ismerje meg a Polaris 10-et

Nyolc hónappal ezelőtt az AMD elkezdte felszabadítani a következő generációs GPU-k erejét, kezdve egy frissített kijelzővezérlővel, amely támogatja a HDMI 2.0b-t és a DisplayPort 1.3 HBR3-at, a FreeSync over HDMI-t és egy HDR-kompatibilis csővezetéket. Később további információk kezdtek megjelenni, amelyek két különböző GPU megjelenéséről szóltak, az egyiket kifejezetten a mainstream asztali piacra, a másikat pedig a mobilmegoldásokra tervezték, vékony és könnyű kivitelben kínálva konzolszintű teljesítményt.


A második termék 16 számítási egységet (CU-t), 128 bites memóriabuszt és gyorsított 4K videókódolást/dekódolást tartalmaz. Amíg nem elérhető. videokártya AMD Radeon RX 480 a nagyobb Polaris 10 processzort használja.Fizikailag nem nagyobb, mint egy Nvidia GP100 processzor 15,3 milliárd tranzisztorral, de elég erős ahhoz, hogy a legjobb VR fejhallgatókat meghajtja. A kártya teljesítményét tekintve az AMD Radeon R9 290 és az Nvidia GeForce GTX 970 egyenrangú.

A kártya átlagos teljesítményszintje aligha nevezhető lenyűgözőnek, különösen az új Nvidia GP104 GPU hátterében. azonban AMD Radeon RX 480 sokkal olcsóbb, mint a sebességben hasonló megoldások, a fogyasztás pedig 150 wattban korlátozott. Így az AMD azt reméli, hogy a virtuális valóságot a játékosok szélesebb közönsége számára is elérhetővé teheti (jó lenne, ha a HMD-ket 800 és 600 dollárért árusító cégek is játszanának vele).

Két változat érhető el AMD Radeon RX 480: 200 dolláros (MSRP) modell 4 GB GDDR5 VRAM-mal 7 Gb/s sebességgel és 240 dolláros (MSRP) verzió 8 GB GDDR5-tel 8 Gb/s sebességgel. Ma egy 8 GB memóriával rendelkező modellt tesztelünk.

A Polaris 10 jellemzői

A Polaris 10 5,7 milliárd tranzisztort tartalmaz egy 230 mm2-es szerszámon. Összehasonlításképpen, a Hawaii chip 6,2 milliárd tranzisztorral és 438 mm2-es területtel rendelkezik. A kevesebb tranzisztor és a körülbelül 55%-kal alacsonyabb energiafogyasztás ellenére az RX 480 a legtöbb tesztben R9 290 és 390 között van. Ez nagyrészt a GlobalFoundries 14 nm-es FinFET eljárásának köszönhető, amely az AMD számára észrevehető teljesítmény- és teljesítményelőnyöket biztosít a sík tranzisztorokkal szemben 28 nm-es folyamattechnológia. A FinFET magasabb frekvenciát ad bármilyen energiafogyasztási szinten, és fordítva, bármilyen órajelnél egy 14 nm-es chip kevesebb energiát fogyaszt. A Polaris esetében az AMD mindkettőt kihasználta az órajelek növelésével és az energiafogyasztás csökkentésével. Így sikerült felülmúlnia az erősebb GPU Hawaiit az erőforrások terén, miközben megtartotta a 150 wattos teljesítményplafont (bár méréseink azt mutatják, hogy ez a szám kissé alábecsült).

Az új kódnév ellenére a Polaris 10 a negyedik generációs AMD Graphics Core Next architektúrán alapul. Ezért a Polaris processzor tervezésének építőkövei sok rajongó számára ismerősnek tűnnek, és nekünk is könnyebb lesz leírni.

Műszaki adatok

AMD Radeon RX 480 AMD Radeon R9 390 AMD Radeon R9 290
Polaris 10 Grenada Pro Hawaii Pro
Számítási egységek (CU) 36 40 40
Stream processzorok 2304 2560 2560
Órajel frekvencia (alap/Boost), MHz 1120/1266 1000 947
Csúcs számítási sebesség, GFLOP-ok (alapfrekvencián) 5161 5120 4849
Textúra blokkok száma 144 160 160
Textúra kitöltési aránya Gtex/s 182,3 160 160
Raszterezési blokkok száma 32 64 64
L2 gyorsítótár mérete, MB 2 1 1
Memória átviteli sebesség, Gbps 8 (8 GB) / 7 (4 GB) 6 5
Memória sávszélesség, GB/s 256 384 320
Memóriabusz, bit 256 512 512
Termikus csomag, W 150 275 250
Tranzisztorok száma, milliárd 5,7 6,2 6,2
Kristályfelület, mm2 230 438 438
Folyamat technológia, nm 14 28 28
kezdő ár 240 USD (8 GB) / 200 USD (4 GB) 330 USD (8 GB) 400 USD (4 GB)

Az egyik parancsfeldolgozó (GCP-Graphics Command Processor) továbbra is felelős a grafikus utasítások szekvenciájának shader egységekre (Shader Engine) ütemezéséért. A számítási utasítások sorrendjét aszinkron számítási egységek (ACE - Asynchronous Compute Engine) kezelik. Csak nyolc ACE-blokk helyett a parancsvégrehajtási logika négy ACE-ből és két hardveres ütemezőből (Hardware Scheduler) áll, amelyek a sorprioritás meghatározását, az idő-/térerőforrás-kezelést és a CPU-magmódú illesztőprogram-ütemezési feladatok tehermentesítését végzik. Valójában ezek nem különálló vagy új blokkok, hanem egy kiegészítő üzemmód, amelyben a meglévő csővezetékek működhetnek. Dave Nalasco, az AMD grafikus technológiai folyamatokért felelős vezető menedzsere megjegyezte:

"A HWS (Hardware Workgroup/Wavefront Schedulers) alapvetően ACE-folyamatok diszpécservezérlők nélkül. Feladatuk a CPU tehermentesítése a rendelkezésre álló hardveres sorhelyeken lévő felhasználói/illesztőprogram-sorok ütemezési folyamatának kezelésével. Ezek programozható mikrokód-processzorok, amelyek eltérőek lehetnek. ütemezési házirendek érvényesek. Ezeket használtuk a Quick Response Queue és a CU foglalási funkciók megvalósításához. Ezeket a változtatásokat egy illesztőprogram-frissítés révén a 3. generációs GCN grafikus kártyákra is át tudtuk vinni."

A Quick Response Queues funkció lehetővé teszi a fejlesztők számára, hogy prioritást állítsanak fel bizonyos aszinkron módon futó feladatokhoz anélkül, hogy teljesen megelőznék a többi folyamatot. Részletesebb magyarázat található Dave blogján(Angol). Röviden, az AMD rugalmasságot akar. Architektúrája különböző megközelítéseket tesz lehetővé az erőforrás-terhelés optimalizálása és a renderelési késleltetés minimalizálása érdekében, amelyek mindkettő kritikus fontosságúak a VR-alkalmazások számára.

A jól ismert CU-k 64 IEEE 754-2008 szabványnak megfelelő shader egységből állnak, négy vektor egységre, egy skalár egységre és 16 textúra lekérő betöltési/tárolási egységre osztva. Ezenkívül minden egyes CU négy textúra egységet, 16 KB L1 gyorsítótárat, 64 KB helyi adatcserét és regiszterterületet tartalmaz vektor- és skaláregységekhez. Az AMD azt állítja, hogy számos módosítást hajtott végre a CU teljesítményének javítása érdekében, beleértve az FP16 (és az Int16) támogatását, a gyorsítótár-hozzáférés optimalizálását és az utasítások előzetes letöltésének javítását. Ezek a változtatások együttesen akár 15%-os teljesítménynövekedést biztosítanak a CU számára a Hawaii GPU-hoz képest (GCN 2. generáció).

Kilenc CU alkot egy nagy árnyékoló egységet (SE – Shader Engine). A Polaris 10 videochip négy ilyen SE-vel rendelkezik, és tudjuk, hogy ez a maximum ennél az architektúránál. Összesen 2304 adatfolyam processzort és 144 textúra egységet (64 shader x 9 CU x 4 SE) kapunk.

Minden árnyékoló blokk egy geometriai blokkhoz van társítva (GE - Geometry Engine). Az AMD szerint a geometriai blokkba egy primitív eldobásgyorsító került, ez kiszűri a legegyszerűbb geometriai elemeket, amelyek nem raszterizálódnak pixellé a szkennelés előtt, így növelve az áteresztőképességet. Ez a grafikus folyamat előraszterezési szakaszának automatikus funkciója, és új a Polaris számára. Emellett megjelent egy index gyorsítótár a klónozott geometriához, bár nem ismerjük a méretét és a klónozás közbeni befolyás mértékét.

A Hawaii videochiphez hasonlóan a Polaris 10 processzor négy egyszerű elemet tud rajzolni órajelenként. A Hawaii/Grenada GPU-khoz képest 1050 MHz-ig (az R9 390X esetében) azonban az AMD megemelte az alapfrekvenciát AMD Radeon RX 480 1120 MHz-ig, a frekvencia pedig Boost módban 1266 MHz-ig. Kiderült, hogy a vállalat megnövelt gyakorisággal kompenzálja az erőforrások elvesztését egy chipen. A Radeon R9 290X egyetlen precíziós lebegőpontos teljesítménye 5,6 TFLOPS, míg az RX 480 Boost módban eléri az 5,8 TFLOPS-t.

Mennyire reális az 1266 MHz-es órajel? A Hawaii GPU-ja nehezen tudott lépést tartani a specifikáció frekvenciájával, mert nagyon meleg volt, és meg akartuk győződni arról, hogy ez nem történik meg a Polarisszal. A GPU-Z segítségével a Metro: Last Light Redux játék integrált benchmarkjában vettük az órajelet, 10-szer megismételve egymás után, és a következő grafikont kaptuk:

Stressz teszt óra – Integrált Benchmark Metro: Last Light Redux, 10 menet, MHz

A grafikon felső (1265 MHz) és alsó (1118 MHz) pontja közötti különbség 148 MHz. Azt mondhatjuk, hogy az AMD egyértelműen belefér a megadott határokba, bár a frekvenciát a teszt során folyamatosan módosítják. De legalább az 1208 MHz-es átlag közelebb van a felső határhoz.

A Hawaii és a Fiji SE GPU-k négy renderelő háttérrel rendelkeznek, amelyek órajelenként 16 képpontot képesek megjeleníteni (az órajelenként összesen 64 pixelt). A Polaris 10 ezt az alkatrészt kettévágta. SE-nként két renderelő háttér található, mindegyik négy ROP-val, amelyek együttesen 32 képpontot jelenítenek meg órajelenként. A különbség a Hawaii-alapú Radeon R9 290-hez képest meglehetősen jelentős. A helyzetet súlyosbítja a 256 bites Polaris 10 memóriabusz, amely kétszer olyan keskeny, mint a Hawaii videochip (512 bites) memóriabusz. Változat AMD Radeon RX 480 A 4 GB-os 7 Gb/s GDDR5 memóriát használ, sávszélessége pedig 224 GB/s, míg a ma tesztelt 8 GB-os modell 8 Gb/s memóriát használ, a sávszélesség pedig 256 GB/s-ra nőtt. De mindenesetre ez sokkal kevesebb, mint a 320 GB / R9 290.

A hardver erőforrások csökkenését részben ellensúlyozza a továbbfejlesztett delta színtömörítés, amely csökkenti a buszon keresztül küldött információ mennyiségét. Az AMD a veszteségmentes 2/4/8:1 tömörítést is támogatja, akárcsak az Nvidia Pascal architektúra. Ezenkívül a Polaris 10 2 MB L2 gyorsítótárat használ, ami ugyanannyit használ a Fidzsi-szigeteken. Ez csökkenti a GDDR5 memóriaelérések számát, és tovább csökkenti a GPU függőségét a széles busztól és a nagy adatátviteli sebességtől.

A GPU-háttér kimerülése azonban hatással lesz a teljesítményre, ahogy a felbontás nő, és az élsimítás intenzitása kerül alkalmazásra. Kíváncsiak voltunk, hogyan fog kinézni a Polaris Hawaii hátterében, miközben a terhelés intenzitása nő. Ennek tesztelésére lefuttattuk a Grand tesztet. Theft Auto V szerény, 1920x1080-as felbontáson, "Very High" grafikai részletbeállításokkal, és fokozatosan növelte az élsimítás minőségét.

A grafikonon jól látható, hogy amikor az MSAA élsimítást 2x-ről 4x-re módosítja AMD Radeon RX 480észrevehetően gyorsabban csökkenti az átlagos képkockasebességet, mint az R9 390. Az élsimítás kikapcsolásával az RX 480 97,3 FPS-t ér el, míg az R9 390 90,4 FPS-t. De a grafikon végére AMD Radeon RX 480 csak 57,5 ​​képkocka/másodperc értéket mutatott, míg a 390 átlag 62,9 képkocka/másodperc.

AMD Radeon RX 480 8GB áttekintés | Kijelzővezérlő, UVD, VCE és WattMan

Új kijelző vezérlő

Ebben a cikkben már foglalkoztunk a Polaris kijelzővezérlő néhány fejlesztésével. "AMD GPU funkcionális fejlesztési tervek 2016-ban". De majdnem hét hónapja jelent meg.

Akkoriban tudtuk, hogy a Polaris támogatni fogja a DisplayPort 1.3-at High Bit Rate 3-mal, a meglévő kábelek és csatlakozók segítségével akár 32,4 Gbps sebességet biztosít négy sávon. A vezérlő specifikációja mostantól tartalmazza a DisplayPort 1.4-HDR szabványt. Nem növeli az adatsebességet, de tartalmazza a Display Stream Compression 1.2 technológiát, amely lehetővé teszi a 10 bites 4K tartalmak átvitelét 96 Hz-es frissítési frekvenciával. A DisplayPort 1.4 szabvány a színteret is támogatja.

Rövid távon az AMD továbbra is a DP 1.3-at tekinti a FreeSync 4K-s szintre emelésének eszközére. A 120 Hz-es frissítési frekvenciájú panelek a cég tájékoztatása szerint 2016 végére lesznek elérhetőek, de ahhoz, hogy ebben a konfigurációban magas grafikus beállítások mellett jó teljesítményt érjünk el, a lehetőségek AMD Radeon RX 480 nem lesz elég. Ennek ellenére a Vega processzor HBM2 támogatással hivatalosan csak 2017-ben jelenik meg.

Tavaly év végén már tárgyaltunk a Polaris HDR-támogatásáról, de az AMD megismétli, hogy a kijelzőcső készen áll a 10 bites HDR kijelzők első generációjára, illetve a jövőben a 12 bites HDR kijelzőkre. A könnyen programozható színfeldolgozó egység szín-újratérképezést, gamma-vezérlést, lebegőpontos feldolgozást és 1:1-es vetítést tartalmaz bármilyen kijelzővel.

Videó kódolási/dekódolási gyorsítás

Fénykorában az ATI a nagy teljesítményű, kiváló minőségű videó dekódoló gyorsítórendszereiről volt ismert, amelyek a videolejátszási feladatokat a CPU-ról a programozható shaderek és a GPU-ban lévő fix funkciós egységek kombinációjára helyezték át.

Nincsenek részletek arról, hogy a Polaris dekóder hol látja el a feladatait, de ismert, hogy az UVD dekóderen alapul, és úgy tűnik, rögzített funkciói vannak. Az AMD a specifikációkban meghatározza a HEVC dekódolás jelenlétét 4K60-ig a Main 10 profil használatával, amely támogatja a 10 bites 4:2:0 formátumot (mindez szükséges a HDR működéséhez). Van hardveres támogatás a VP9 dekódoláshoz, bár az AMD meghajtók még nem implementálták, csak azt tudjuk, hogy egy jövőbeli frissítésben tervezik. Ha az AMD HEVC 10-bit/4:2:0 színalmintavételezést kíván megvalósítani HDR-rel, akkor legalább Profil 2-kompatibilitásra lesz szüksége, M-JPEG hardveres gyorsítást is biztosítanak 4K30-ig.

Az AMD Video Coding Engine (VCE) fejlesztése szintén nincs megfelelően dokumentálva. A Polaris köztudottan képes HEVC 8 bites videó kódolására 4K60-ig, de a GCN 1.2 architektúrán alapuló GPU-k ugyanazzal a felszereléssel rendelkeznek. Úgy tűnik, hogy az AMD azon dolgozik, hogy bővítse a VCE-vel kompatibilis alkalmazások listáját. Természetesen a szabadalmaztatott Gaming Evolved kliens támogatott. De ezen kívül a listákon megtalálható az Open Broadcaster Software program is, amely korábban csak a QuickSync-et és az NVEnc-t támogatta. Itt található a Plays.tv is, amely a Gaming Evolved kliensért felelős vállalat közösségi hálózata.

  • A geometriai átlag eredmények és a vásárlási vonzerő elemzése
  • hirdető

    Bevezetés

    Ez az áttekintés az AMD új grafikus kártyájának, a Radeon RX 480 8192 MB-nak a teljesítményét vizsgálja. A riválisai a következő modellek voltak:

    • Radeon R9 Fury 4096 MB;
    • Radeon R9 390X 8192 MB;
    • Radeon R9 390 8192 MB;
    • Radeon R9 380X 4096 MB;

    • GeForce GTX 980 Ti 6144 MB;
    • GeForce GTX 980 4096 MB;
    • GeForce GTX 970 4096 MB;
    • GeForce GTX 960 2098 MB.

    hirdető

    Tesztkonfiguráció

    A teszteket az alábbi standon végeztük:

    • PROCESSZOR: Intel Core i7-6700K (Skylake, L3 8 MB), 4000 @ 4600 MHz;
    • Alaplap: Gigabyte GA-Z170X-Gaming 3, LGA 1151;
    • CPU hűtőrendszer: Corsair Hydro Series H105 (~1300 ford./perc);
    • RAM: 2 x 4096 MB DDR4 Corsair Vengeance LPX CMK8GX4M1A2400C14 (Spec: 2400MHz / 14-16-16-31-1t / 1,2V), X.M.P. -tovább;
    • 1. lemezalrendszer: 64 GB SSD ADATA SX900;
    • 2. lemezalrendszer: 1 TB HDD nyugati digitális Kaviárzöld (WD10EZRX);
    • Tápegység: Corsair HX850 850 watt (alapventilátor: 140 mm-es ventilátor);
    • Keret: nyitott próbapad;
    • Monitor: 27" ASUS PB278Q BK (széles LCD, 2560x1440 / 60Hz).

    Videokártyák:

    • Radeon RX 480 8192 MB - 1266/8000 @ 1320/8700 MHz (Sapphire);

    • Radeon R9 Fury 4096 MB – 1000/500 @ 1100/500 MHz (Zafír);
    • Radeon R9 390X 8192 MB – 1050/6000 @ 1160/6500 MHz (Sapphire);
    • Radeon R9 390 8192 MB – 1000/6000 @ 1140/6500 MHz (ASUS);
    • Radeon R9 380X 4096 MB – 970/5700 @ 1150/6500 MHz (gigabájt);

    • GeForce GTX 980 Ti 6144 MB - 1076/7012 @ 1420/8100 MHz (Zotac);
    • GeForce GTX 980 4096 MB - 1216/7012 @ 1440/8000 MHz (Palit);
    • GeForce GTX 970 4096 MB - 1178/7012 @ 1430/8000 MHz (Zotac);
    • GeForce GTX 960 2098 MB - 1178/7012 @ 1450/8000 MHz (gigabájt).

    Szoftver:

    • Operációs rendszer: Windows 7 x64 SP1;
    • Videókártya illesztőprogramok: Nvidia GeForce 372.70 WHQL és AMD Radeon Software Crimson 16.9.1.
    • Segédprogramok: Fraps 3.5.99 Build 15618, D3DGear 4.99.2017, AutoHotkey v1.0.48.05, MSI Afterburner 4.3.0 béta 14.

    Vizsgálati eszközök és módszertan

    A videokártyák vizuálisabb összehasonlítása érdekében az összes tesztalkalmazásként használt játék 1920 x 1080 és 2560 x 1440 felbontással indult.

    A beépített benchmarkokat, a Fraps 3.5.9 Build 15586 és az AutoHotkey v1.0.48.05 segédprogramokat teljesítménymérési eszközként használták. A játékalkalmazások listája:

    • Assassins Creed Syndicate (London külvárosa).
    • Doom (a Mars felszíne).
    • Dying Light: The Following (Farm).
    • Fallout 4 (A nukleáris robbanás előtt).
    • Homefront: The Revolution (Különböző vállalkozás).
    • Lords of the Fallen (Keystone Citadella).
    • Overwatch (edzési alap).
    • The Witcher 3: Wild Hunt – Vér és bor (Toussaint).
    • Tom Clancy's The Division (Manhattan).
    • Total War: Warhammer (Reikland Runetusk).

    Minden mért játékban minimálisés közepes FPS értékek. Olyan tesztekben, amelyekben nem volt lehetőség mérésre minimális FPS, ezt az értéket a Fraps segédprogram mérte. vsync letiltva a tesztelés során.

    Menjünk közvetlenül a tesztekre.

    Vizsgálati eredmények: Teljesítmény-összehasonlítás

    Assassins Creed Syndicate (London külvárosai)

    • 1.5.0 verzió.
    • DirectX 11.
      • Élsimítás - FXAA.
      • A környezet minősége a legmagasabb.
      • A textúra minősége magas.
      • Árnyék minősége - maximum (PCSS).
      • Volumetrikus fény – HBAO + Ultra.

    1920x1080

    Megnevezés
    Túlhúzás

    Kérjük, engedélyezze a JavaScriptet a diagramok megtekintéséhez

    2560x1440

    Megnevezés

    Kérjük, engedélyezze a JavaScriptet a diagramok megtekintéséhez


    Túlhúzás

    Kérjük, engedélyezze a JavaScriptet a diagramok megtekintéséhez

    Minimális és átlagos FPS

    hirdető

    Doom (a Mars felszíne)

    hirdető

    • 1.0-s verzió, 2. frissítés.
    • id Tech 6.
      • Élsimítás - FXAA.
      • Kromatikus aberráció – engedélyezve.
      • Látómező - 90.
      • Felbontás skálázás - 100%.
      • A világítás minősége rendkívül magas.
      • Az árnyék minősége rendkívül magas.
      • Játékos árnyék - engedélyezve.
      • Az irányított fényerő-szabályozás minősége magas.
      • A matricák minősége rendkívül magas.
      • Matricák szűrése - anizotróp, x16.
      • A virtuális textúrázáshoz használt oldalméret rendkívül nagy.
      • A visszaverődés minősége rendkívül magas.
      • A részecskék minősége rendkívül magas.
      • Eljárási árnyékolók – engedélyezve.
      • A mozgásos elmosódás minősége rendkívül magas.
      • A látómező mélysége – engedélyezve.
      • A látómélység simítása - engedélyezve.
      • HDR Bloom – engedélyezve.
      • Vakító hatás – engedélyezve.
      • Kosz az objektíven – engedélyezve.
      • A renderelési mód filmszerű.
      • Az élezés mértéke 2,0.
      • Gabona - 1,0.

    1920x1080

    Megnevezés

    Kérjük, engedélyezze a JavaScriptet a diagramok megtekintéséhez


    Túlhúzás

    Kérjük, engedélyezze a JavaScriptet a diagramok megtekintéséhez

    2560x1440

    Megnevezés

    Kérjük, engedélyezze a JavaScriptet a diagramok megtekintéséhez


    Túlhúzás

    Kérjük, engedélyezze a JavaScriptet a diagramok megtekintéséhez

    Minimális és átlagos FPS

    A legjobb videokártyák szegmensében a konfrontáció mindig felkelti a felhasználók figyelmét. De az információs felhajtás mellett valódi kereslet is van. Nem minden játékos áll készen arra, hogy kifizesse azokat a nagy összegeket, amelyek most a zászlóshajó termékekhez szükségesek. És ha az NVIDIA továbbra is sikeresen rohamozza meg a grafikus Olympust, akkor az AMD ezúttal a másik irányba indult el, megnyitva a Radeon új generációját egy középkategóriás modellel, amely ugyanakkor árkategóriájában minden versenytársat meg kell kerülnie.

    Az AMD által idézett statisztikák szerint a játékosok 84%-a 100-300 dollár közötti diszkrét grafikát használ, a játékosok 95%-a pedig 1920x1080-as felbontást. A Radeon RX 480 grafikus kártya ezt a nagy közönséget célozza meg, és a teljesítmény és az érték legjobb kombinációját kínálja az új architektúra, az új gyártási folyamat, a magasabb frekvenciák és a több memória révén.

    AMD Polaris architektúra

    A Radeon új generációja a Polaris architektúrán alapul, amely a GCN architektúra továbbfejlesztése. Ez a negyedik generáció ebben a sorban. A szóban forgó újdonság a Polaris 10 kódneve. A GPU 36 számítási egységgel (CU) rendelkezik, amelyek négy Shader Engine tömbbe vannak rendezve saját geometria feldolgozó egységgel és raszterezési egységekkel. Mindegyik CU 64 stream processzort és négy textúra egységet működtet, hasonlóan a régebbi GPU-k egységeihez. Az eredmény 2304 stream processzor, 144 textúra egység és 32 ROP egység.

    A GPU általános felépítése a többi AMD processzorra emlékeztet, vagy inkább Grenada (Hawaii) és Antigua keresztezésére, i.e. ez egy köztes változat a Radeon R9 390X és a Radeon R9 380X között. Ezzel párhuzamosan nőtt a shader végrehajtásának hatékonysága, az L2 gyorsítótár 2 MB-ra nőtt, és a működése is javult, a memóriavezérlő frissítésre került, a geometria feldolgozó egységek javultak, valamint az Async Compute aszinkron számítások támogatása. hozzáadásra került, az FP16 és az Int 16 utasítások támogatása, ennek eredményeként a hatékonyság nőtt, a magas frekvenciák pedig további gyorsítást biztosítanak.

    Az AMD szerint egyetlen CU hatékonysága 15%-kal nőtt a Radeon R9 290-hez képest. Ha a tesszelációt nehéz AA módokkal együtt dolgozzuk fel, a hatékonyságnövekedés kétszeres vagy akár háromszoros is lehet. Az adattömörítés támogatott, ami javítja a memória sávszélességét. Különösen a Delta Color Compression algoritmus támogatott, amely lehetővé teszi a színkülönbségek kódolását. Erről a technikáról az NVIDIA Pascal architektúra leírásában beszéltünk. Az AMD a Radeon Fury X-en is támogatja ezt a tömörítést, de a Polaris 10 algoritmusai hatékonyabbak. Az adatátvitel hatékonyságának ilyen növekedésével a chip megelégszik egy 256 bites busszal. A Radeon RX 480 GDDR5 memóriachipeket használ 8 GHz-es effektív adatsebességgel.

    Az aszinkron árnyékolók lehetővé teszik a grafikus és nem grafikus számításokat kombináló kombinált munkaterhelés végrehajtásának optimalizálását. A hatékony terheléselosztás az új hardveres ütemezőknek és az ismert aszinkron számítási motoroknak (ACE) köszönhetően valósul meg.

    A Polaris 10 grafikus chip 14 nm-es FinFET technológiával, míg az NVIDIA Pascal chipek 16 nm-es eljárással készülnek. Ez komoly áttörést jelent az ipar számára, ahol több éven át minden grafikát a 28 nm-es technológiával gyártottak. Egy ilyen vékony folyamattechnológia jelentősen csökkentheti az energiafogyasztást. Ez a feladat pedig kezdetben az egyik kulcsa volt egy új generáció fejlődésének. A mérnökök az új 3D tranzisztorok jellemzőire, az új kristály szerkezetének optimalizálására és a továbbfejlesztett feszültségszabályozási mechanizmusok megvalósítására összpontosítottak. Többek között az új technikai eljáráson alapuló kristályok tulajdonságaikban kevésbé különböznek egymástól. Ha ismét a Radeon R9 290 kártyából indulunk ki, amellyel az AMD az új terméket hasonlítja össze, akkor a wattonkénti teljesítménynövekedés közel kétszeres.

    A Radeon RX 480 esetében 150 W-os TDP-t deklarálnak, ami közel áll a GeForce GTX 970 teljesítményéhez. Ugyanakkor az új terméknek termelékenyebbnek kell lennie. És ha már a hőmérséklet- és zajjellemzőknél tartunk, az AMD mérései szerint a Radeon RX 480 referenciaverziója valamivel alacsonyabb akusztikus zajjal rendelkezik.

    Az új folyamattechnológia lehetővé tette, hogy a GPU frekvenciáját 1266 MHz-re növeljük, ami a maximális Boost érték. A teljesítmény- vagy hőmérséklethatár túllépése esetén a frekvencia fokozatosan csökkenthető. A garantált alapérték 1120 MHz. A táblázat alapján összehasonlíthatja a jellemzőket az elődeivel.

    Videó adapter Radeon RX 480 Radeon R9 390 Radeon R9 290 Radeon R9 380X Radeon R9 280X
    Sejtmag Polaris 10 Grenada Hawaii Antigua Tahiti
    n/a 6020 6020 5000 4313
    Folyamat technológia, nm 14 28 28 28 28
    Alapterület, négyzetméter mm 232 438 438 366 352
    2304 2560 2560 2048 2048
    Textúra blokkok száma 144 160 160 128 128
    Renderelési egységek száma 32 64 64 32 32
    Magfrekvencia, MHz 1120-1266 1000-ig 947 előtt 970-ig 1000
    Memóriabusz, bit 256 512 512 256 384
    Memória típusa GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
    Memória frekvencia, MHz 8000 6000 5000 5700 6000
    Memória mérete, MB 8192/4096 8192 4096 4096 3072
    12 12 12 12 12
    Felület PCI-E3.0 PCI-E3.0 PCI-E3.0 PCI-E3.0 PCI-E3.0
    TDP szint, W 150 275 275 190 250

    A Radeon RX 480 szolgáltatásai között meg kell jegyezni, hogy két változata van, amelyekben eltérő memóriamennyiség található. A fő modell 8 GB-tal van felszerelve, az olcsóbb módosítás pedig 4 GB-ot kap.

    A videokártyák támogatni fogják az AFR képkocka-ingerlési technológiát a DirectX 12-hez. Ez a technika kisimítja az egyenetlenségeket a keretek CrossFire-ben való megjelenítése során.

    A DirectX 12 támogatása mellett a grafikus kártya az új Vulkan API-val is kompatibilis. Az egyszerű játék mellett a Radeon RX 480 könnyedén kezeli a virtuális valóság VR-t. Az optimális teljesítményt az AMD LiquidVR képességeinek támogatása biztosítja, ami a számítási erőforrások legjobb elosztását jelenti vegyes feladatokhoz, valamint az Asynchronous Time Warp technológia támogatása az Oculus Rift-en a helyes és gyors képfrissítések érdekében mozgás közben. Ez is magában foglalja AMD technológia TrueAudio Next a hanghullámok terjedésének helyes kiszámításához sugárkövetési technológia segítségével. Ezenkívül ezek a számítások az Async Compute hatókörébe is beletartoznak. Hasonló kezdeményezést fejleszt az NVIDIA. De az AMD változata nyílt eszközkészletet biztosít a fejlesztők számára a GPUOpen programon keresztül.

    A Variable Rate Shading technológia lehetővé teszi az egyes képszegmensek képminőségének beállítását a VR renderelés során, fenntartva a maximális felbontást a központi zónában és csökkentve azt a periférián. Ez erőforrásokat takarít meg, és felgyorsítja a teljesítményt a VR-ben.

    A Radeon RX 480 DisplayPort 1.3 HBR-kompatibilis, és készen áll a DisplayPort 1.4-re, és támogatja az új HDR-szabványt. Vagyis a jövőben új HDR-kijelzőket csatlakoztathat, és megtekintheti a megfelelő tartalmat. DisplayPorton keresztül csatlakoztatva a képkimenet 5K-ig 60 Hz-en, valamint 4K 120 Hz-en vagy 4K 96 Hz-en HDR módban támogatott.

    A Polaris egy új blokkot is kapott a H.264 és HEVC videotartalmak kódolására / dekódolására, amely támogatja a 4K felbontást. Mostantól kiváló minőségben rögzíthet videókat a játékokból, vagy azonnal streamelheti. Jó bónusz a játékosoknak, mert korábban még a csúcskategóriás Radeonokon is csak Full HD videót lehetett rögzíteni az AMD Gaming Evolved kliensen keresztül.

    A Radeon RX 480 együttműködik az új AMD Radeon Settings szoftverközponttal, amely széleskörű funkcionalitást biztosít a színskála vagy a grafikus kártya teljesítménybeállításainak módosításához. Jelenleg nincsenek harmadik féltől származó túlhajtási segédprogramok a Polaris számára, de ezek a funkciók mindegyike elérhető az új AMD WattMan alkalmazásban. A program AMD Radeon beállításaiban való eléréséhez lépjen a "Játékok" fülre, majd a "Globális beállítások" elemre. Itt finomhangolhatja a Boost funkciót vagy túlhajthatja a kártyát, egyszerűen növelve a frekvenciaskálát. Lehetőség van a ventilátor algoritmusának vezérlésére, a teljesítmény- és hőmérséklethatárok megváltoztatására.

    Után áttekintésépítészeti jellemzők, vessünk egy pillantást a Polaris 10 videokártya valódi másolatára.

    Előttünk egy referencia videokártya. Felismerhető stílusban készült. Sallangmentes kialakítás, "turbinás" típusú hűtő, külsőleg téglára emlékeztet.

    A Radeon RX 480 hossza eléri a 24 centimétert. A házon és a ventilátoron nagy Radeon logók találhatók.

    A fizetés nagyon rövid. A ventilátor oldalról a textolit felett lóg, ezen a helyen speciálisan a levegő beáramlására szolgáló lyukak vannak kialakítva.

    A Radeon RX 480 már nem rendelkezik DVI csatlakozókkal, de a hátlapon három DisplayPort és egy HDMI található.

    A ház burkolata könnyen lecsavarható anélkül, hogy a készüléket teljesen szét kellene szerelni. Ez lehetővé teszi a teljes hűtőrendszer értékelését. A GPU-n egy nagy alapot és egy külön alumínium hűtőbordát látunk.

    A fém alaplemez bordázott, hogy növelje a hőelvezetési területet, beleértve a tápegység területén is. Tehát a teljesítményelemek és a memóriachipek radiátora nagyon masszívan készült.

    Másrészt az alapra egy radiális ventilátor van felszerelve, amely a fő radiátor bordáin keresztül vezeti a levegőt.

    A grafikus chiphűtő egyszerű. Nincsenek rézcsövek, csak egy rézbetét az érintkezési zónában. És őszintén szólva a radiátor méretei túl kicsik. Azonban alacsony TDP-vel rendelkező chipről beszélünk, így ez a kialakítás teljes mértékben igazolható.

    A nyomtatott áramköri lap 18 centiméternél kisebb. Az elemek beépítése nagyon szoros. Az elektromos rendszer hat fázisú. A sarokban egy hattűs tápcsatlakozó található.

    A Polaris processzor felületén nincsenek jelölések, minden jelölés a hordozón található.

    Nyolc gigabájt memória van beírva a Samsung K4G80325FB-HC25 chipekbe.

    A GPU-Z segédprogram helyesen határozza meg az összes jellemzőt. A frekvenciák, ahogy az alábbi képernyőképen is látható, megfelelnek az ajánlott frekvenciáknak. A GPU Boost 1266 MHz-en, a memória 2000 MHz-en működik (8000 MHz effektív érték).

    A tesztelés nyitott padon, 27 °C-on, zárt térben történt. Ilyen körülmények között a kártya hőmérséklete könnyen meghaladta a 80°C-ot minden játékteszten. A The Divisionben maximális grafikai minőség mellett a csúcsértékek elérték a 84 °C-ot. Az alábbi képernyőképen a maximális paraméterek és a magfrekvencia értéke látható külön pillanat időt (egy grafikonpont fölé mozgatva).

    A Benchmark Metro: A Last Light könnyedén felmelegítette a magot 85 °C-ra. Mindkét tesztben a frekvencia változott, 1180 MHz-re vagy az alá esett. Az 1200 MHz-es érték azonban átlagosnak vehető a nehéz teszteken.

    A zaj mérsékelt, a ventilátor 2200 ford./percig pörög.

    Hogyan lehet túlhajtani a Radeon RX 480-at? Nyissa meg az AMD beállításokat, a „Globális beállítások” menüpontot.

    A beállításoknál azonnal magas fordulatszámot kell beállítani a ventilátornak, mert a normál hűtőnek nincs sok helye a hűtésre túlhúzáskor. Ezután kísérletezzünk a frekvenciákkal. Hasznos a célhőmérséklet növelése is, amely után a frekvencia fokozatos csökkenése kezdődik. De ezzel óvatosnak kell lennie, és meg kell akadályoznia a túlmelegedést. Maximális ventilátorsebességnél 4°C-kal megemeltük ezt a határértéket, ami segített növelni az átlagos Boost értéket magas üzemi hőmérsékleti körülmények között.

    A végső túlhajtás csak +4,5% volt a kezdeti magfrekvenciához képest. De figyelembe véve a hőmérsékleti határsáv növekedését, a Boost valós különbsége valamivel magasabb lehet. A memória stabilan működött 8720 MHz-en. Az 1235/8720 MHz-es frekvenciakonfigurációval minden teszten átmentünk, a magasabb frekvenciák meghibásodásokhoz vezethetnek.

    A növekedés kicsi, de a zaj komolyan megnő. A hűtés a végletekig működik, csúcsidőben pedig 5000-es fordulatszámon üvölt. Számos teszt során a frekvencia maximum 1325 MHz-re törekedett, de a Metro: Last Light esetében 1300 MHz alatti leállások voltak. Ez a pillanat az alsó képernyőképen tükröződik.

    Kiegészítésként itt egy képernyőkép a Radeon RX 480 bányászati ​​programjáról névleges frekvenciákon.

    A tesztelt videokártyák jellemzői

    A figyelembe vett videokártyát a GeForce GTX 970-el szemben a fő vetélytárssal fogják összehasonlítani. normál verzió a riválist az MSI GTX 970 Gaming 4G váltja fel. Az erőteljes hűtés biztosítja az MSI kártyának az állandó maximális Boost előnyét. Annak érdekében, hogy a teljesítmény közelebb kerüljön a referencia GeForce GTX 970 teljesítményéhez lebegő boosttal, az MSI órajeleket úgy kalibrálták, hogy a játékteszteknél ne haladják meg az 1200 MHz-et, a 3DMark teszteknél pedig az 1220 MHz-et.

    Egyes alkalmazások további módok, ahol az AMD és az NVIDIA csúcsmodelljeivel történik az összehasonlítás. Ezért a táblázatban bemutatjuk az összes résztvevő jellemzőit.

    Videó adapter Radeon RX 480 Radeon R9 Fury X GeForce GTX 1070 GeForce GTX 980 Ti GeForce GTX 970
    Sejtmag Polaris 10 Fidzsi-szigetek GP104 GM200 GM204
    Tranzisztorok száma, millió darab n/a 8900 7200 8000 5200
    Folyamat technológia, nm 14 28 16 28 28
    Alapterület, négyzetméter mm 232 596 314 601 398
    Adatfolyam-processzorok száma 2304 4096 1920 2816 1664
    Textúra blokkok száma 144 256 120 176 104
    Renderelési egységek száma 32 64 64 96 56
    Magfrekvencia, MHz 1120-1266 1050-ig 1506-1683 1024-1100 1051-1178
    Memóriabusz, bit 256 4096 256 386 256
    Memória típusa GDDR5 HBM GDDR5 GDDR5 GDDR5
    Memória frekvencia, MHz 8000 1000 8000 7010 7010
    Memória mérete, MB 8192 4096 8192 6144 3584 + 512
    A DirectX támogatott verziója 12 12 12.1 12.1 12
    Felület PCI-E3.0 PCI-E3.0 PCI-E3.0 PCI-E3.0 PCI-E3.0
    Power, W 150 275 150 250 145

    próbapad

    A próbapad konfigurációja a következő:

    • Processzor: Intel Core i7-6950X (3, [e-mail védett].1 GHz);
    • hűtő: Noctua NH-D15 (két NF-A15 PWM ventilátor, 140 mm, 1300 ford./perc);
    • alaplap: Gigabyte GA-X99P-SLI;
    • memória: G.Skill F4-3200C14Q-32GTZ (4x8 GB, DDR4-3200, CL14-14-14-35);
    • rendszerlemez: Intel SSD 520 Series 240GB (240 GB, SATA 6Gb/s);
    • másodlagos meghajtó: Hitachi HDS721010CLA332 (1 TB, SATA 3Gb/s, 7200 rpm);
    • tápegység: Seasonic SS-750KM (750 W);
    • monitor: ASUS PB278Q (2560x1440, 27 hüvelykes);
    • operációs rendszer: Windows 10 Pro x64;
    • Radeon RX 480 illesztőprogram: AMD Crimson 16.6.2.
    • Radeon R9 Fury illesztőprogram: AMD Crimson 16.5.3.
    • GeForce GTX 1070 illesztőprogram: NVIDIA GeForce 368.39;
    • GeForce GTX 1080 illesztőprogram: NVIDIA GeForce 368.25;
    • GeForce GTX 980 Ti illesztőprogram: NVIDIA GeForce 368.22.

    Alapján vizsgálati eljárás, amelyet az egyik korábbi cikkben ismertettünk. De mivel ott a csúcskategóriás videokártyák tesztkonfigurációját használták, a ezt az összehasonlítást nem minden mód és alkalmazás érintett. Egyes esetekben, amikor a grafikai minőséget lerontják, csak a Radeon RX 480 és a GeForce GTX 970 kerül összehasonlításra, más esetekben, ahol a tesztalkalmazások beállításaiban nem történt változás, az eredményeket kiegészítették a tesztalkalmazások eredményeivel. zászlóshajó videokártyák.

    Vizsgálati eredmények

    Batman: Arkham Knight

    A Radeon RX 480 diadalmaskodik a GeForce GTX 970 felett az Arkham Knightban. Az AMD újonca névértéken egy túlhúzott versenytárs teljesítményét mutatja. A frekvenciák növelésével még néhány százalékot nyerhet.

    Battlefield 4

    A Battlefield 4-ben más a helyzet. A GeForce GTX 970-nek már van előnye, és már a Radeon RX 480-at is túl kell hajtani, hogy közelebb kerüljön az ellenfélhez.

    DiRT Rally

    Az újonc AMD és a GeForce GTX 970 közötti paritásról beszélhetünk a kezdeti frekvenciákon. Túlhúzásnál a második kerül előnybe. Mindkettő messze elmarad a csúcsmegoldásoktól.

    VÉGZET

    Az új DOOM-ban nem olyan kritikus a különbség a régebbi és a fiatalabb videokártyák között, de utolérni továbbra sem lehet őket. A GeForce GTX 1070 furcsa eredménye nem optimalizálási probléma. A Radeon RX 480 előtt valamivel megelőzi a GeForce GTX 970-et, ha megnövelik a frekvenciáit.

    Fallout 4

    A Fallout 4-ben a szokásos Ultra módban újra lefuttattuk a teszteket, így a korábbi értékelésekből származó régebbi videokártyák nem kerültek bele az összehasonlításba. A kezdeti frekvenciákon 5%-ig a Radeon felülmúlja riválisát, de a túlhajtás után az egyensúly a GeForce javára változik.

    Far Cry Primal

    A felülvizsgálat hőse több mint 11%-kal nyeri meg a GeForce GTX 970-et a Far Cry Primal-ban, ha névleges módokban hasonlítjuk össze. A túlhajtásban a riválisok egyenlőek. Maga a túlhajtás körülbelül 9%-os gyorsulást ad.

    Gears of War: Ultimate Edition

    Első meglepetés egy újonctól. Maximális textúraminőség mellett a Radeon RX 480 enyhe lemaradást mutat a Radeon R9 Fury mögött. Ilyen textúrákkal a játéknak több mint 4 GB-ra van szüksége, ami korlátozza az AMD zászlóshajójának lehetőségeit. Ugyanezen okból a rangsor végén a GeForce GTX 970 áll a kombinált memóriával, ahol mindössze 3,5 GB-ot használnak ki hatékonyan. Logikus feltételezés, hogy ha a textúrák minőségét a megszokott szintre süllyesztjük, akkor a riválisok közötti különbség csökkenni fog.

    Grand Theft Auto 5

    A Radeon enyhe előnnyel rendelkezik a GTA 5 riválisához képest a kezdeti frekvenciákon. A túlhajtás után a helyzet fordított, de a különbség nem kardinális.

    Csak ok 3

    A Radeon RX 480 5-11%-kal gyorsabb riválisánál a Just Cause 3-ban, és még a túlhajtás után is megőrzi apró előnyét. Figyelemre méltó, hogy a gyorsított Radeon RX 480 csak 10%-kal marad el a Radeon R9 Fury X mögött - ez jó eredmény!

    Metró utolsó fény

    A Last Lightban két tesztet végeztünk. Egyszerűbb beállításokkal összehasonlítottuk versenytársainkat abban a módban, ahogyan tudják. Ezenkívül összehasonlították őket az SSAA csúcsaival.

    Névlegesen enyhe lemaradás az ellenfél mögött, túlhajtás után pedig jelentősebb. Ugyanakkor még mindig jó, hogy 2K-ban is kényelmesen játszhatsz.

    A csúcsokkal való versengésről szó sincs. A Radeon RX 480 és a Radeon R9 Fury X közötti különbség eléri az 51%-ot. A túlhajtásból származó nyereség 9%.

    Quantum Break

    Az első tesztek óta a GeForce GTX 970 Quantum Break eredményei javultak. De még a túlhajtás után is gyengébb ez a rivális, mint a névleges Radeon RX 480. A különbség hősünk és Fury X között 25%. Ennek érdeme mind a frissített architektúrában, mind a nagy mennyiségű memóriában van (a játék erre igényes).

    A Tomb Raider felemelkedése

    Először is, hasonlítsuk össze a fő riválisokat Full HD minőségben, nagyon jó minőségű profillal.

    A Rise of the Tomb Raider magas memóriaigényéről ismert. Ezért meglepőnek tekinthető a GeForce GTX 970 és a Radeon RX 480 közötti enyhe különbség. Kigyorsításban az ellenfél még előre is húz.

    Ha a régebbi videoadapterekkel ellátott harcosokat nehezebb módban viszi, akkor senki sem fog megbirkózni a feladattal, kivéve a zászlóshajó GeForce-ot. Figyeld meg az apró különbséget a Polaris 10 és a Fury X között. Figyelembe véve, hogy ebben a módban a játék több mint 7 GB-ot használ, ez a különbség nem olyan meglepő. Itt inkább a GeForce GTX 970 teljesítménye vet fel kérdést – a gyorsítótól rosszabb eredményt vártunk.

    The Witcher 3: Wild Hunt

    A The Witcher 3-at 2K-val játszani nehéz lesz, de a 30 fps-es sávot az új Radeon könnyedén legyőzi. És ez is lenyűgöző eredmény a középosztály képviselője számára. 4-9% az előnye a fiatalabb GeForce-hoz képest, a túlhajtásban az ellenfél kicsit visszakap.

    Tom Clancy's The Division

    A Division 2K módban is túltesz a Radeon RX 480 erején, de extrém körülmények között is összemérhetjük a riválisokat. És ismét hősünk jobb, bár a túlhajtásnál a GeForce ismét hátul lélegzik. A Radeon RX 480 és a Radeon R9 Fury X közötti különbség átlagos képkockasebességben akár 38% is lehet.

    Total War: Warhammer

    Új teszt új játék. A DirectX 12 támogatásával egy speciális benchmark került felhasználásra.

    Az eredmények egyértelműen a Radeon RX 480 mellett szólnak. A rivális a frekvenciák növelése után is gyengébb. A teljesítmény skálázhatósága a túlhajtás során mindkét résztvevőnél gyenge, ami a benchmark sajátosságaiból adódhat.

    XCOM 2

    Utolsó játékteszt az XCOM 2-ben. A játék a régebbi videokártyákat is térdre tudja hozni erős élsimítással. Az egyszerű FXAA-val ellátott Ultra profilra szorítkozunk.

    Kezdetben a Radeon RX 480 közelebb áll a kényszerű rivális szintjéhez. De a másodperc jobb frekvenciapotenciálja lehetővé teszi számára, hogy kiegyenlítse az esélyeket a túlhajtás után.

    3D Mark 11

    A Radeon RX 480 ebben a tesztben 5%-kal van lemaradva versenytársától, csak a frekvencia növelése után előzi meg.

    3D Mark Fire Strike

    De itt más a helyzet, és a Radeon RX 480 azonnal megelőzi, több mint 6%-kal. Ha gyorsulásról van szó, ismét az ellenfél veszi át a vezetést.

    Energia fogyasztás

    A mérések a korábban leírt módszer szerint történtek, de a Total War: Attila régebbi videokártyáinak adatainak figyelembevétele nélkül.

    Szinte azonos teljesítmény a Radeon RX 480, GeForce GTX 970 és GeForce GTX 1070 esetében. Úgy tűnik, ez nem túl jelentős eredmény a Radeon számára, de a falánk Radeon R9 290/390 hátterében ez komoly eredmény. A túlhajtás során tapasztalható energiafogyasztás meredek növekedése nem biztató. Úgy tűnik, hogy a magfrekvencia minden további százalékát nehéz lesz elérni.

    következtetéseket

    A tesztelés eredményei alapján közeli eredményeket jegyezhetünk fel Radeon videokártyák RX 480 és GeForce GTX 970. Valójában névlegesen az előny gyakrabban az AMD új termékén van, de az ellenfél túlhajtva nyer vissza. A DirectX 12-ben egyértelműbb a helyzet, és egyértelműen a Radeon RX 480 mellett van. A Radeon oldalon nagy mennyiségű memória van, amelyet egyes játékok már használhatnak. Ebből a hangerőből adódóan még egy vicces szituációt is megfigyelhetsz a Rise of the Tomb Raiderben, ahol utolérheted a Radeon R9 Fury X-et. De általánosságban véve nem érdemes összehasonlítani a Radeon RX 480-at és a Radeon R9 Fury X-et, ezek ezek döntések különböző szinteken. Kellemes megjegyezni, hogy a videokártya potenciálja nem csak Full HD-ben való játékot tesz lehetővé, hanem 2K módban is sok játékot vonz. Árkategóriájában a Radeon RX 480 remekül néz ki – gyorsabb, mint fő versenytársa, ígéretesebb DirectX 12-ben, ugyanakkor olcsóbb is.

    Az új 14 nm-es folyamattechnológia alacsony energiafogyasztást biztosít, de a videokártya nem nevezhető hidegnek. Annak érdekében, hogy a Radeon RX 480 a legolcsóbb ajánlat legyen a piacon, a gyártó spórolt egy keveset a hűtésen. A natív hűtő megbirkózik a névleges üzemmóddal, de nincs tere a túlhajtáshoz. Emellett gyorsulás közben az energiafogyasztás meredeken növekszik. Úgy tűnik, hogy a kezdeti frekvenciák a maximum közelében vannak, és akkor már nem lehet tovább szorítani. De kísérletek vele jó hűtés legyen értelme, akkor hasznot húz belőle. Csak várnia kell a Radeon RX 480 nem referencia verzióira, vagy pénzt kell költenie a CBO-ra.

    A Radeon RX 480 előnyei között érdemes megemlíteni a továbbfejlesztett VR-támogatást, a HDR-rel való munkavégzés lehetőségét és az ultra-nagy felbontású hardveres videókódolást/dekódolást. És ha a teljesítmény szempontjából nem ez a legerősebb javaslat az AMD-től, akkor határozottan a legprogresszívebb jelenleg.