• Chip kódneve: "Tahiti"
  • 4,3 milliárd tranzisztor (több mint 60%-kal több, mint a Cayman és pontosan kétszer annyi, mint a Cypress)
  • 384 bites memóriabusz: hat 64 bites széles vezérlő GDDR5 memória támogatással
  • Magórajel: akár 925 MHz (Radeon HD 7970 esetén)
  • 32 GCN számítási egység 128 SIMD maggal, összesen 2048 lebegőpontos ALU-val (Integer és Float formátumok, IEEE 754 FP32 és FP64 precíziós támogatás)
  • 128 textúraegység, támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • 32 ROP élsimítási módok támogatásával, képpontonként több mint 16 minta programozható mintavételezési lehetőségével, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 32 minta óránként, színtelen módban (csak Z) - 128 minta óránként
  • Hat monitor integrált támogatása, beleértve a HDMI 1.4a-t és a DisplayPort 1.2-t

Radeon HD 7970 grafikus műszaki adatok

  • Mag órajel: 925 MHz
  • Univerzális processzorok száma: 2048
  • Textúra egységek száma: 128, keverési egységek: 32
  • Effektív memóriafrekvencia: 5500 MHz (4×1375 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 3 gigabájt
  • Memória sávszélessége: 264 gigabájt másodpercenként
  • elméleti maximális sebesség Kitöltés: 29,6 gigapixel másodpercenként
  • Elméleti textúra mintavételi sebesség: 118,4 gigatexel másodpercenként
  • Két CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Áramfelvétel: 3-250 W
  • Egy 8 tűs és egy 6 tűs tápcsatlakozó
  • Kettős slot kialakítás
  • US MSRP: 549 USD

Radeon HD 7950 grafikus műszaki adatok

  • Magfrekvencia: 800 MHz
  • Univerzális processzorok száma: 1792
  • Textúra egységek száma: 112, keverési egységek: 32
  • Effektív memóriafrekvencia: 5000 MHz (4×1250 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 3 gigabájt
  • Memória sávszélessége: 240 gigabájt másodpercenként
  • Elméleti maximális kitöltési sebesség: 25,6 gigapixel másodpercenként.
  • Elméleti textúra mintavételi sebesség: 89,6 gigatexel másodpercenként
  • Két CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Teljesítményfelvétel: 3-200 W
  • Kettős slot kialakítás
  • US MSRP: 449 USD

Az új chip nagy összetettsége felhívja a figyelmet - 4,3 milliárd tranzisztor, ami több mint fele az előző csúcskategóriás grafikus processzor tranzisztorainak. Egy ilyen összetett kristály elkészítését egy modern, 28 nanométeres folyamattechnológia alkalmazása tette lehetővé, és az új chip felülete még a Kajmán méreténél is kicsivel kisebbnek bizonyult. És érezhetően javultak a teljesítményt befolyásoló gyakorlati jellemzői: az ALU-k, TMU-k száma, memóriabusz. Csak a ROP-ok száma nem nőtt, a GDDR5 videomemória frekvenciája pedig változatlan maradt.

A cég videokártyáinak elnevezésének elve változatlan maradt. A Radeon HD 7970 a cég legproduktívabb egylapkás megoldása, egy idő után megjelent a fiatalabb HD 7950 modell, amit valamivel később jelentettek be. Kezdetben a HD 7970-nek nem volt versenytársa a piacon, és nem cserélt le egyetlen videokártyát sem az AMD vonalról, hanem inkább lejjebb helyezte. Ami a versenytárssal való összehasonlítást illeti, az NVIDIA jóval később adta ki 28 nm-es megoldását.

Ugyanez a GDDR5 memória került az új AMD videokártyára is, de a térfogata az előző generáció 2 gigabájtja helyett 3 gigabájtra nőtt. Ez a memóriabusz 256 bitesről 384 bitesre való bővítése miatt történt. Most pedig akár 1,5 GB-ot, akár 3 GB-ot helyezhet az új kártyára. Természetesen marketing szempontból a kisebb kötet telepítése egyértelműen hátrányt jelentene, így a 3 GB mellett döntöttek, bár ez ma már kicsit sok. Csak ultra-nagy felbontásban és MSAA-val a 16x 1,5-2 GB nem lesz elég. Az AMD azonban rendelkezik Eyefinity-vel is, és a három vagy több monitoron lévő játékoknál a képernyőpuffer csak nagyon nagy mennyiséget foglal el.

Nézzük tehát a Radeon HD 7970-et. A felső árkategóriába tartozó új videókártya kétnyílásos hűtőrendszerrel rendelkezik, amit a minden modern AMD alaplaptól megszokott műanyag ház borít teljes hosszában. a kártyáról. Csak ennek a burkolatnak a kialakítása változott egy kicsit hátsó vége még mindig túlmutat a nyomtatott áramkörön. A csapokkal ellátott rúd kialakítása azonban megváltozott - a videokártya hűtésének javítása érdekében a két nyílás egyikét (a rúd felét) kizárólag egy szellőzőnyílás foglalta el a hőelvezetés érdekében.

De a felhasználóknak nem kell szenvedniük a közvetlenül az alaplapra forrasztott DVI-csatlakozók számának csökkenésétől. Kényelmük érdekében egy speciális HDMI-DVI adapter kerül a csomagba, amely lehetővé teszi két DVI csatlakozós monitor csatlakoztatását. Az új kártya fogyasztása egyébként nem alacsonyabb, mint a Radeon HD 6970-é, így egy 8 tűs és egy 6 tűs tápcsatlakozó készletet kellett beszerelnie.

De az új Radeon HD 7970-ben a hűtőrendszer jobbra változott. Az elpárologtató kamra új generációját és egy új, nagyobb hűtőt használnak, módosított lapátformával és megnövelt teljesítménnyel (nagyobb légáramlás biztosított). Az eredmény a hűtő hatékonyságának növekedése, miközben csökkenti a zajt.

Nem tűnt el az alaplapról a Dual BIOS firmware kapcsoló, amiről a Radeon HD 6900 leírásában írtunk. A felhasználóknak és az AMD-nek is annyira megtetszett ez a kényelmes megoldás, hogy az AMD úgy döntött, továbbra is csúcskategóriás megoldásokat készít vele.

Csak köszönni tudunk ezt a döntést, amely valóban segít a villogás közben fellépő váratlan problémákkal kapcsolatos különféle esetekben (például a tápfeszültség kikapcsolása közben), és lehetővé teszi, hogy félelem nélkül végezzenek különféle kísérleteket a BIOS-képekkel. Nem meglepő módon az AMD újra és újra utal az új grafikus kártya kiváló túlhajtási képességeire:

Mint látható, az 1 GHz-es és magasabb frekvenciára való túlhajtás gyakorlatilag meg van ígérve, ha nem vesszük figyelembe azt a kis feliratot (ami nem szerepelt a képernyőképen), hogy a garancia akkor is megszűnik, ha a videokártya meghibásodik egy kísérlet eredménye a frekvencia növelésével a beállítások videó-illesztőprogramból.

Építészeti jellemzők Radeon HD 7970

A déli szigeteken végrehajtott építészeti módosítások relevanciájának felméréséhez először is vegyük figyelembe a GPU elmúlt néhány évbeli fejlődését az AMD nézetben. 2002 előtt a grafikus chipek olyan speciális hardverek voltak, amelyek tisztán grafikus számítástechnikára voltak képesek. Az akkori videochipek funkcionalitása korlátozott volt, csak textúrákat tudtak alkalmazni és szűrni, geometriát dolgoztak fel, primitív raszterezést végeztek, ezért egyáltalán nem voltak alkalmasak univerzális számítási feladatokra.

Az elkövetkező néhány évben az alapvető programozási lehetőséggel bővült a GPU, de ez is kizárólag a grafikus feladatokra koncentrált. Ez volt a DirectX 8 és 9, korlátozott funkcionalitású, lebegőpontos képességgel rendelkező shader programok támogatásának ideje. Az akkori videochipek speciális ALU-kkal rendelkeztek csúcs- és pixelfeldolgozásra, valamint dedikált gyorsítótárak a pixelek, textúrák és egyéb adatok számára. Az egyetemesség még mindig közel sem volt.

És csak 2007-ben az AMD egységes árnyékoló architektúrát kapott a DirectX 10-en, valamint a GPU programozásának lehetőségét speciális eszközökkel: CAL, Brook, ATI Stream. Az akkori GPU-k már fejlett gyorsítótárral és helyi és globális megosztott adatok támogatásával rendelkeztek. Építészetileg a chipek VLIW5 és VLIW4 blokkon alapultak, elég rugalmasak néhány alapvető használathoz. grafikus számítástechnika, de továbbra is a grafikus algoritmusokra összpontosított.

És most itt az ideje egy új architektúrának, amely még jobban megfelel az univerzális számítástechnikához - Graphics Core Next (GCN). Az AMD számára ez egy új építészeti korszak, ezért választották a nevet. Az új GPU-k kiváló grafikus feldolgozási képességeket és teljesítményt kínálnak, de a végrehajtott architektúra változtatások célja elsősorban a nem grafikus számítástechnikában elfoglalt pozíció javítása – a teljesítmény és a hatékonyság növelése összetett általános célú feladatoknál. Új dizájn A GPU-t úgynevezett heterogén számítástechnikára tervezték – a grafikus és az univerzális számítástechnika keverékére többfeladatos környezetben. A GCN architektúra rugalmasabbá vált, és még jobban alkalmasnak kell lennie különféle feladatok energiahatékony végrehajtására.

Az új architektúra alapblokkja a GCN blokk. A Southern Islands sorozat összes új GPU-ja ezeken a "téglákon" alapul. Az AMD grafikus chipek architektúrája először nem VLIW-konstrukciót használ, vektoros és skaláris blokkokat használ, és az egyik legfontosabb változás, hogy a GCN számítási blokkok mindegyike saját ütemezővel rendelkezik, és különféle programokból képes utasításokat végrehajtani. (kernel).

Az új számítási architektúrát a számítási egységek nagy hatékonyságú betöltésére tervezték többfeladatos környezetben. A GCN számítási egység négy alszakaszra oszlik, amelyek mindegyike a saját utasításfolyamán működik minden órajelcikluson. A szálak a GCN-ben található skaláris blokkot is használhatják áramlásszabályozáshoz vagy mutatóműveletekhez. A vektor- és skalárblokkok kombinációja nagyon egyszerű programozási modellt kínál. Például a függvénymutatók és a veremmutatók sokkal könnyebben programozhatók, és a fordító feladata is jelentősen leegyszerűsödött, mivel a végrehajtási egységek skalárisak.

Minden GCN blokknak van dedikált helyi raktár adatok 64 KB-ig adatcseréhez vagy lokális verembővítés a regiszterekhez. Ezenkívül a blokk tartalmaz egy első szintű gyorsítótárat olvasási és írási képességgel, valamint egy teljes értékű textúra folyamatot (mintavételi és szűrési blokkokat). Ezért az új számítási egység önállóan, központi ütemező nélkül képes dolgozni, amely a korábbi architektúrákban a munka blokkok közötti elosztásáért volt felelős. Mostantól a GCN blokkok mindegyike képes önállóan ütemezni és elosztani a parancsokat, egy számítási egység akár 32 különböző parancsfolyamot is végrehajthat, amelyek a memóriában különböző virtuális címterekből származhatnak, és teljesen védettek és egymástól függetlenek.

Az AMD korábbi GPU architektúrái a VLIW4 és VLIW5 architektúra modelleket használták, és bár elég jók grafikai feladatok, de nem elég hatékonyak az univerzális számítástechnikához, mivel ilyen körülmények között nagyon nehéz az összes végrehajtó egységet munkával terhelni. Az új GCN architektúra hasonlóan nagy számú végrehajtási egységet kínál, de skaláris végrehajtásban, amely megszünteti a regiszterek és utasítások korlátait és függőségeit. A VLIW architektúráról a skaláris végrehajtásra való áttérés észrevehetően leegyszerűsíti a kódoptimalizálási feladatokat.

Amikor a korábbi VLIW4 architektúrán végrehajtja az utasításokat, a fordítónak foglalkoznia kell a regiszterkonfliktusok feloldásával, az utasítások bonyolult elosztásával a végrehajtási egységekhez a kódfordítási szakaszban stb. Ugyanakkor a nagy teljesítmény elérése érdekében gyakran nem triviális optimalizálás szükséges. szükséges, ami a legtöbb grafikai feladathoz alkalmas, más számításokhoz pedig sokkal kevésbé rugalmas. Az új architektúra jelentősen leegyszerűsíti a fejlesztést és a támogatást, egyszerűsíti a létrehozást, elemzést és a hibák elkapását az alacsony szintű kódokban, valamint stabil és kiszámítható teljesítményt.

Memória-gyorsítótár alrendszer

A sávszélesség, a memória és a gyorsítótár soha nem elég, és mindig van szükség és módszerek ezek növelésére. Az AMD új GPU-i teljes kétszintű olvasási/írási gyorsítótárat használnak. Minden számítási egység 16 kilobájt első szintű gyorsítótárral rendelkezik, a második szintű gyorsítótár teljes mennyisége pedig 768 kilobájt (összesen 512 KB L1 és 768 KB L2 kap a chipet), ami 50%-kal több, mint az előző chipben. , amely egyáltalán nem tud írni az L2 gyorsítótárba.

A teljesítmény szempontjából minden GCN számítási egység 64 bájtnyi adatot tud fogadni vagy írni az L1 gyorsítótárból vagy a globális memóriából egy ciklusban, ami a parancsfolyamok közötti adatcserét szolgálja. Ugyanaz az adatmennyiség képes az L2 cache memória minden egyes szakaszának továbbítására és fogadására. Ennek eredményeként a cég csúcskategóriás GPU-ja 2 terabyte/s-ot ér el az L1-nél és 700 GB/s-ot az L2-nél, ami 50%-kal több, mint a korábbi csúcs AMD-megoldás.

Tahiti GPU

Most, hogy megnéztük az új Southern Islands sorozat alacsony szintű építészeti változtatásait, ideje továbbmenni a sorozat legerősebb megoldásának, a két modellt tartalmazó Radeon HD 7900-nak a részleteire. Először is vegyük csak észre az új GPU óriási bonyolultságát, mert több mint 4,3 milliárd tranzisztort tartalmaz, ami kétszer annyi, mint a Radeon HD 5870 alapját képező chipben volt! Természetesen egy ilyen erős chip csak az új, 28 nm-es folyamattechnológia alkalmazásának köszönhetően vált lehetségessé. Szóval mi van benne?

A geometriai blokkok száma nem változott, a Kajmánhoz képest továbbra is kettő van, de jelentősen megnőtt a munkájuk hatékonysága - erről kicsit később bővebben is kitérünk. A grafikus processzor diagramon a Radeon HD 7970-en 32 GCN architektúra számítási egységet látunk, a junior megoldás esetében pedig ezek egy része le lesz tiltva. Ha figyelembe vesszük a megoldás számítási csúcsteljesítményét, akkor ez közel 3,8 teraflop (a lebegőpontos műveletek száma másodpercenként), ami ma abszolút rekord egy GPU-nál.

Minden GCN blokk 16 textúraegységet tartalmaz, ami összesen 128 TMU-t ad chipenként, vagyis több mint 118 gigatexelt/sec – és ez egy újabb rekord a kiadás idején, és nem az utolsó. De a ROP blokkok száma nem változott, még mindig 32 darab van 8 kinagyított RBE blokkban. Egy másik érdekes építészeti változás, hogy most a ROP blokkokat nem memóriacsatornákhoz „csatolják”, mint korábban, hanem GCN blokkokhoz.

Bár az elméleti keretpuffer írási sebessége nem sokat változott, és a maximálisan lehetséges ugyanaz a 32 színérték és a 128 mélységérték óránként, a gyakorlati kitöltési arány (kitöltési ráta) a valós alkalmazásokban jelentősen megnőtt a megnövekedett növekedés miatt. Memória sávszélesség. Az AMD a Cayman-t mindössze 23 pixel/órajelre mérte, míg az új Tahiti megközelítette az elméleti 32 pixelt órajelenként.

Ez érthető, mert az új AMD videochip 384 bites memóriabusszal rendelkezik - hat 64 bites csatorna, akárcsak a jelenlegi csúcsversenytárs megoldása. A memória sávszélességének ez a 1,5-szeres növekedése teszi lehetővé a textúrák lekérésének és a framebufferbe való írásnak a tényleges sebességének növelését. A 264 GB/s sávszélességnek hozzá kell járulnia ahhoz, hogy az elméleti 118 gigatexel/mp és 30 gigapixel/mp érték közelébe kerüljön, a gyakorlati részben ezt fogjuk ellenőrizni.

A „lecsupaszított” Radeon HD 7950 grafikus processzor esetében Tahiti 28 aktív GCN architektúra számítási egységet tartalmaz a chipen fizikailag elérhető 32-ből. A Radeon HD 7970-es sorozat junior megoldása esetében úgy döntöttek, hogy ezek közül négyet letiltanak. Mivel minden GCN 16 textúraegységgel rendelkezik, az új modell teljes TMU-száma 112 TMU, ami közel 90 gigatexel/sec átviteli sebességet biztosít.

De a HD 7950-ben a ROP-ok és a memóriavezérlők száma nem változott, úgy döntöttek, hogy nem vágják le őket, és megtartják ugyanazt a 32, illetve 6 darabot. Ezért a Tahiti Pro videochip ugyanazzal a 384 bites memóriabusszal rendelkezik, hat 64 bites csatornából összeállítva, mint az AMD legjobb megoldása. Nyilvánvalóan a számítástechnikai funkcionális eszközök szenvednek leginkább a házasságtól a gyártás során, és úgy döntöttek, hogy nem vágnak le minden mást.

Tesellációs és geometriai feldolgozás

Építészeti szempontból semmi különös nem változott a Tahiti geometriai tömbjein a Kajmán óta. Továbbra is két blokkot használ a geometriai adatok feldolgozására (csúcsok beállítására és tesszellációra) és a raszterezésre, és a séma nagyon hasonló a korábban látotthoz, kivéve, hogy a tessellátorokat már 9. generációnak hívják:

A sematikus hasonlóságok ellenére ezen blokkok legújabb generációja lényegesen jobb tesszellációs és geometriai feldolgozási teljesítményre képes, mivel a blokkok jelentős módosításokon estek át. Bár a csúcsteljesítmény csak majdnem kétmilliárd csúcsra és primitívre nőtt másodpercenként (925 MHz és órajelenként két csúcs), igazi teljesítmény többet nőtt. Ezt a gyorsítótárak méretének növelésével, a geometriai adatok pufferelésének javításával és a csúcsadatok újrafelhasználásával érték el.

Ennek eredményeként a tesszelációs teljesítmény minden háromszög felosztási aránynál akár négyszeresére is javult az előző generációs Radeon HD 6970-hez képest. De négyszer nem minden esetben érhető el, még az AMD diagramján sem:

A diagram a Radeon HD 7970 tessellációs teljesítményének összehasonlítását mutatja a HD 6970-hez képest 1-32-es felosztási arány mellett. És amint látja, a teljesítménykülönbség 1,7-4-szeres. De ez csupasz szintetikus anyag. És hogy közelebb kerüljünk a valósághoz, a játékalkalmazásokban már több adatot adunk a tesszellációs sebességről:

Amint láthatja, az AMD szintetikus számait jól támogatják a játékhoz tartozók – a valós alkalmazások teljesítménye „nehéz” tesszellációval jelentősen nőtt. Ez egy nagyon jó eredmény, amit a gyakorlati részben mindenképpen ellenőrizni fogunk, szintetikus és játékalkalmazások példáján.

Nem grafikus számítások

A heterogén és nem grafikus számítási feladatok szempontjából két aszinkron számítási motor (Asynchronous Compute Engines - ACE) jelent meg. Úgy tervezték őket, hogy ütemezzék és megosszák a munkát a végrehajtási egységek között a hatékony többfeladatos munkavégzés érdekében, valamint a grafikus parancsprocesszorral (Command Processor) együttműködve.

A Radeon HD 7900 két független számítási motorral és egy grafikus motorral rendelkezik. Ez összesen három programozható blokkot és három utasításfolyamot ad, egymástól teljesen elválasztva. És amellett, hogy aszinkron parancsokat ad ki a gyors kontextusváltáshoz, az új GPU két kétirányú közvetlen memóriaelérési (DMA) vezérlőt is tartalmaz, amelyet a Caymanban vezettek be. Ez a két vezérlő szükséges az új PCI Express 3.0 busz előnyeinek teljes kihasználásához.

Mint tudjuk, a komoly számítások szempontjából nemcsak az egyszeres pontosságú lebegőpontos műveletek végrehajtásának sebessége, hanem a dupla pontosság (double precision floating point) is fontos. Az AMD új architektúrája pedig ezt elég jól teljesíti. A Ebben a pillanatban Feltételezzük, hogy a GCN számítási egységeknek két változata létezik, amelyek különböző végrehajtási sebességgel rendelkeznek az FP64 utasításokhoz. A régebbi GPU esetében a végrehajtási arány az FP32 sebességének 1/4-e, a fiatalabb chipeknél pedig 1/16, ami bőven elég a kompatibilitás fenntartásához, de nem bonyolítja túlságosan az olcsó megoldásokat. Ennek eredményeként a Radeon HD 7970 másodpercenként 947 milliárd duplapontosságú műveletre képes (ó, csak alig érték el a teraflopot!) – az új AMD lapka másik legmagasabb eredménye.

Ráadásul ezek nem ugyanazok a gigaflopok, mint a korábbi architektúrák esetében, hanem „kövérebbek”. Végtére is, az új GPU hatékonysága az összetett számítási feladatokban komolyan növekednie kell. Először is a memória és a gyorsítótárazási alrendszer fejlesztése történt meg. Másodszor, minden GCN számítási egység saját ütemezővel rendelkezik, amely javítja az elágazó kód végrehajtását és az általános hatékonyságot. Harmadszor pedig megjegyezzük a skaláris végrehajtást, amely nem igényel bonyolult optimalizálást a fordítótól, aminek következtében a számítási egységek sokkal ritkábban lesznek tétlen. Ennek eredményeként bármilyen feladatban könnyebb lesz az új chip nagy teljesítményt és ALU-terhelést mutatni.

A számítási képességekkel kapcsolatos egyéb újítások mellett megjegyezzük az ECC teljes támogatását a DRAM és az SRAM számára. Szoftveres oldalon fontos, hogy Tahiti az első olyan GPU, amely teljes mértékben támogatja az új API-verziókat: OpenCL 1.2, DirectCompute 11.1 és C++ AMP, valamint ezek képességeit. Például az OpenCL 1.2 lehetővé teszi több számítástechnikai eszköz képességeinek egyesítését, és AMD már kiadta a támogatást az AMD APP SDK 2.6 és a Catalyst 11.12 illesztőprogram formájában.

Építészeti teljesítmény és hatékonyság

Miután áttekintettük az összes építészeti újítást a Southern Island sorozat csúcslapkájának példáján, itt az ideje, hogy beszéljünk ezeknek a változtatásoknak a hatékonyságáról. Jól látható, hogy az új chipek teljesítménye jóval magasabb, mint a korábbiaké, ennek ellenkezője elég meglepő lenne. A kérdés az, hogy mennyivel gyorsabb. Különböző feladatokban 40-50%-tól (minimum!) ötszörös különbségig kapunk számokat. Az architektúra fejlesztései lehetővé teszik az elméleti 1,4-szeres különbség túllépését a buta gigaflopokban. Nézzük ezt példákkal:

A diagram összehasonlítja az új csúcsmegoldást és a korábbi egylapkás megoldást: Radeon HD 7970 és HD 6970, ami elég korrekt. Különféle teljesítményteszteket választanak: a SmallptGPU és a LuxMark az OpenCL sugárkövetését, az SHA256 egy biztonságos kivonatolási algoritmus, az AES256 pedig egy szimmetrikus titkosítási algoritmus. Nos, a Mandelbrot egy jól ismert probléma, amelyet dupla pontosságú számításokkal számolnak.

A függőleges szaggatott vonal a grafikonon az elméleti teljesítménykülönbséget jelzi, de a sebességadatok azt mutatják, hogy ötből háromnál lényegesen nagyobb volt az új GPU sebessége. Ez a hatékonyság növelését célzó összes változásnak köszönhető: a VLIW-től való eltávolodás, az ütemező jelenléte az egyes számítási egységekben, a jobb gyorsítótár stb.

Változások a renderelés minőségében

Tulajdonképpen ezt a részt ki is lehetett volna hagyni, hiszen a képminőséggel kapcsolatban mostanában nincs különösebb igény, és nem is lehet - különböző okok miatt. Például a különböző gyártók videokártyáinál a teljes képernyős élsimítás minősége nagyon közel van, különösen, ha figyelembe vesszük az utófeldolgozó szűrőket alkalmazó szoftveres élsimítási módszerek széles körben elterjedt használatát, amelyek minden GPU-n pontosan ugyanúgy működnek. .

Ugyanez vonatkozik a textúra szűrésére is – most már olyan a minősége, hogy nagyon nehéz különbséget tenni az AMD és az NVIDIA megoldások között, még akkor is, ha pixelenkénti összehasonlítást végzünk. A Radeon HD 6900 - a cég előző generációja - az anizotróp szűrést egy kicsit továbbfejlesztette, és most már egy "mikroszkóp" sem segít abban, hogy jelentős hibákat találjanak. Az egyetlen megjegyzés az, hogy mozgás közben a Radeon videokártyák valamivel gyengébbek voltak a GeForce-nál az észrevehetőbb specifikus műtermékek, például a "zaj" vagy a "homok" miatt.

Az új generációs videochipek kiadásával a textúraszűrőben lévő texel súlyokat ismét felülvizsgálták, oly módon módosították, hogy csökkentsék az olyan műtermékeket, amelyek néha a Radeon HD 6900-on is láthatók bizonyos típusú textúrák jelenlétében. („nagyfrekvenciás”, például éles átmenetekkel a sötétből a világosba). A minőség változását olyan nehéz példákkal kimutatni, hogy az AMD nem ad HD 7900 és HD 6900 összehasonlító képeket, hanem egyszerűen összehasonlítja a „hardveres” algoritmus minőségét egy tisztán szoftveres algoritmussal, amely GPU stream processzorokon fut, és ezért ideális. :

Egy ilyen kis képernyőképen nem látszik a minőségbeli különbség, de az AMD biztosítja, hogy az összes végrehajtott változtatás nem hozott teljesítménycsökkenést, és nem rontotta a képminőséget egyik szempontból sem - ez továbbra sem függ a szögtől, ill. a szűrési minőség közel ideális. Az egyik jövőbeni gyakorlati anyagban ezt mindenképpen ellenőrizni fogjuk.

Részben rezidens textúrák

A Partially Resident Textures (PRT) ötlete a bemutatott GPU hardveres képességeinek felhasználása. virtuális memória. Bizonyára sok felhasználó látta már az id Software RAGE játékát, amely a virtuális textúra technológiát, az úgynevezett megatextúrást ("MegaTexture") alkalmazza, amely hatalmas mennyiségű textúra adat felhasználását és videomemóriába cserélését (streamelését) biztosítja.

A virtuális videomemória használatával nagyon könnyen beszerezhető hatékony hardveres támogatás az olyan algoritmusokhoz, amelyek akár 32 terabájt textúra használatát is lehetővé teszik egy alkalmazásban, ami lehetővé teszi egyedi helyszínek készítését a játékokban, a textúrák ismétlődése nélkül. teljes hiánya problémák a textúraadatok betöltésekor. Igaz, túl furcsa az AMD szemléltető példája, amiből semmi sem derül ki különösebben:

A PRT lehetővé teszi a kiváló képminőség elérését, és segít a videomemória-használat hatékonyságának növelésében. Hasonló algoritmusokat már használnak az id Software motorban, és várhatóan sok következő generációs motorban is megjelennek. A jövő játékainak hatalmas adatmennyiséggel kell dolgozniuk, és az új GPU előnye, hogy a PRT algoritmusokban a helyi grafikus memória úgy működik, mint a hardveres cache memória, és szükség esetén textúrák kerülnek bele. A Southern Islands család GPU-i 32 terabájtig támogatják a "mega-textúrákat" (akár 16384×16384-es felbontás), és ami a legfontosabb, a hardveres textúra szűrést, ami a korábbi videochipeken nem érhető el.

A virtuális textúrák 64 kilobájtos darabokra vannak osztva (kilobyte, nem texel), és ez a darabméret rögzített. És csak azok kerülnek be a videokártya helyi memóriájába, amelyek az aktuális képkocka rendereléséhez szükségesek. A technológia a textúra formátumtól függetlenül működik, csak a darabok mérete texelben lesz eltérő. Például egy normál tömörítetlen textúránál, színenként 32 bittel, a darab mérete 128x128 texel, a DXT3-mal tömörített textúránál pedig 256x256 texel.

A technológia magában foglalja a textúrák mip-szintű használatát is (a textúra szűrésében használt kisebb másolatok). Rendereléskor és szűréskor többször kell hozzájuk férni. Tekintsük az algoritmus működését egy példán.

Ez az ábra négy különböző darabot emel ki a rendereléshez szükséges különböző mip szintekből. Amikor a shader program adatokat kér tőlük, néhány darab már a helyi memóriában van, és ezek az adatok azonnal elküldésre kerülnek a shadernek további számításokhoz. Néhány darab azonban hiányzik a táblázatból, és a pályázatnak kell eldöntenie, hogy mit tegyen egy ilyen hiányosság esetén. Például kérhetsz adatokat egy kisebb felbontású mip-szintről, akkor a kép homályos lesz, de legalább az igazságnak tűnik, és késedelem nélkül megrajzolódik. És a következő képkocka rendereléséig már betölthető a gyorsítótárba - a helyi videomemóriába. Azok, akik a RAGE-ot játszották, megértenek minket.

Ez egy hatékony algoritmus, amely lehetővé teszi hatalmas textúrák használatát, amelyek mindegyik objektumra egyediek. Hasonló algoritmusokat régóta használnak az offline renderelésben, kivéve a valós idejű számítások szükségességét. Az AMD még egy demót is készített a Walt Disney Animation Studios által az animációs filmekhez kifejlesztett Per-Face Texture Mapping technikával. Sajnos a demó még nincs készen, és csak alacsony felbontású képernyőképeket láttunk.

Ennek a textúra-leképezési technikának az a lényege, hogy minden sokszöghez hozzárendelünk egy bizonyos textúradarabot, anélkül, hogy UV-transzformációt kellene alkalmazni (egy háromdimenziós objektum felületének koordinátái és a két- dimenziós textúra). Ez a megközelítés megold néhány problémát a mozaikszerű tartalom létrehozásával azáltal, hogy nagyon egyszerűvé teszi az eltolásleképezési algoritmust. Ebben a módszerben a PRT-t a hatékony tárolásra és a textúraadatokhoz való hozzáférésre használják.

Médiakezelési utasítások

Érdekes újításnak tűnik a Déli-szigeteken a képfeldolgozásban használt speciális utasítások támogatása, mind statikus, mind dinamikus. Például az "abszolút különbségek összege" nevű, széles körben használt utasítás, ismertebb nevén SAD (abszolút különbségek összege), továbbfejlesztésre került. Végrehajtásának sebessége nagyon teljesítménykritikus szűk keresztmetszet számos kép- és videóadat-feldolgozó algoritmusban, mint például a mozgásérzékelés, a gesztusfelismerés, a képkeresés, a számítógépes látás és sok más.

De az ősi Radeon HD 5870 videokártya áttekintésében már írtunk az SAD támogatásáról. Most a szokásos SAD (4 × 1) mellett a Southern Islands is rendelkezik új utasítás- QSAD (négyszeres SAD), amely a SAD-ot a shift operátorokkal kombinálja a teljesítmény és az energiahatékonyság növelése érdekében, valamint az MQSAD "maszk" utasítás, amely figyelmen kívül hagyja a háttér pixeleit, és a keretben mozgó objektumok háttértől való elkülönítésére szolgál.

Az új GPU-k akár 256 pixelt is képesek feldolgozni GCN számítási egységenként órajelenként, ami a modell esetében AMD Radeon A HD 7970 8 bites egész színértékek esetén másodpercenként akár 7,6 billió képpont feldolgozását jelenti. Bár ez elméleti adat, az új GPU-k vizuális feldolgozási képességei meglehetősen lenyűgözőek – számos videófeldolgozási feladat valós időben is elvégezhető.

PCI Express 3.0

Nem hagyhattuk el a PCI Express harmadik verziójának támogatását a dél-szigeteki új grafikus megoldások egész sora mellett. Ez a támogatás nagyon várt volt, hiszen 2010 őszén végre jóváhagyták a PCI Express harmadik verziójának specifikációit, de hardveres megoldások továbbra sem voltak a támogatásával, bár alaplapok már megjelennek, a videokártyák 2011 végén jelentek meg, és vannak megfelelő központi processzorok.

A frissített felület átviteli sebessége 8 gigatranzakció másodpercenként a 2.0-s verzió 5 GT/s helyett, és áteresztőképesség ismét megduplázódott (akár 32 Gb / s), összehasonlítva a PCI Express 2.0 szabvánnyal. Az új busz más kódolási sémát használ a buszon keresztül küldött adatokhoz, de a PCI Express korábbi verzióival való kompatibilitás megmaradt.

Az első alaplapok PCI támogatás Az Express 3.0-t 2011 nyarán vezették be a fő bázison Intel lapkakészlet Z68, és csak ugyanazon év őszén jelentek meg a széles körű értékesítésben. A videokártyák tehát időben megérkeztek, és az AMD ismét megelőzte a többieket a legfejlettebb technológiákat támogató új grafikus processzorok megjelenési sebességében. De még túl korai megítélni, hogy a PCI-E 3.0-nak lesz-e gyakorlati haszna.

AMD PowerTune technológia

A Cayman egyik legérdekesebb újítása a PowerTune fejlett energiagazdálkodási technológia volt. A rugalmas GPU energiagazdálkodást régóta használják, de a Radeon HD 6900 előtt ezek a technológiák meglehetősen primitívek voltak, és többnyire szoftveres módszerek voltak, és lépésenként változtatták a frekvenciát és a feszültséget, nem tudták kikapcsolni a videochipek nagy részét. .

Még a Radeon HD 5000 családban is megjelent egy teljesítménykorlátozó egy bizonyos fogyasztási szint túllépése esetén, a Radeon HD 6900-ban pedig minőségileg más szintre lépett a rendszer. Ennek érdekében a chipbe speciális érzékelőket helyeztek be az összes olyan blokkba, amely a rendszerindítási paramétereket figyeli. A GPU folyamatosan méri a terhelést és az energiafogyasztást, és ez utóbbit nem engedi túllépni egy bizonyos küszöbön, automatikusan beállítja a frekvenciát és a feszültséget úgy, hogy a paraméterek a megadott hőcsomagon belül maradjanak.

A korai energiagazdálkodási technológiákkal ellentétben a PowerTune közvetlen szabályozást biztosít a GPU energiafogyasztása felett, szemben a frekvenciák és feszültségek változtatásával történő közvetett szabályozással. Ez a technológia segít magas GPU-frekvenciák beállításában, nagy teljesítmény elérésében a játékokban, és nem kell félni attól, hogy a fogyasztás túllépi a biztonságos határokat. Végül is a legtöbb GPU-t használó játék és rendszeres alkalmazás lényegesen alacsonyabb energiaigényű, és nem közelíti meg a veszélyes energiafogyasztási határokat, ellentétben az olyan stabilitási tesztekkel, mint a Furmark és az OCCT.

A legnehezebb játékok sem igényelnek maximális fogyasztást, és ha a fogyasztást frekvenciával korlátozzuk, extrém tesztekkel tesztelve a videokártyákat, akkor a 3D-s játékok esetében elég sok kihasználatlan teljesítmény- és teljesítménylehetőség lesz. Abban az esetben, ha a videokártya nem érte el a biztonságos fogyasztási szint határát, a GPU a gyárilag beállított frekvencián fog működni, a FurMark és OCCT teszteknél pedig a GPU frekvenciája csökken, hogy a fogyasztási határokon belül maradjon.

Így a PowerTune segít magasabb gyári frekvenciák beállításában és a rendszer hangolásában a GPU-erőforrások leghatékonyabb felhasználására a beállított maximális teljesítményszint mellett. A fenti példában a HD 5870 nem használja a PowerTune-t, és a GPU-frekvencia-korlátozás miatt a nagy fogyasztás a tartóssági tesztekben nem használja ki teljes potenciálját. Míg a maximális TDP a Radeon HD 7970-hez van beállítva, a videochip pedig csak akkor állítja vissza a frekvenciákat, ha ezt túllépi, így a lehető legmagasabb teljesítményt éri el minden alkalmazásban.

Ez jól látható a következő ábrán. A játékalkalmazások esetében a TDP a GPU frekvenciájának növelésével érhető el, a csúcsterheléseknél pedig az állóképességi tesztek csökkentik a frekvenciát egy biztonságos energiafogyasztási szintre. A PowerTune nélkül választania kell - vagy a videokártya meghibásodásának valószínűségét szeretné kiszámítani, amikor a FurMark és az OCCT hosszú ideig fut, vagy csökkenti a lehetséges teljesítményt a játékokban. Az új technológia a lehető leghatékonyabban oldja meg ezeket a problémákat.

Az AMD PowerTune gyorsan reagál a változó körülményekre (mikroszekundum), mivel ez egy hardvertechnológia. Rugalmas frekvenciahangolása is megkülönbözteti, és nem lépcsős, mint az előző chipeknél. Minden mérés független a meghajtótól, de a felhasználó módosíthatja a videokártya beállításai segítségével.

A PowerTune és a korábban általánosan elfogadott megközelítés között az a különbség, hogy más esetekben hőszabályozást alkalmaznak, ami jelentősen csökkentett fogyasztású üzemmódba helyezi a GPU-t, a PowerTune pedig egyszerűen simán csökkenti a frekvenciáját, ezzel a beállított limiterre hozza a GPU-fogyasztást. Ez magasabb órajelet és nagyobb teljesítményt eredményez.

AMD ZeroCore technológia

Az AMD nem korlátozódott a korábbi megoldásokból már ismert energiagazdálkodási technológia alkalmazására. A Southern Islands család első lapkáiban bevezeti az AMD ZeroCore technológiát, amely a "mély üresjárat" (vagy "alvó") üzemmódban még nagyobb energiahatékonyságot segít elérni letiltott megjelenítő eszközzel, amit minden operációs rendszer támogat. .

Végül is szinte minden rendszer, még a játékhoz is, az idő nagy részét alacsony terhelésű módban tölti a grafikus processzoron. És a videokártya nem fogyaszthat sok energiát ebben az üzemmódban. És még inkább, nem beszélve a kikapcsolt monitor melletti üzemmódról – ilyenkor célszerű a GPU-t teljesen kikapcsolni. Ezt tette az AMD. A ZeroCore-nak köszönhetően az új GPU az energia kevesebb mint 5%-át fogyasztja teljes módban, amikor mélyen üresjáratban van, így a legtöbb funkcionális blokk letiltja ebben az üzemmódban.

Az AMD sematikus összehasonlítást ad saját Radeon HD 5870-ével, amely nem támogatja ezt a technológiát. A ZeroCore a déli szigetek exkluzív innovációja a laptopokhoz tervezett mobil GPU-k asztali megoldásaiban. Mellesleg, ennek a technológiának az előnyei nem csak a fogyasztás csökkenésével járnak. Ráadásul hosszú üresjárati üzemmódban, amikor a kijelző ki van kapcsolva, a videokártya a videokártya hűtőjén lévő ventilátort is teljesen kikapcsolja!

Sok felhasználó pontosan erre várt már régóta. A legérdekesebb, hogy adataink szerint a PowerTune-hoz és a ZeroCore-hoz hasonló megoldások laboratóriumi tesztjei több generációval ezelőtt zajlottak a videokártyáknál. Az AMD sorozatából a piacot régen elhagyott videokártyák némelyike ​​pontosan így működött, üresjáratban teljesen kikapcsolta a hűtőt.

Az AMD új, ZeroCore-kompatibilis grafikus kártyái révén azonban nem csak az egy GPU-t használók profitálnak a zajcsökkentésből és az energiafogyasztásból. Hasonló fejlesztések várnak a két, három, sőt négy GPU-ra épülő CrossFire rendszerek boldog tulajdonosaira is. Logikus-e végül is, hogy az operációs rendszer kétdimenziós interfészének megjelenítési módjában a fő kivételével az összes videokártya egyáltalán nem működhet? De most így működnek!

A 2D módban ZeroCore-támogatással rendelkező videokártyákon lévő CrossFire rendszerek esetében az összes másodlagos videokártya mély alvásba merül, minimális energiafogyasztással és letiltott hűtővel. Ez a mód több egylapkás videokártya és kétchipes megoldás esetén is működik. Ezenkívül az elsődleges CrossFire grafikus kártya is ebbe a módba lép a Windows rendszerben konfigurált hosszú üresjárati idő esetén. Vizuálisan a munka különbsége így néz ki:

Egyébként a technológia nem olyan egyszerű, mint amilyennek látszik. Az AMD mérnökeinek rengeteg problémát kellett megoldaniuk az operációs rendszer készenléti üzemmódban való működésével kapcsolatban. Például azt találták, hogy a Windows akkor is megpróbálja frissíteni a képernyőn megjelenő információkat, ha a monitor ki van kapcsolva. Ami persze egyáltalán nem teszi lehetővé a GPU letiltását. Ezért a cég programozóinak megoldást kellett találniuk, figyelmen kívül hagyva az összes képernyőrajzolási parancsot, amikor a monitort alvó módban kikapcsolták.

AMD Eyefinity 2.0 technológia

Természetesen az új architektúrában helyet kapott a több monitoron történő képek megjelenítésére szolgáló bevált technológia – az immár 2.0-s verziójú AMD Eyefinity – fejlesztése. Új funkciókat, nagyobb felbontást, több kijelző támogatását és nagyobb rugalmasságot kapott.

Ez a technológia meglehetősen érdekes, bár rendkívül kis számú felhasználó talál helyet a szobában, és összeszedi a bátorságát a család előtt, hogy kettőnél több monitort telepítsen. De jobb, ha megvan a lehetőség, hogy mindig ki tudd használni, mint ha egyáltalán nem. Ráadásul a nagy átlójú monitorok ára szinte nem csökken, a középkategóriás megoldások viszont folyamatosan olcsóbbak.

Valójában most jövedelmezőbb három 24 hüvelykes képátlójú monitort vásárolni, mint egy 30 hüvelykeset. Az AMD erre ad egy példát, ahol egy 30 hüvelykes 2560x1600-as monitor több mint 1000 dollárba kerül, míg három 24 hüvelykes FullHD monitor feleannyiért vásárolható meg:

De az, hogy hogyan költse el a pénzt és a helyet a szobában, minden felhasználó személyes dolga. A lényeg, hogy van ilyen lehetőség. Ráadásul az Eyefinity 2.0 már támogatja a HD3D sztereó módban történő képkimenetet – ez hiányzott a korábbi megoldásokból, amelyek ebben a paraméterben rosszabbak voltak, mint a versenytársak. Az AMD Eyefinity és a HD3D technológiákat ötvöző Radeon HD 7970 az első olyan egychipes megoldás, amely három monitort támogat sztereó módban.

A nagy felbontású sztereó renderelés nagyon gyors adatátviteli interfészt igényel. És az előzővel HDMI verziók kimenetek, a lehetőségek szemenként 24 Hz-re korlátozódtak, ami Blu-ray 3D-n való filmnézéshez bőven elég, játékosoknak viszont egyértelműen kevés.

Az ilyen feladatokhoz elkezdték használni a keretcsomagolási formátumot, amikor a bal és a jobb szem kereteit egybe egyesítik, és az AMD Radeon HD 7970 támogatja a HDMI 1.4a keretcsomagolási formátumot a sztereó kimenethez. Ez az első videokártya, amely támogatja a 3 GHz-es HDMI-t keretcsomagolással, ahol minden szem FullHD képpel rendelkezik 60 Hz-en (összesen 120 Hz):

Érdekes újdonságnak tűnik számunkra a Discrete Digital Multi-Point Audio (DDMA) többcsatornás hangkimeneti technológia, amely az Eyefinity-vel együtt működik. Az összes korábbi GPU csak egy audio adatfolyamot képes kimenni HDMI-n és DisplayPorton keresztül. Vagyis még akkor is, ha három különböző helyiségben található monitor csatlakozik a számítógéphez HDMI-n keresztül hangcsatorna csak egy kerül továbbításra. Az AMD Radeon HD 7900 azonban több független audiocsatorna egyidejű kimenetének támogatását is megkapta, ami bizonyos többmonitoros konfigurációkban jól jöhet.

Ugyanez a funkció nagyon hasznos lesz a videokonferencia-alkalmazásoknál, ahol több beszélgetőpartner külön képernyőn jelenít meg, valamint a többfeladatos alkalmazásokhoz, mint például a játék három monitoron való játékhoz játékhanggal és a hírek nézése külön képernyőn, független hangfolyammal. Korábban mindehhez több különálló audiorendszer használatára volt szükség, de most már minden a lehető legkényelmesebben működik.

Az Eyefinity szoftveres támogatásáról sem feledkeztek meg, szinte minden hónapban frissül a technológia - új lehetőségek jelennek meg. Tehát még októberben megjelent az 16384 × 16384 felbontásig terjedő felbontás és az új többmonitoros konfigurációk támogatása: vízszintes és függőleges 5 × 1, valamint hat monitor 3 × 2 módban.

Az AMD Catalyst videó-illesztőprogram decemberi frissítése az Eyefinity és a HD3D együttműködését hozza létre, februárban pedig bejelentették az egyéni felbontások támogatását, a tálcaelhelyezési módosításokat és az előre beállított menedzsment fejlesztéseit.

Hat monitor kimenete két DisplayPort 1.2 port és két MST hub segítségével érhető el (amiről korábban írtunk), míg három vagy akár négy monitorhoz csak egy port és a hozzá tartozó hub szükséges. Ezek a hubok rugalmas megjelenítési konfigurációkat kínálnak, DisplayPort 1.2 csatlakozónként legfeljebb négy FullHD-eszközt támogatnak, és 2012 nyarára várhatóak.

Apropó engedély. Nagy felbontású vagy akár ultranagy - Ultra High Resolution. A jelenlegi, 4000 pixeles felbontású készülékek nagyobb oldalon egyszerre több kábelt igényelnek: két DP 1.1 vagy négy DVI kábellel. A következő generációs ilyen felbontású monitorok egyetlen kábellel csatlakoztathatók: DP 1.2 HBR2 vagy HDMI 1.4a 3 GHz. És új grafikus kártya Az AMD már készen áll az ilyen monitorokra, ismét ez lett az első a világon.

Videó kódolás és dekódolás

Teljesen természetes, hogy az AMD Radeon HD 7970 ugyanazt az UVD blokkot tartalmazza a videó adatok dekódolására, mint ami a cég videochipeinek előző generációjában is megjelent. Egyszerűen nem igényel semmilyen módosítást, támogatja az MVC többfolyamos kodeket, az MPEG-2/MPEG-4 (DivX), VC-1 és H.264 dekódolást, valamint két FullHD stream dekódolását minden támogatott formátumban.

Az AMD megoldások biztosítják maximális minőség videofolyam-dekódolás, tucatnyi speciális minőségjavító algoritmust használjon, és maximális eredményeket biztosítson az olyan minőségi tesztekben, mint a HQV. A támogatott funkciók közül megjegyezzük: szín- és tónusbeállítás, zajcsökkentés, élesítés, kiváló minőségű skálázás, dinamikus kontraszt, fejlett deinterlacing és inverz telecine. Íme egy példa a menet közbeni kontrasztjavításra:

De a dekódolással az összes videochip többé-kevésbé rendben van már régóta. Minden új GPU megfelelő minőséget és teljesítményt biztosít a videoadatok megtekintésekor. De a videokódolás a GPU-n még gyerekcipőben jár, és a felhasználók fő panaszai a tömörített kép gyenge minőségére vonatkoznak.

Talán az új Radeon HD 7000-es sorozat segíthet ebben, mert a sorozat összes grafikus processzora rendelkezik Video Codec Engine (VCE) videókódoló egységgel. A Radeon HD 7970 volt az első videokártya, amely speciális blokk segítségével támogatta a hardveresen gyorsított kódolást és videótömörítést (korábban a stream processzorok vettek részt a kódolásban).

A minőségnek és a teljesítménynek egyértelműen jobbnak kell lennie, mint korábban, az 1080p 60 fps-es kódolás támogatásával, még a valós idejűnél is gyorsabban. Tesztek nélkül nehéz bármit is mondani a minőségről, de ígéretet kapunk a kódolók különböző szintű optimalizálására a videóadatokhoz és a játékokhoz, valamint változó tömörítési minőséget (a minőség vagy a teljesítmény közötti választás lehetősége).

Egyelőre nincs hely, ahol kipróbálhatná a VCE-t – egyszerűen nincsenek támogatást nyújtó alkalmazások, de az AMD olyan partnerekkel dolgozik együtt, mint az ArcSoft, hogy támogatást nyújtson a VCE számára a megfelelő szoftver termékek. A jövőben tervezzük egy szoftverkönyvtár kiadását a videókódolás felgyorsítására, amely megkönnyíti a fejlesztők számára a következő generációs AMD termékek támogatását.

A kódolás két módban történhet: teljes és hibrid (a GPU stream processzorok képességeit kihasználva). A teljes módot olyan alkalmazásokhoz tervezték, amelyek maximális energiahatékonyságot és egyenletes teljesítményt igényelnek. Kódolás be teljes mód a VCE gyorsabb, mint a valós időben, és alacsony késleltetést biztosít. De van hibrid üzemmód is:

Ebben a módban a GPU matematikai blokkok együtt működnek a VCE-vel. A diagramon sárgával bekarikázott összes nagymértékben párhuzamosítható fokozat használhatja a GCN számítási egységek teljesítményét, és a dedikált VCE egység hatékony hardveres entrópia kódolást végez. Ez a mód kiválóan alkalmas a nagy matematikai erővel rendelkező videokártyákhoz, mint például a Radeon HD 7970. A két mód minőségével kapcsolatban vannak még kérdések, de ez alapos elemzést igényel egy külön anyagban.

AMD állandó videó

A videó adatok kódolása és dekódolása mellett van még egy olyan terület, ahol az AMD új grafikájának erejét ki lehet használni – a rossz minőségű kézi videók javítása állvány vagy más hasonló képstabilizáló eszközök használata nélkül. A videóstabilizáló technológia az AMD Steady Video nevet viseli, és már megjelent a második verziója is.

A szoftveres stabilizátor algoritmusa meglehetősen egyszerű: a videó stream alapján statisztikákat gyűjtenek a kamera mozgásáról (eltolás, forgatás, zoom), és ezt a mozgást az aktuális képkockában kompenzálja a korábbiakhoz képest - a kép eltolja, forgatja és méretezi, hogy a kép ne ugorjon sokat, és stabil maradjon.

Amilyen egyszerű szavakban, olyan nehéz megvalósítani. Egyszerűen azért, mert kétmillió pixel van a képernyőn, és akár 30 vagy akár 60 képkocka is másodpercenként Képzelje el, hány számítást kell elvégeznie az összes lehetséges képkocka-eltolódás követéséhez. Fentebb már írtunk a videófeldolgozásban használt QSAD funkcióról, illetve a Steady Video 2.0-ban is használják a mozgásérzékelő algoritmus gyorsítására. Tehát a GPU-nak bármilyen irányban akár 32 pixeles amplitúdójú véletlenszerű eltolásokat kell feldolgoznia, ehhez pedig másodpercenként több mint 500 milliárd SAD-műveletnek megfelelő teljesítményre van szükség (1920x1080-nál 60 FPS-en).

A Radeon HD 7970 új QSAD utasításainak támogatásával előnye a nagy teljesítményű CPU-kkal szemben a mozgásérzékelő algoritmusban meghaladja a 10-szeresét! Vagyis a jó minőségű videót mostantól a rendelkezésünkre bocsátják, és nem csak a házi videók videószerkesztőben való feldolgozásakor, hanem mások online videóinak megtekintésekor is, amelyeket senki sem tudja, mit és senki sem hogyan forgat.

Részletek: Radeon HD 7800 sorozat

  • Chip kódneve: "Pitcairn"
  • Gyártási technológia: 28 nm
  • 2,8 milliárd tranzisztor (valamivel több, mint a Cayman, amely a Radeon HD 6900 sorozat alapja)
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek és egyebek.
  • Hardveres támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0 Shader modellt
  • 256 bites memóriabusz: négy 64 bites széles vezérlő GDDR5 memória támogatással
  • Mag órajel: akár 1000 MHz (Radeon HD 7870 esetén)
  • 20 GCN számítási egység 80 SIMD maggal, összesen 1280 lebegőpontos ALU-val (Integer és Float formátumok, IEEE 754 FP32 és FP64 precíziós támogatás)
  • 80 textúraegység, támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • 32 ROP élsimítási módok támogatásával, képpontonként több mint 16 minta programozható mintavételezési lehetőségével, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 32 minta óránként, színtelen módban (csak Z) - 128 minta óránként

Radeon HD 7870 grafikus műszaki adatok

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 1280
  • Textúra egységek száma: 80, keverési egységek: 32
  • Memória típusa: GDDR5
  • Memória kapacitása: 2 gigabájt
  • Elméleti maximális kitöltési sebesség: 32,0 gigapixel másodpercenként.
  • Elméleti textúra mintavételi sebesség: 80,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-175 W
  • Két 6 tűs tápcsatlakozó
  • Kettős slot kialakítás
  • US MSRP: 349 USD

Radeon HD 7850 grafikus műszaki adatok

  • Magfrekvencia: 860 MHz
  • Univerzális processzorok száma: 1024
  • Textúra egységek száma: 64, keverési egységek: 32
  • Effektív memóriafrekvencia: 4800 MHz (4×1200 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 2 gigabájt
  • Memória sávszélessége: 153,6 gigabájt másodpercenként
  • Elméleti maximális kitöltési sebesség: 27,5 gigapixel másodpercenként.
  • Elméleti textúra mintavételi sebesség: 55,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-130 W
  • Kettős slot kialakítás
  • US MSRP: 249 USD

A cég termékeinek elnevezésének elve ezúttal sem változott, és az előző sorozat trendjeit folytatták. A GCN architektúrára épülő videokártyák közepes költségvetésű sorozata az index második számjegyében tér el a felső és költségvetési soroktól: 7 és 9 helyett 8-as szám van beállítva, ami teljesen logikus. Mivel az AMD átvette az 1000 MHz-es pszichológiai küszöböt a GPU frekvenciájára, a Radeon HD 7870 a "GHz Edition" névvel egészítette ki, jelezve ennek a frekvenciának az elfogadását.

A névből kitűnik, hogy a Radeon HD 7800 termelékenyebb, mint a HD 7700, de kisebb sebességgel rendelkezik, mint a régebbi modellek - HD 7900. Az NVIDIA megoldásokkal való összehasonlításban a régebbi HD 7870 a megjelenéskor jelent meg. versenyez a videokártyával GeForce GTX 570, a fiatalabb pedig a GTX 560 Ti elleni harcot célozza, az NVIDIA pedig még nem adott ki új 28 nm-es középkategóriás lapkákat.

Az AMD mindkét videokártya-modellje azonos mennyiségű, 2 gigabájt GDDR5 memóriával rendelkezik. Mindkettő 256 bites memóriabuszt használ, így 1, 2 vagy 4 GB-ot tehet rájuk. Az 1 gigabájt túl kicsi, a 4 GB pedig túl drága ehhez árszegmens. Ezért elmondhatjuk, hogy az ideális, 2 GB-os videomemória mennyiségét választották, ami a játékok túlnyomó többségéhez még nagy felbontás mellett is bőven elegendő, és költség szempontjából nem túl költséges.

Más szempontból a fogyasztó szempontjából a HD 7850 és a HD 7870 modellek továbbra is különböznek egymástól. A régebbi Radeon HD 7870 nagyobb fogyasztású, ezért két további 6 tűs tápcsatlakozót igényel, a HD 7850 pedig csak az egyikkel elégszik meg. Mindkét kártya kétnyílásos hűtőrendszerrel rendelkezik, de a legtöbb gyártó saját tervezésű, legalább egy hűtővel, sőt egy PCB-vel ellátott táblát is gyárt.

A Radeon HD 7800 család építészeti jellemzői

Fentebb alaposan leírtuk az új Graphics Core Next (GCN) architektúra összes funkcióját, így csak a legfontosabbakat ismételjük meg. A cég összes új GPU-ja kiváló tulajdonságokat és teljesítményt kínál nemcsak a grafikus feldolgozásban, hanem a nem grafikus számítástechnikában is, beleértve a különböző típusú számítások keverékét is. Az új GCN architektúra emellett a kódoptimalizálási feladatok komoly leegyszerűsítését, a fejlesztés és támogatás leegyszerűsítését, valamint a stabil és kiszámítható teljesítményt és általában véve meglehetősen magas hatékonyságot kínálja.

Az új architektúra alapblokkja a GCN blokk, a Southern Islands sorozat összes GPU-ja ebből van összerakva. Tekintsük a Pitcairn chip blokkdiagramját:

A diagram a Radeon HD 7870 GPU-t mutatja (az "egyszerűsített" HD 7850 több leválasztott blokkkal különbözik tőle), a GCN architektúra 20 számítási egységét látjuk. A Radeon HD 7800-as sorozat junior megoldása esetében ebből négyet letiltottak, és az aktív blokkok száma benne 16. Ez 1280, illetve 1024 stream processzornak felel meg (akárcsak a HD esetében). 7700 család, csak pontosan kétszer annyi blokk van) . Mivel minden GCN egységnek négy textúraegysége van, a régebbi modell TMU-inak teljes száma 80, a fiatalabbé pedig 64 TMU.

De a ROP-ok és a memóriavezérlők száma a HD 7870-ben és a HD 7850-ben is megegyezik a legfiatalabb vonal megoldásaival. A ROP blokkok száma meglehetősen magas maradt - mindkét modellnél 32 darab. A Pitcairn alapú kártyák memóriabuszát 256 bitesre csökkentették, négy 64 bites csatornából rakják össze. Ez egy ilyen szintű megoldásnál nem rossz, bár másfélszer kevesebb, mint a felső sorban, mert hagyományosan a memóriabuszt vágják le először. Még jó, hogy a gyors GDDR5 memória használata viszonylag nagy, 153 GB/s sávszélességet adott.

A többi GCN architektúra chiphez hasonlóan a Pitcairn is tartalmaz egy 9. generációs tesselátor blokkot, amely számos pufferelési és gyorsítótárazási optimalizálást tartalmaz, amelyek jelentősen javíthatják a geometria feldolgozási teljesítményét. Íme az új AMD kártya összehasonlítása az előző generációs megoldással egy szintetikus problémában, amely szerint akár négyszeresére is feltételezhetjük a tesszellációs sebesség növekedését:

Az új Radeon HD 7000 videochipekben sok bevezetett és továbbfejlesztett AMD technológia is ugyanígy támogatott, itt van ezek hiányos listája: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, textúra szűrési minőség fejlesztések stb. Mindezt fentebb részletesebben ismertetjük. A lista kiegészítéseként a Radeon HD 7800 teljes mértékben támogatja a továbbfejlesztett MLAA 2.0 élsimítási algoritmust és a szupermintavételezési élsimítást (SSAA).

Ami a játékteljesítményt illeti, a Radeon HD 7870 lényegesen gyorsabb, mint közvetlen versenytársa, a GeForce GTX 570, különös tekintettel az utóbbi 1,25 GB-os VRAM-jára (a kérdéses megoldások 2 GB-jához képest), amelyet a modern játékokban nagy renderelési felbontás mellett figyeltek meg. . A fiatalabb Radeon HD 7850 összevethető a GeForce GTX 560 Ti-vel, és itt már nem büszkélkedhet a memória mennyiségével. Az AMD mérései szerint azonban új megoldásuk a legtöbb játékban így is gyorsabb a versenytársnál.

Részletek: Radeon HD 7700 sorozat

  • Chip kódneve: "Zöld-foki Köztársaság"
  • Gyártási technológia: 28 nm
  • 1,5 milliárd tranzisztor (kevesebb, mint a Barts, amely a Radeon HD 6800 sorozat alapja)
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek és egyebek.
  • Hardveres támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0 Shader modellt
  • Mag órajel: akár 1000 MHz (Radeon HD 7770 esetén)
  • 10 GCN számítási egység 40 SIMD maggal, összesen 640 lebegőpontos ALU-hoz (Integer és Float formátumok, IEEE 754 FP32 és FP64 precíziós támogatás)
  • 40 textúraegység, támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • Integrált támogatás akár hat monitorhoz, beleértve a HDMI 1.4a-t és a DisplayPort 1.2-t

Radeon HD 7770 grafikus műszaki adatok

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 640
  • Textúra egységek száma: 40, keverési egységek: 16
  • Memória típusa: GDDR5
  • Memória kapacitása: 1 gigabájt
  • Elméleti textúra mintavételi sebesség: 40,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-80 W
  • Egy 6 tűs tápcsatlakozó
  • Kettős slot kialakítás
  • US MSRP: 159 USD

Radeon HD 7750 grafikus műszaki adatok

  • Magfrekvencia: 800 MHz
  • Univerzális processzorok száma: 512
  • Textúra egységek száma: 32, keverési egységek: 16
  • Effektív memóriafrekvencia: 4500 MHz (4×1125 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 1 gigabájt
  • Memória sávszélessége: 72 gigabájt másodpercenként
  • Elméleti maximális kitöltési sebesség: 12,8 gigapixel másodpercenként.
  • Elméleti textúra mintavételi sebesség: 25,6 gigatexel másodpercenként
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, egy DisplayPort 1.2
  • Áramfelvétel: 3-55 W
  • Nem igényel további teljesítményt
  • Egyhelyes kialakítás
  • US MSRP: 109 USD

A GCN architektúrára épülő, olcsó videokártyák sorozata az index második számjegyében tér el a felső és a középső sortól: a 9. helyet a 7-es szám foglalta el, ahogyan korábban is. A Radeon HD 7770 termelékenyebb megoldás, de van egy fiatalabb modell is - a HD 7750. A régebbi kártyának a megjelenés idején nem volt közvetlen versenytársa a piacon, valahol a GeForce GTX 560 és a GTX 550 Ti között helyezkedett el. , a fiatalabb pedig a GTX 550 Ti elleni harcot célozza. A HD 7770 esetében később versenytársat jelentettek be a GeForce GTX 560 SE-vel szemben (minden NVIDIA megoldás régebbi GPU-kon alapul).

Az AMD videokártya mindkét figyelembe vett modellje ugyanannyi, 1 gigabájt GDDR5 memóriával rendelkezik. A 128 bites memóriabusz használata miatt 2 GB memória kerülhet rájuk, de ez a GDDR5-ös memória túl sokba fog kerülni az árszegmensükhöz képest. Ezért eddig ilyen volumenű modelleket adtak ki, bár a jövőben megjelenhetnek a 2 GB videomemóriával rendelkező opciók is. Időközben úgy döntöttünk, hogy ezt a hangerőt a HD 7800-nál hagyjuk.

Az egyéb fogyasztói jellemzőket tekintve a HD 7750 és a HD 7770 modellek meglehetősen különböznek egymástól. Ha a régebbi Radeon HD 7770 hűtőrendszere kétnyílásos kialakítású, hűtőjét pedig a régebbi megoldásokhoz hasonlóan műanyag burkolat borítja, akkor a fiatalabb HD 7750 érezhetően egyszerűbbnek tűnik, egy helyet foglal el és egyszerű hűtővel rendelkezik. A legtöbb gyártó azonban továbbra is saját tervezésű táblákat gyárt. Az új modellek fogyasztása ebben az árkategóriában is eltérő, a régebbi egy 6 tűs segédtáp csatlakozóval rendelkezik, a fiatalabbat pedig PCI Express hajtja.

Építészeti jellemzők Radeon HD 7700

Az új architektúra alapblokkja a GCN blokk, a sorozat összes GPU-ja ebből van összerakva. A rendelkezésre álló GCN blokkok mindegyike képes önállóan ütemezni és elosztani az utasításokat, és egy számítási egység akár 32 független utasításfolyamot is végrehajthat. Nézzük meg a Zöld-foki-szigetek chip blokkvázlatát:

A diagram a Radeon HD 7770 GPU-t mutatja (a „lecsupaszított” HD 7750 néhány leválasztott egységet tartalmaz), a GCN architektúra 10 számítási egységét látjuk. A Radeon HD 7700-as sorozat junior megoldása esetén kettő letiltása mellett döntöttek, a blokkok száma 8 lett. Ez 640 és 512 stream processzornak felel meg. És mivel minden GCN-egység 4 textúraegységet tartalmaz, a régebbi modell TMU-inak végső száma 40 TMU, a fiatalabbé pedig 32 TMU.

A ROP-ok és a memóriavezérlők száma a HD 7770-ben és a HD 7750-ben megegyezik, és úgy döntöttünk, hogy nem csökkentjük túlságosan a ROP-okat, és 16-ra hagyjuk őket. De a Zöld-foki-szigeteki memóriabusz 128 bitesre csökkent, amely két 64 bites csatornából van összeállítva. Általánosságban elmondható, hogy ez háromszor kevesebb, mint a csúcsszériákban, és újabb megerősítést láttunk, hogy a memóriabusz hagyományosan elsősorban olcsó chipekben van lefaragva. Bár a gyors GDDR5 memória használata lehetővé tette egy viszonylag magas (ilyen olcsó megoldások esetén) 72 GB / s sávszélesség meghagyását.

Meg kell jegyeznünk a meglehetősen nagy mennyiségű L2 gyorsítótárat - akár 512 kilobájtot (szemben a csúcskategóriás chip 768 KB-jával -, úgy tűnik, az L2 gyorsítótár nem foglal túl sok helyet a chipen). mint a geometriai teljesítmény javítása. A csúcskategóriás chiphez hasonlóan a Zöld-foki-szigetek is rendelkezik egy 9. generációs tesselátorral, amely többszörös pufferelési és gyorsítótárazási optimalizálással rendelkezik, hogy a Radeon HD 6000 sorozathoz képest jelentős javulást érjen el a geometria-feldolgozási teljesítményben.

Általánosságban elmondható, hogy nem ismételjük meg az új Radeon HD 7000 videochipekben bevezetett és továbbfejlesztett AMD technológiákkal kapcsolatos összes információt (itt van egy részleges lista: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, textúra szűrési minőségi fejlesztések stb. .o.), mindezt fentebb részletesebben ismertetjük. A HD 7700 sorozat az ott felsorolt ​​összes funkciót támogatja, beleértve az AMD Eyefinity 2.0-t hat monitorral és sztereó rendereléssel, valamint egy továbbfejlesztett videó dekódoló és kódoló egységet.

De mi a helyzet a legfontosabb dologgal - a játékbeli teljesítménnyel? A renderelési sebesség első becslései mindig a gyártó prezentációi alapján készíthetők. Az AMD úgy véli, hogy a Radeon HD 7770 valahol a középmezőnyben van a GeForce GTX 560 és a GeForce GTX 550 Ti között, és anyagában összehasonlítja a második versenytárs modellel.

De nem hasonlítják össze semmivel a Radeon HD 7750-et, egyszerűen csak megjegyzik, hogy a legtöbb modern játék ezen a modellen játszható maximális beállításokkal FullHD felbontásban. Ez azonban nem meglepő, hiszen utóbbi évek Gyakorlatilag nincs PC-exkluzív termék, a többplatformos játékok pedig lényegesen kevésbé igényesek. A Radeon HD 7700 sorozatú kártyák tehát tökéletesek az igénytelen felhasználók számára.

Részletek: Radeon HD 7790 modell

  • Chip kódneve: "Bonaire"
  • Gyártási technológia: 28 nm
  • 2,08 milliárd tranzisztor (több, mint a Zöld-foki Köztársaság a Radeon HD 7700-ban, de kevesebb, mint a Pitcairn a Radeon HD 7800-ban)
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek és egyebek.
  • Hardveres támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0 Shader modellt
  • 128 bites memóriabusz: két 64 bites széles vezérlő GDDR5 memória támogatással
  • Magfrekvencia: 1000 MHz
  • 14 GCN számítási egység 56 SIMD magból, összesen 896 lebegőpontos ALU-val (egész és lebegő formátum, támogatja az IEEE 754 FP32 és FP64 pontosságot)
  • 56 textúraegység, támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • 16 ROP élsimítási módok támogatásával, képpontonként több mint 16 minta programozható mintavételezési lehetőségével, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 16 minta óránként, színtelen módban (csak Z) - óránként 64 minta

Radeon HD 7790 grafikus műszaki adatok

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 896
  • Textúra egységek száma: 56, keverési egységek: 16
  • Memória típusa: GDDR5
  • Memória kapacitása: 1 gigabájt
  • Memória sávszélessége: 96 gigabájt másodpercenként
  • Elméleti maximális kitöltési sebesség: 16,0 gigapixel másodpercenként.
  • Elméleti textúra mintavételi sebesség: 56,0 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, HDMI 1.4, két Mini-DisplayPort 1.2
  • Áramfelvétel: 3-85 W
  • Egy 6 tűs tápcsatlakozó
  • Kettős slot kialakítás
  • US MSRP: 149 USD

Egy új, közepes költségvetésű chipre épülő, olcsó videokártya-modell az index harmadik számjegyével tér el a HD 7700 alcsalád korábbi csúcsmodelljétől: a 7 helyett a 9-es számot teszik, ami a teljesítmény növekedését jelzi. Ugyanakkor a Radeon HD 7790 index egyértelműen jelzi, hogy ez egy kevésbé termelékeny videokártya az egy lépéssel magasabb vonalhoz - HD 7800 -hoz képest.

Azonban itt sem minden olyan egyszerű - minden bizonnyal vitatkozni lehet majd a fiatalabb HD 7850-el. De a Radeon HD 7790 ajánlott ára 149 dollár, vagyis a HD 7770 és a HD 7850 árai között körülbelül a középmezőnyben van. Ami a versenytárs megoldásait illeti, ugyanabból az árszegmensből, a HD 7790 egyértelműen az volt, hogy van NVIDIA GeForce A GK106 chipre épülő GTX 650 Ti árban és sebességben a HD 7770 és a HD 7850 között helyezkedik el. Az NVIDIA azonban azonnal reagált az új alaplap AMD általi kiadására a GeForce GTX 650 Ti Boost túlhajtható változatának piacra dobásával, amelyet nagyobb teljesítmény jellemez.

Ez az AMD grafikus kártya modell GDDR5 memóriával rendelkezik, amelynek kapacitása mindössze 1 gigabájt. A GPU 128 bites memóriabusszal rendelkezik, és elméletileg 2 GB-ot lehetne szállítani, de ennyi gyors GDDR5 memória még mindig túl drága ehhez az árszegmenshez, és az AMD kiadott egy kisebb memóriával rendelkező modellt, bár lehet, hogy nem. elég néhány modern játékhoz még alacsony beállítások és felbontás mellett is. A partnerek videokártyái azonban 2 GB videomemóriával is rendelkezésre állnak.

A sorban mellette álló modellekhez hasonlóan a Radeon HD 7790 is kétnyílásos hűtőrendszerrel rendelkezik, amelyet műanyag burkolat borít. Bár a legtöbb gyártó még mindig a saját hűtővel ellátott lapokat ad ki, így a referencia nem olyan fontos. Érdekes módon az új modell fogyasztása nem sokat nőtt a HD 7770-hez képest, de az energiahatékonyság javulása várható volt. Az újdonság egyébként ezért is csak egy 6 tűs segédtáp csatlakozóval rendelkezik.

építészeti jellemzők

Az új Bonaire GPU, amelyre a kiadott Radeon HD 7790 épül, ugyanabba a Graphics Core Next (GCN) architektúrába tartozik, amelyet már másfél éve ismerünk, de az AMD kisebb változtatásokra utalva GCN 1.1-nek nevezi. Valójában a chip építészetileg szinte megegyezik a korábbiakkal, bár valóban vannak apró változások. Az új architektúra például bevezette a heterogén architektúrához hasznos utasításokat (Heterogeneous System Architecture – HSA), több egyidejűleg végrehajtott szál támogatását, valamint az AMD PowerTune technológia új verzióját, amelyről később még szó lesz. Mindezek a változások azonban nem nevezhetők jelentősnek, mert az alapblokkokban és a hatékonyságuk javításában nincs semmi új.

Ezért nyugodtan hivatkozhatunk arra, amely gondosan leírja az új Graphics Core Next (GCN) architektúra összes jellemzőjét, és itt csak az adott termék legfontosabb jellemzőit és jellemzőit ismételjük meg. Az AMD összes legújabb GPU-ja kiváló szolgáltatásokat és teljesítményt kínál mind a grafikus, mind a nem grafikus feldolgozásban, beleértve a kettő keverékét is. Az új GCN architektúra az optimalizálási és szoftverfejlesztési feladatok jelentős leegyszerűsítését is biztosítja, miközben megőrzi a magas hatékonyságot.

Mint ismeretes, az architektúra alapblokkja a GCN blokk, amelyből a Southern Islands sorozat összes GPU-ja van összerakva. A GCN számítási egység alszakaszokra van felosztva, amelyek mindegyike saját utasításfolyamon működik. A GCN blokkok dedikált 64 KB-os helyi adattárral rendelkeznek az adatcseréhez vagy a helyi regiszterverem bővítéséhez. Ezenkívül a blokk első szintű gyorsítótárral rendelkezik olvasási és írási képességgel, valamint teljes értékű textúra csővezetékkel mintavételi és szűrési blokkokkal. A meglévő GCN egységek mindegyike képes önállóan ütemezni és elosztani a parancsokat, és egy számítási egység több független utasításfolyamot is végrehajthat. Nézzük az új chip blokkvázlatát:

A Bonaire-séma megerősíti az új megoldás azon célját, hogy teljesítményt nyújtson a 10 GCN számítási egységgel rendelkező Zöld-foki-szigetek és a 20 GCN számítási egységgel rendelkező Pitcairn között. Ez a két, 2012-ben megjelent GPU szinte pontosan a felével tér el egymástól, így középen elég nagy teljesítményhézag volt köztük, amit Bonaire most pótolt.

Az ábrán a grafikus processzor Radeon HD 7790 formájában látható, ami egy komplett megoldás blokkvágás nélkül. A chip 14 GCN architektúrájú számítási egységet tartalmaz, ami 896 adatfolyam processzornak felel meg. Mivel minden GCN-nek 4 textúraegysége van, az új modell TMU-inak teljes száma 56 TMU. Vagyis a Bonaire pontosan 1,4-szer gyorsabb, mint a Zöld-foki-szigeteki chip a matematikai számítások és a textúrák lekérésének sebességét tekintve, feltéve, hogy a frekvencia azonos.

De a Bonaire és a Radeon HD 7790 ROP egységek és memóriavezérlők száma hasonló ahhoz, amit a Zöld-foki Köztársaságban és a Radeon HD 7770-ben láttunk - úgy döntöttek, hogy 16 ROP egységet hagynak, és az új chip memóriabusza 128 bites , két 64 bites csatornából összeállítva. A megoldás „Achilles-sarka” lehet a kis számú ROP, hiszen a gyors GDDR5 memória használatával viszonylag magas, 96 GB/s-os átviteli sebességet lehetett biztosítani, de a ROP-teljesítmény ellen semmit sem lehet tenni.

Az új GPU-ban azonban javult a geometriai teljesítmény és a tesszellációs sebesség. Igen, a Zöld-foki-szigeteken is van egy 9. generációs tesselátor, de Bonaire is megduplázta a geometriablokkok, raszterezők és parancsfeldolgozók számát (az ábrán ACE-ként látható) – most már kettő van belőle. Ez a fejlesztés lehetővé teszi Bonaire-nek, hogy óránként akár két geometriai primitívet is feldolgozzon – akárcsak az erősebb Pitcairn és Tahiti.

Ahogy emlékszel, az AMD először a Radeon HD 7770-ben érte el a GPU órajelének fontos pszichológiai küszöbét, ami 1 GHz. Tehát a HD 7790 is pontosan ugyanazzal az 1 GHz-es referenciafrekvenciával rendelkezik, így a HD 7770-hez képesti teljesítménynövekedést kizárólag az építészeti változtatások és a végrehajtási egységek számának növekedése indokolja.

De az újdonság videomemóriájának gyakorisága sokkal magasabb. Ha a HD 7770-nek viszonylag alacsony, 4,5 GHz-es memóriafrekvenciája volt, akkor a HD 7790-et gyors, 6 GHz-en működő GDDR5 memóriával szerelték fel, ami harmadával nagyobb sávszélességet biztosít. A videomemória sávszélességének 33%-os növekedése a Radeon HD 7700 alcsaládhoz képest a játékteljesítmény egyértelmű növekedését eredményezte. Az AMD ezt a diagramot mutatja, amely a HD 7790 képkockasebességét hasonlítja össze a 4,5 és 6,0 GHz-es memóriával:

A memóriasávszélesség növekedéséből adódó maximális gyorsulást az olyan játékokban érték el, mint a StarCraft II és a Crysis 2. És átlagosan a memória sávszélességének 33%-os növekedése valahol 10%-os növekedést jelent a modern játékok átlagos képkockasebességében. Nem rossz mutató, ami azt mutatja, hogy a memória sávszélessége nagyon fontos korunkban, bár nem ez az egyetlen hangsúly a teljesítményen. Bár nagyon valószínű, hogy több ROP-pal Bonaire sebessége még nagyobb lenne...

Jól látható, hogy az átlagos energiafogyasztás kissé nőtt a HD 7770-hez képest. Ha a régi modellnél ez az érték 80 W, akkor a HD 7790 esetében 85 W - ez nagyon alacsony ár 33-40%-os elméleti teljesítménynövekedésért! Építészeti fejlesztések (PowerTune), új GPU tervezése a korábbiak tapasztalatai alapján, valamint a TSMC technikai folyamatának folyamatos fejlesztése – mindez kismértékű fogyasztásnövekedéshez vezetett a sebességjellemzők jelentős javulásával.

Ami a chip területét és a Bonaire-i tranzisztorok számát illeti, az új chip egyértelműen nagyobb, mint a Zöld-foki-szigeteké, de a számítási, textúra és geometriai egységek hozzáadása nem maradhatott észrevétlen. Ezen paraméterek szerint Bonaire is hozzávetőlegesen a Zöld-foki-szigetek és Pitcairn közötti közepén található. A Bonaire 2,08 milliárd tranzisztort tartalmaz egy 160 mm 2 -es chipben, a Zöld-foki-szigeteken ezek a számok 1,5 milliárd és 123 mm 2 , Pitcairn esetében pedig 2,8 milliárd tranzisztor és 212 mm 2 chipfelület.

Az új lapka természetesen támogatja az összes AMD technológiát, amelyet az új Radeon HD 7000 családban bevezettek és továbbfejlesztettek (nem teljes listájuk: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, textúra szűrési minőségi fejlesztések stb.). részletesen le van írva az AMD Radeon HD 7970: Új egyprocesszoros vezető cikk. A HD 7790 modell támogatja az ott felsorolt ​​összes funkciót, beleértve az AMD Eyefinity 2.0-t hat monitorral és sztereó rendereléssel, valamint továbbfejlesztett videó dekódoló és kódoló egységgel is rendelkezik.

Továbbfejlesztett PowerTune technológia

Az AMD még 2010-ben bevezette a PowerTune technológiát a Cayman chipjében (AMD Radeon HD 6900 sorozat). Ez a GPU volt az első, amely PowerTune néven dinamikus energiagazdálkodást tartalmazott. Ez lehetővé tette számunkra, hogy növeljük a maximális órajelet a tipikus alkalmazásokhoz, miközben elkerültük a túl sok energiafogyasztást az olyan speciális stabilitási teszteknél, mint a FurMark. Ezután a technológiát a kétchipes AMD Radeon HD 6990 modellnél alkalmazták, amelynek nyilvánvaló okokból még nagyobb szüksége volt rá.

A technológia 2012 közepén kapott jelentős frissítést, amikor az automatikus frekvencianövelés - Boost - hozzáadásra került az AMD PowerTune-hoz. Az AMD Radeon HD 7970 GHz Edition esetében ez az algoritmus még több teljesítménynövekedést tett lehetővé a normál verzió videokártyák. A PowerTune működési algoritmusa az automatikus túlhajtás nélküli videokártyákban három állapotot használ: üresjárat (tétlen), kis terhelésű mód (alacsony 3D) és teljes sebesség. A HD 7970 GHz-ben a Boost túlhajtási mód került hozzájuk. A PowerTune arra szolgál, hogy a kívánt fogyasztáson belül maradjon azáltal, hogy szükség esetén alacsonyabb terhelésű módra vált. Ebben az esetben a technológia élesen csökkenti az órajel frekvencia értékeit. A gyakorlatban az ilyen ugrások ritkák - a két aktív mód közötti nagy különbség miatt.

A GPU órajelének csökkentése csökkenti az energiafogyasztást, de a jobb vezérlés érdekében csökkentenie kell a feszültséget. Pontosan ezt teszi a Radeon HD 7790. Az új Bonaire grafikus chip nyolc különböző frekvencia- és feszültségbeállítású állapottal rendelkezik, ami lehetővé teszi a korábbinál magasabb órajelet, miközben biztosítja, hogy a GPU mindig optimális feszültségen és frekvencián működjön. Az állapotok közötti váltás a GPU terhelésén, valamint a GPU aktuális energiafogyasztásán alapul.

Az új algoritmusban a fogyasztási szint túllépése esetén a PowerTune-nak nem kell hirtelen leejteni a frekvenciát, és a frekvenciával együtt a feszültség is csökken. Az állapotátmeneteknek a lehető leggyorsabbnak kell lenniük, hogy még rövid időre se lépjék túl a fogyasztási határt, ezért a Bonaire 10 ms-onként, azaz másodpercenként 100-szor változtatja a PowerTune állapotát.

A frekvenciák ilyen állandó változása mellett a harmadik féltől származó alkalmazások, mint például az MSI Afterburner és a GPU-Z, nem pillanatnyi órajelet mutatnak, hanem egy bizonyos időszak átlagát – az úgynevezett „effektív” frekvenciát. Egy másik érdekes újítás, hogy az AMD új PowerTune beállításokat nyit meg a számára harmadik féltől származó alkalmazások. A partnerek saját PowerTune-beállításaikat is megadhatják, hogy gyárilag túlhúzott grafikus kártyákat hozzanak létre, és az AMD referenciaértékein túlmenően több szolgáltatást biztosítsanak. Igazság, különböző beállításokat A PowerTune oda vezethet, hogy a különböző gyártók azonos modelljeinek videokártyáinak nem csak az órajel-frekvenciája lesz eltérő, hanem az ezek időbeli változásának algoritmusa is, ami megnehezíti az összehasonlítást azonos feltételek mellett.

A Radeon HD 7790 modell videokártyáinak értékesítése 2013 áprilisának legelején kezdődött meg a piacon. Az AMD partnereivel közösen megszervezte mindkét alaplap kiadását referenciafrekvenciás és gyárilag túlhajtható megoldásokkal. Most pedig mindkét gyártó nagyjából ugyanúgy dob piacra új videokártyákat, amelyekkel gyorsan elérhetőek a különböző opciók partnereiknél. Tény, hogy a partnerek a HD 7790-ből szinte több túlhúzott változatot adtak ki, mint a hagyományosakat, és a bennük lévő grafikus chipek körülbelül 1075 MHz-es frekvencián működnek.

Részletek: Radeon HD 7990 modell

  • Kódnév "Málta"
  • Gyártási technológia: 28 nm
  • 2 chip egyenként 4,3 milliárd tranzisztorral
  • Egységes architektúra egy sor közös processzorral többféle adatfolyam feldolgozásához: csúcsok, pixelek és egyebek.
  • Hardveres támogatás a DirectX 11.1-hez, beleértve a Shader Model 5.0 Shader modellt
  • Kettős 384 bites memóriabusz: kétszer hat 64 bites széles vezérlő GDDR5 memória támogatással
  • GPU frekvencia: 1000 MHz
  • Kétszer 32 GCN számítási egység, köztük 128 SIMD mag, összesen 4096 lebegőpontos ALU-ból (egész és lebegő formátumok, FP32 és FP64 precíziós támogatás az IEEE 754 szabványon belül)
  • 2x128 textúraegység, támogatja a trilineáris és anizotróp szűrést minden textúraformátumhoz
  • 2x32 ROP élsimítási módok támogatásával, több mint 16 minta programozható mintavételezésének lehetőségével képpontonként, beleértve az FP16 vagy FP32 framebuffer formátumot is. Csúcsteljesítmény akár 64 minta óránként, színtelen módban (csak Z) - óránként 256 minta
  • Integrált támogatás akár hat monitorhoz HDMI 1.4a és DisplayPort 1.2 porton keresztül

Radeon HD 7990 grafikus műszaki adatok

  • Magfrekvencia: 1000 MHz
  • Univerzális processzorok száma: 4096
  • Textúra egységek száma: 2x128, keverési egységek: 2x32
  • Effektív memóriafrekvencia: 6000 MHz (4×1500 MHz)
  • Memória típusa: GDDR5
  • Memória kapacitása: 2x3 gigabájt
  • Memória sávszélessége: 2x288 gigabájt másodpercenként
  • Elméleti maximális kitöltési sebesség: 64 gigapixel másodpercenként.
  • Elméleti textúra mintavételi sebesség: 256 gigatexel másodpercenként.
  • Egy CrossFire csatlakozó
  • PCI Express 3.0 busz
  • Csatlakozók: DVI Dual Link, négy Mini-DisplayPort 1.2
  • Teljesítményfelvétel akár 375 W
  • Két 8 tűs kiegészítő tápcsatlakozó
  • Kettős slot kialakítás
  • Oroszországban az ajánlott ár 32 999 rubel. (az USA-ban - 999 dollár).

Már az AMD videokártyák második generációjában is változatlan marad a kétchipes modellek elnevezési elve. A két legerősebb videochipre épülő csúcsmegoldás az index első számjegyével tér el az előző generációs modell megfelelő osztályától: a 6 helyett az új sorozatot jelző 7-es számot kapta. A bejelentett videokártya a generáción belüli maximális teljesítményt jelző harmadik számjegyben tér el az egychipes megoldástól.

Ami a versenytársakkal való összehasonlítást illeti, a ma bejelentett Radeon HD 7990 modell esetében a fő rivális a közel egy éve megjelent GeForce GTX 690 videokártya, és ezeknek a kétchipes megoldásoknak kell majd megküzdeniük egymással. Igaz, az NVIDIA-nak is van egy erősebb, de már egyetlen GPU-ra épülő megoldása - a GeForce GTX Titan, amely a szóban forgó AMD lap versenytársának is tekinthető.

Az új, kétlapkás Radeon videokártya GDDR5 memóriával van felszerelve, melynek kapacitása GPU-nként 3 gigabájt, ami a Tahiti chipek 384 bites memóriabuszának köszönhető. Ez a mennyiség igencsak indokolt egy ilyen magas szintű terméknél, mivel egyes modern játékalkalmazásokban, maximális beállításokkal, engedélyezett élsimítással és nagy felbontással, előfordulhat, hogy a kisebb memóriamennyiség (2 gigabájt chipenként vagy kevesebb) már nem használható. elég. És még inkább ez vonatkozik a sztereó módban történő megjelenítésre vagy több monitoron Eyefinity módban.

Nyilvánvaló, hogy egy ilyen erős, kétchipes grafikus kártya hatalmas, kétnyílású hűtőrendszerrel rendelkezik, amely különbözik a hagyományos AMD kártyahűtőktől. Hatalmas hűtőbordát rejt a burkolat alatt, három nagy ventilátorral, amelyek viszonylag alacsony sebességgel működnek. A dupla GPU-s kártya fogyasztása érthető okokból meglehetősen magas, ráadásul két 8 tűs tápcsatlakozója van, de legalábbis nem három, mint a két Tahiti chipre épülő, nem referencia mintáknál.

Építészet

Mivel a „Málta” kódnevű videokártya a Southern Islands család két „Tahiti” GPU-ján alapul, egyszerűen hivatkozhat arra, amely alaposan leírja a jelenlegi Graphics Core Next (GCN) architektúra összes jellemzőjét. Az alapanyagoknál csak az egyes termékek legfontosabb jellemzőit, jellemzőit ismételjük meg.

Az architektúra alapblokkja a GCN blokk, amelyből a sorozat összes GPU-ja van összeállítva. A számítási egység alszekciókra van felosztva, amelyek mindegyike a saját parancsfolyamán működik, dedikált helyi adattárolóval, olvasási és írási képességgel rendelkező első szintű gyorsítótárral, valamint teljes értékű textúra-folyamattal rendelkezik. mintavevő és szűrő egységek. A GCN blokkok mindegyike képes önállóan ütemezni és elosztani a parancsokat, és egy számítási blokk több független parancsfolyamot is végrehajthat. A Radeon HD 7990 két, általunk már ismert Tahiti chipet használ:

A grafikus processzor diagram (a Radeon HD 7990-ben kettő van) a GCN architektúra 32 számítási egységét mutatja, és mindegyik aktív. Korábban azt feltételezték, hogy egy kétchipes megoldásnál néhányat ki kell kapcsolni, sőt a frekvenciát is csökkenteni kell ahhoz, hogy bekerüljön a 375 W-os fogyasztás, de az AMD mérnökei sikeresen megoldották ezt a nehéz feladatot. Talán megjelent a Tahiti egy speciális új, alacsonyabb fogyasztású változata, vagy a chipek csak nagyon szigorú válogatáson mennek át.

Mivel minden GCN egység 16 textúra egységgel rendelkezik, a TMU-k száma chipenként 128 egység, ami összesen 256 gigatexel/másodperc teljesítményt ad, ami egy GeForce GTX 690 versenytársnak nagyon jó. A HD 7990 sem változott egychipes társához képest, GPU-nként 32, illetve 6 darab maradt. A Radeon HD 7990 kettős, 384 bites memóriabusszal rendelkezik, amely tizenkét 64 bites csatornából áll, 576 GB/s teljes memóriasávszélességgel, ami egy másik rekord.

Egyébként az új tábla mindent támogat modern technológiák az AMD, amelyeket a Radeon HD 7000 sorozat új videó chipjeiben vezettek be és fejlesztettek: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, jobb minőségű textúra szűrés stb. Mindezt fent a Radeon HD 7970 leírásában részletesen leírjuk, és egyszerűen nincs értelme megismételni.

Hűtőrendszer és energiafogyasztás

Az ilyen komoly kétlapkás lapok esetében különösen fontos a nagy hatékonyságú hűtőrendszer. Ha a két Tahitin alapuló partnerek megoldásainál három slotos megoldást alkalmaztak, az ASUS ARES II esetében pedig akár vízhűtés, ebben az esetben kisebb teljesítménnyel kellett megbirkózni, ezért egy olyan hűtőt terveztek, amely nagyon masszív hűtőbordával és három ventilátorral rendelkezik, javított akusztikai jellemzőkkel.

A hűtőrendszer zaja és a GPU-k számára biztosított hőmérséklet az egyik legfontosabb fogyasztói jellemző minden videokártya esetében, beleértve a rajongóknak tervezett csúcsmegoldást is. A túl hangos vagy nem hatékony hűtési rendszert a vásárlók kevésbé jövedelmező vásárlásnak fogják tekinteni, más dolgok (nagyjából) azonosak. Az AMD tehát nagyon komolyan vette ezt a problémát a Radeon HD 7990 esetében, összehasonlítva a piacon lévő többi csúcsmegoldással. Tekintsük az új rendszer akusztikai jellemzőit:

A diagram három különböző videokártya zajszintjét mutatja: a Radeon HD 7990 és két versenytárs: kétchipes GeForce GTX 690 és egychipes GTX Titan az NVIDIA-tól. Ezenkívül a zajt különböző körülmények között mérték - üresjárati üzemmódban (System Idle) és maximális terhelésnél a Furmark segítségével. Ha hinni lehet az AMD számaiban, még az egychipes Titan is alulmarad az újdonságuktól a hidegebb zaj tekintetében, nem beszélve a kétchipes GTX 690-ről, ami ebben az összehasonlításban a leghangosabb.

De nem a GPU hőmérséklet rovására megy, hogy ilyen lenyűgöző akusztikus teljesítményt sikerült elérni? Az alábbi táblázat az AMD Radeon HD 7990-en és ugyanazon két versenytársán mért GPU-hőmérsékletet mutatja. Az AMD ezúttal csak a nagy terhelésű módot használta a Furmarknál végzett tesztelés során.

És ismét egy „ravasz” koordinátatengelyt használnak nem nulla origóval. A 80 és 82 fok közötti valódi különbség a Radeon HD 7990 és a GTX Titan esetében gyakorlatilag észrevehetetlen lesz, bár a GTX 690 esetében a 87 fok egyértelműen a legrosszabb. Ismételten megjegyezzük, hogy ezeket a vizsgálatokat az érdekelt fél végezte el, és független ellenőrzésnek vetik alá.

Fogyasztás szempontjából nem újdonság a kétchipes megoldás, de a korábban bejelentett ZeroCore Power technológia támogatása is megérkezett. Ez a technológia segít lényegesen alacsonyabb energiafogyasztás elérésében "mély üresjárati" (vagy "alvó") üzemmódban kikapcsolt megjelenítőeszköz mellett. Ebben az üzemmódban az üresjárati GPU szinte teljesen le van tiltva, és a teljes üzemmód teljesítményének kevesebb, mint 5% -át fogyasztja, kikapcsolva a funkcionális blokkok többségét. A kétlapkás kártya esetében pedig még fontosabb, hogy a CrossFire rendszerben az operációs rendszer kétdimenziós interfészének megrajzolásakor a fő kivételével az összes GPU egyáltalán nem működik. Vagyis a Radeon HD 7990 esetében az egyik lapka 2D módban minimális fogyasztás mellett mély álomba merül, a második pedig PC mélyen készenléti módban „elaludhat”.

AMD Radeon HD 7850M- grafikus kártya DirectX 11 támogatással, a GCN architektúrán. A kártya közepes és nagy laptopokhoz készült. 2012 egyik legproduktívabb videokártyája. Gyártása során 28 nm-es folyamattechnológiát alkalmaznak.

A Radeon 7800M sorozatú adapterek a zöld-foki-szigeteki chipre épülnek, valamint Radeon HD 7770 asztali számítógépekhez, 640 1D shader maggal és 40 textúraegységgel. De az órajel tekintetében a HD 7850M gyengébb a HD 7870M-nél (675 MHz-től 800 MHz-ig). Összességében a 7850M nagyjából egyenrangú HD 7750 asztali számítógépekhez.

Ahogy az várható volt, a Radeon HD 7850M az NVIDIA GeForce GTX 560M versenytársa lett, hiszen a nagyobb teljesítmény mellett alacsonyabb fogyasztást is mutat (mint a GeForce GTX 660M). Így a modern, igényes játékok szabadon futnak közepes és magas beállításokon.

A 7850M új UVD3 videodekóderrel rendelkezik az MPEG-4 AVC/H.264, VC-1, MPEG-2, Flash, Multi-View Codec (MVC) és MPEG-4 part 2 (DivX, xVid) HD videó formátumok dekódolásához .

A 7800M sorozatú kártyák is támogatják automatikus kapcsolás integrált és diszkrét grafika között. Ezt a funkciót Enduronak hívják, és hasonló az NVIDIA Optimus technológiájához. Ezenkívül a HD 7850M akár 6 monitort is támogathat egyszerre az Eyefinity technológiával, ha az Enduro ki van kapcsolva.

A következő funkció HD 7850M egy ZeroCore funkció, amely automatikusan csökkenti az energiafogyasztást, amikor "alvó" módban van kikapcsolt kijelző mellett. A PowerTune technológia lehetővé teszi a grafikus kártya túlhajtását, amíg az energiafogyasztás az elfogadható határokon belül van. Például a gyakoriság csökkenhet a FurMark és az OCCT futtatásakor, és egyes játékokban (Planet, Crysis vagy Resident Evil 5) növekedhet.

A beépített HD audioprocesszor kiváló minőségű hang (TrueHD vagy DTS Master Audio formátumok) továbbítására képes HDMI-n és DisplayPorton keresztül (például Blu-ray videó). Ezen kívül a DDMA technológia segítségével lehetőség van egyidejűleg több eszköz hangkimenetére is.

Energia szint 7850M jóval alacsonyabb, mint a 7870M az alacsonyabb mag órajel miatt.

Gyártó: AMD
Sorozat: Radeon HD 7800M
A kód: Heathrow Pro
Építészet: GCN
Szálak: 640-Unified
Órajel frekvencia: 675*MHz
Shader frekvencia: 675*MHz
Memória frekvencia: 1000*MHz
Memóriabusz szélesség: 128 bites
Memória típusa: GDDR5
Közös memória: Nem
DirectX: DirectX 11.1, Shader 5.1
Energia fogyasztás: 32 W
Technológia: 28 nm
Notebook mérete: nagy
Kiadási dátum: 24.04.2012

* A megadott órajeleket a gyártó megváltoztathatja

7800-as sorozat különböző specifikációkkal. A Graphic Core Next mikroarchitektúrára épülő chip 2,8 milliárd tranzisztornak megfelelő helyet foglal el. A Radeon legtöbb kártyájához hasonlóan itt is megtalálható az Eyefinity technológia, amely lehetővé teszi akár hat monitor egyidejű csatlakoztatását. Működhetnek egymástól függetlenül, vagy alkothatnak egy nagy monitort. Minden attól függ, hogy milyen beállítások lesznek elérhetők.

Radeon 7850

Ez az AMD 7800 sorozatú grafikus kártya 800 megahertz processzorfrekvenciával rendelkezik. A nagy teljesítmény és a sávszélesség (153 gigabit/másodperc) 256 bites buszméretet biztosít. A számítási rendszer 1,76 teraflopnak megfelelő adatot dolgoz fel. A számítási egységek 16 darab, a textúra egységek pedig 64 darabban vannak jelen. A számítási folyamatokhoz két mag tartozik.

A memóriaformátum megfelel a GDDR5 jelölésnek, és a DirectX 11-es verzió támogatása segít felgyorsítani az operációs rendszer alkalmazásaival való interakciót. Mert jobb optimalizálás a kártya működéséhez követni kell az illesztőprogram-frissítéseket, mivel csak ezek képesek teljes mértékben feltárni a grafikus processzor összes képességét és hozzáférést biztosítani a szükséges beállításokat. A rendszerben lévő videokártyát jelölő alap driverek a kártyához tartoznak, a frissített verzió pedig megtekinthető az AMD honlapján.

Ez az AMD Radeon HD 7800 sorozatú grafikus processzor a legújabb beépített technológiával van felszerelve, amely lehetővé teszi, hogy kiváló minőségű és egyenletes képeket élvezhessen 60 képkocka felbontásban, miközben a felbontás akár 4096 x 2160 pixelt is elérhet. Ugyanez vonatkozik az audio streamre is, amely minden modern követelménynek megfelel, és kiváló hangminőséget ad ki.

Radeon 7870

Ez az AMD Radeon HD 7800 sorozatú grafikus kártya jellemzőit tekintve az előző kártya erőteljes utódja. Egy egész gigahertze van a grafikus processzorral való munkához. A számítási műveletek teljesítménye sokkal magasabb, mint az előző verzióban - 2,56 teraflop. 20 számítási egység és 80 textúra egység van.

Mivel ez a 7800-as sorozat zászlóshajója, sok tekintetben felülmúlja testvérét. A tesszellációs technológia támogatása már régóta be van vezetve a gyártó videokártyáiba, de ebben a verzióban a határra van hozva. Most élvezheti a háromdimenziós képet, amely valósághű és részletgazdag. A továbbfejlesztett élsimítás pedig segít a sima és kellemes kép elérésében.

Más paraméterekben az AMD Radeon HD 7800 sorozat ezen képviselője jellemzőit tekintve teljesen megegyezik az előző videokártyával. Mindkét kártya képes támogatni a 3D technológiát videóban és játékokban egyaránt. Több kártya csatlakoztatása is lehetséges a teljesítmény növelése érdekében, de ez a paraméter az alaplap képességeitől is függhet.

2/5. oldal

"Déli szigetek"

Először egy kicsit az AMD legújabb termékeinek címkézéséről. A gyártó teljesítményük szerint három szintre osztotta őket. A "Cape Verde" kódnév a Radeon HD 7700-ra utal. A "Pitcairn" név a mai Radeon HD 7870 és HD 7850 tesztelőkre utal.

  • Belépő szint = Zöld-foki-szigetek = Radeon HD 7700 sorozat;
  • Mainstream = Pitcairn = Radeon HD 7800 sorozat;
  • Nagy teljesítményű termékek = Tahiti = Radeon HD 7900 sorozat.

Vagyis jelen pillanatban az AMD minden piaci szegmenst lefedett 28 nm-es grafikus lapkáival. Csak a Tahiti chipekre épülő kétmagos videokártya megjelenése várható. Kísérleti név: Radeon HD 7990.

Az AMD Radeon HD 7800 sorozat jellemzői

A Radeon HD 7800 grafikus processzor (Pitcairn) körülbelül 2,8 milliárd tranzisztorral és Graphic Core Next mikroarchitektúrával rendelkezik. Mint fentebb említettük, a Radeon HD 7850 chip (Pitcairn Pro) 16 számítási egységgel rendelkezik, maximális TDP-je pedig 130 watt. A Radeon HD 7870 (Pitcairn XT) esetében ezek a számok 20, illetve 175.

Az alábbi dia a Radeon HD 7850 és HD 7870 videokártyák főbb specifikációit mutatja be.

A 2 GB GDDR5 memória már a legtöbb közép- és felsőkategóriás modell szabványává válik. Köszönhetően a 256 bitesnek. busz és magas, 1200 MHz-es órajel (effektív 4800 MHz), a sávszélesség 154 GB / s. Ez pozitív hatással lesz a teljesítményre a nagy felbontású és képminőségű játékokban.

PCI Express 3 interfész

2011 második felében szinte minden alaplapgyártó bemutatta PCI Express 3. generációs interfésszel ellátott alaplapmodelljét. A Radeon HD 7000 sorozat megjelenésével megjelentek az ilyen interfésszel rendelkező videokártyák is. A PCI Express 3 kétszer akkora sávszélességgel rendelkezik (32 Gb/s), mint az előző generációs PCI Express. A PCIe 2-höz képest a sávonkénti átviteli sebesség megduplázódott 500 Mb/s-ról 1 Gb/s-ra.

Természetesen az új PCIe 3 előnyeinek kihasználásához nem csak videokártyára és alaplapra van szükség ezzel a felülettel, hanem a processzor támogatására is (az Ivy Bridge családból nem minden modell támogatja a PCIe 3-at).

Eyefinity 2.0

Az AMD tovább ment az Eyefinity technológiájával, amelyet arra terveztek, hogy több monitoron is megjelenítse a képeket. Hála a magasnak számítási teljesítmény A HD 7000-es sorozat és az Eyefinity 2.0 támogatásával immár több monitoron is megjeleníthet egy képet, összesen 16000 x 16000 felbontással. Ez lehetővé teszi, hogy 5 kijelzőn jelenítse meg a képet fekvő tájolású 2560x1600-as felbontással. Az ilyen felbontások használatához rekordméretű, 3 GB-os GDDR5 (HD 7970 és HD 7950) van telepítve a család régebbi modelljeire.

NÁL NÉL AMD illesztőprogramok A Catalyst februártól támogatja az egyéni felbontást. Vagyis az Eyefinityben beállíthatja a kívánt felbontást a kijelzők konfigurációjától függően. A Catalyst 12.2-től kezdve lehetőség van arra, hogy a Start menüt az Ön számára kényelmes kijelzőre állítsa, a korábbi bal szélső helyett. Ezenkívül az Eyefinity 2 támogatja a sztereó HD3D kimenetet. Támogatja három 3D módban működő monitor kombinációját.

Továbbfejlesztett tesszelláció

Videokártyák AMD családok A Radeon HD 7000 a kilencedik generációs tesszellátorral rendelkezik, és jelentős teljesítménynövekedést kapott a modern játékok geometriai feldolgozásában. A GCN mag továbbra is két grafikus motort tartalmaz, de ha korábban tartalmaztak blokkokat a tesszellációhoz és a raszterezéshez, akkor most tetszőleges számú, geometria és képpontok feldolgozására tervezett folyamatból állnak.

AMD Radeon HD 7800 grafikus kártyák támogatása HDMI interfész 1.4a, amely lehetővé teszi 120 Hz-es kép megjelenítését (mindegyik szemhez 60 Hz), amely lehetővé teszi 3D kép megjelenítését. A HDMI korábbi verzióinál ez nem volt lehetséges. Decembertől az AMD lehetővé tette a HD3D és az Eyefinity együttműködését az illesztőprogramjaiban.

DirectX 11.1

A Radeon 7000 család videokártyái támogatják a hamarosan megjelenő DirectX 11.1-et. Hogy ez mit ad a gyakorlatban, még korai megmondani, mivel a DX 11.1 a Windows 8-cal együtt fog megjelenni. Az új API fő előnyei a következők:

  • Független raszterezés;
  • A grafikus számítástechnika és a videófeldolgozás rugalmas kombinációja;
  • Natív sztereó 3D támogatás.

AMD Unified Video Decoder

Ez az AMD GPU-k hardveres része, amely a videofolyam dekódolásáért felelős. A Radeon 7000 sorozatban az UVF némi fejlesztést kapott. Általában az UVD megőrizte elődei összes funkcióját, nevezetesen a H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV D profil, Multi-View Codec (MVC), Video Codec Engine támogatását. (VCE), AMD Steady Video 2.0. Hozzáadott támogatás a Dual Stream HD+HD formátumhoz.

március 10. 2016

Az alábbi oldalon linkek találhatók a legújabb ingyenes letöltéshez AMD grafikus kártya illesztőprogramok a Radeon HD 7800 sorozatból, amely a Radeon HD Series család része. A telepítőfájlok a hivatalos webhelyről származnak, és a következőkre alkalmasak: Windows 7, 10, 8, 8.1, XP, Vista 32/64 bites (x86/x64).

A megfelelő fájlok kiválasztásának megkönnyítése érdekében az alábbiakban felsoroljuk a Windows verzióját és annak bitmélységét („bitmélysége”).

Számítógépe a következőkön fut:

  1. Letöltés (153,5 MB / 16.8.2 verzió (Crimson Edition 16.8.2 gyorsjavítás) / megjelenés dátuma 2016.08.12.)

    32 bites Windows 7 rendszerhez

  2. Letöltés (239,8 MB / 16.8.2 verzió (Crimson Edition 16.8.2 gyorsjavítás) / megjelenés dátuma 2016.08.12.)

    Windows 7 64 bites rendszerhez

  3. Letöltés (134,8 MB / 16.8.2 verzió (Crimson Edition 16.8.2 gyorsjavítás) / megjelenés dátuma 2016.08.12.)

    32 bites Windows 10 rendszerhez

  4. Letöltés (208,24 MB / 16.8.2 verzió (Crimson Edition 16.8.2 gyorsjavítás) / megjelenés dátuma 2016.08.12.)

    Windows 10 64 bites rendszerhez

  5. Letöltés (205 MB / 14.4-es verzió (Catalyst Software Suite) / megjelenés dátuma 2014.04.25.)

    32 bites Windows 8 rendszerhez

  6. Letöltés (260 MB / 14.4-es verzió (Catalyst Software Suite) / megjelenés dátuma 2014.04.25.)

    Windows 8 64 bites rendszerhez

  7. Letöltés (154,21 MB / 16.8.2 verzió (Crimson Edition 16.8.2 gyorsjavítás) / megjelenés dátuma 2016.08.12.)

    32 bites Windows 8.1 rendszerhez

  8. Letöltés (239,88 MB / 16.8.2 verzió (Crimson Edition 16.8.2 gyorsjavítás) / megjelenés dátuma 2016.08.12.)

    Windows 8.1 64 bites rendszerhez

  9. Letöltés (179 MB / 14.4-es verzió (Catalyst Software Suite) / megjelenés dátuma 2014.04.25.)

    Windows XP 32 és 64 bites rendszerhez

  10. Letöltés (151 MB / 13.12-es verzió (Catalyst Software Suite) / megjelenési dátum: 2013.12.18.)

    Mert Windows Vista 32 bites

  11. Letöltés (209 MB / 13.12-es verzió (Catalyst Software Suite) / megjelenési dátum: 2013.12.18.)

    64 bites Windows Vista esetén

Tartalék – Szerezzen illesztőprogramokat az AMD Driver Autodetect segítségével

Ez az opció kényelmes, mert a program Az AMD Driver Autodetect automatikusan kiválasztja és letölti a legújabb működő illesztőprogramokat, amelyek alkalmasak az Ön AMD grafikus kártyájához és az Ön Windows verziójához. A programot nem kell telepíteni, az AMD készítette, és a fájlok letöltése a hivatalos szervereiről történik.

Utasítás:

  1. Indítsa el az AMD Driver Autodetect programot, és azonnal automatikusan kiválasztja az illesztőprogramok telepítéséhez szükséges fájlokat.
  2. A fájlok letöltéséhez kattintson a "Letöltés most" gombra.
  3. Várja meg, amíg a fájlok letöltődnek, és indítsa el a telepítést.