• Кодово име на чип: "Tahiti"
  • 4,3 милиарда транзистора (повече от 60% повече от Cayman и точно два пъти повече от Cypress)
  • 384-битова шина на паметта: шест 64-битови широки контролера с поддръжка на GDDR5 памет
  • Честота на ядрото: до 925 MHz (за Radeon HD 7970)
  • 32 GCN изчислителни единици със 128 SIMD ядра за общо 2048 ALU с плаваща запетая (формати Integer и Float, поддръжка за прецизност на IEEE 754 FP32 и FP64)
  • 128 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 32 ROPs с поддръжка на режими на антиалиасинг с възможност за програмируемо семплиране на повече от 16 семплиране на пиксел, включително с FP16 или FP32 framebuffer формат. Пикова производителност до 32 проби за такт и в безцветен режим (само Z) - 128 проби за такт
  • Интегрирана поддръжка за шест монитора, включително HDMI 1.4a и DisplayPort 1.2

Radeon HD 7970 Графични спецификации

  • Честота на ядрото: 925 MHz
  • Брой универсални процесори: 2048
  • Брой текстурни единици: 128, смесващи единици: 32
  • Ефективна честота на паметта: 5500 MHz (4×1375 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 3 гигабайта
  • Честотна лента на паметта: 264 гигабайта в секунда
  • теоретичен максимална скоростзапълване: 29,6 гигапиксела в секунда
  • Теоретична честота на дискретизация на текстурата: 118,4 гигатексела в секунда
  • Два CrossFire конектора
  • PCI Express 3.0 шина
  • Консумирана мощност: 3 до 250 W
  • Един 8-пинов и един 6-пинов захранващ конектор
  • Дизайн с двоен слот
  • MSRP в САЩ: $549

Radeon HD 7950 Графични спецификации

  • Честота на ядрото: 800 MHz
  • Брой универсални процесори: 1792
  • Брой текстурни единици: 112, смесващи единици: 32
  • Ефективна честота на паметта: 5000 MHz (4×1250 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 3 гигабайта
  • Честотна лента на паметта: 240 гигабайта в секунда
  • Теоретична максимална скорост на запълване: 25,6 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 89,6 гигатексела в секунда
  • Два CrossFire конектора
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: 3 до 200 W
  • Дизайн с двоен слот
  • MSRP в САЩ: $449

Обръща внимание високата сложност на новия чип - 4,3 милиарда транзистора, което е повече от половината от броя на транзисторите в предишния върхов графичен процесор. Възможността да се направи такъв сложен кристал стана възможна благодарение на използването на съвременна 28-нанометрова технологична технология, а новият чип се оказа дори малко по-малък като площ от размера на Cayman. И неговите практически характеристики, които влияят на производителността, са значително подобрени: броят на ALU, TMU, шината на паметта. Само броят на ROP не се увеличи, а честотата на видеопаметта GDDR5 остана на същото ниво.

Принципът на именуване на видеокартите на компанията остана същият. Radeon HD 7970 е най-производителното едночипово решение на компанията, след известно време беше пуснат по-младият модел HD 7950, който беше обявен малко по-късно. Първоначално HD 7970 нямаше конкуренти на пазара и не замени нито една конкретна видеокарта от линията на AMD, а по-скоро я премести надолу. Що се отнася до сравнението с конкурента, NVIDIA пусна своето 28nm решение много по-късно.

Същата памет GDDR5 е инсталирана на новата видеокарта на AMD, но нейният обем, вместо 2 гигабайта в предишното поколение, е нараснал до 3 гигабайта. Това се случи поради разширяването на шината на паметта от 256-бита на 384-бита. И сега можете да поставите 1,5 GB или 3 GB на новата платка. Естествено, от маркетингова гледна точка, инсталирането на по-малък обем би било явен недостатък, затова беше взето решение да се сложат 3 GB, въпреки че днес това е малко прекалено. Само в свръхвисоки резолюции и с MSAA 16x 1.5-2 GB няма да са достатъчни. Въпреки това AMD също има Eyefinity и за игри на три или повече монитора екранният буфер просто ще заеме много голямо количество.

И така, нека да разгледаме Radeon HD 7970. Новата видеокарта от горния ценови клас има двуслотова система за охлаждане, която е покрита с пластмасов корпус, познат на всички съвременни дънни платки на AMD, по цялата дължина на картата. Само дизайнът на този корпус се е променил малко заден крайвсе още надхвърля печатната платка. Но дизайнът на лентата с щифтове беше променен - ​​за да се подобри охлаждането на видеокартата, единият от двата слота (половината на лентата) беше зает изключително от вентилационен отвор за разсейване на топлината.

Но потребителите не трябва да страдат от намаляването на броя на DVI конекторите, запоени точно върху платката. За тяхно удобство в комплекта ще бъде включен специален HDMI-DVI адаптер, който ще ви позволи да свържете два монитора с DVI конектори. Между другото, консумацията на енергия на новата карта не е по-ниска от тази на Radeon HD 6970, така че трябваше да инсталира комплект от един 8-пинов и един 6-пинов захранващ конектор.

Но в новия Radeon HD 7970 системата за охлаждане се промени към по-добро. Използват се ново поколение изпарителна камера и нов по-голям охладител, с модифицирана форма на лопатките и повишена производителност (осигурен е по-голям въздушен поток). Резултатът е повишаване на ефективността на охладителя, като същевременно се намалява шумът.

Превключвателят за двоен BIOS фърмуер, за който писахме в описанието на Radeon HD 6900, не е изчезнал от платката. И потребителите, и AMD харесаха това удобно решение толкова много, че AMD реши да продължи да допълва решения от най-висок клас с него.

Можем само да кажем здравей това решение, което наистина помага в различни случаи, свързани както с неочаквани проблеми по време на мигане (изключване на захранването в процеса, например), така и ви позволява безстрашно да провеждате различни експерименти с изображения на BIOS. Не е изненадващо, че AMD намеква отново и отново за отличните възможности за овърклок на новата графична карта:

Както можете да видите, овърклок до честота от 1 GHz и по-висока е практически обещана, ако не вземете предвид малкия надпис (който не беше включен в екранната снимка), че гаранцията престава да важи, дори ако видеокартата се повреди като резултат от експеримент с повишаване на честотата от настройките на видеодрайвера.

Архитектурни характеристики Radeon HD 7970

За да оцените уместността на архитектурните модификации в Южните острови, първо разгледайте развитието на GPU през последните няколко години от гледна точка на AMD. Преди 2002 г. графичните чипове бяха специфичен хардуер, способен да извършва чисто графични изчисления. Видео чиповете от онова време имаха ограничена функционалност, те можеха само да прилагат и филтрират текстури, да обработват геометрия, да участват в примитивна растеризация и следователно изобщо не бяха подходящи за универсални изчислителни задачи.

През следващите няколко години основната възможност за програмиране беше добавена към GPU, но също така се фокусира изключително върху графични задачи. Това беше времето на поддръжката на DirectX 8 и 9, шейдър програми с ограничена функционалност с възможност за плаваща запетая. Видеочиповете от онова време имаха специализирани ALU за обработка на върхове и пиксели, както и специални кешове за пиксели, текстури и други данни. Универсалността все още не беше дори близо.

И едва през 2007 г. AMD получи унифицирана шейдърна архитектура DirectX 10, както и възможност за програмиране на GPU с помощта на специални инструменти: CAL, Brook, ATI Stream. Графичните процесори от онова време вече имаха усъвършенствано кеширане и поддръжка за локални и глобални споделени данни. Архитектурно, чиповете са базирани на VLIW5 и VLIW4 блокове, достатъчно гъвкави за някои основни графично изчисление, но все още се фокусира върху графичните алгоритми.

И сега е време за нова архитектура, дори по-подходяща за универсални изчисления - Graphics Core Next (GCN). За AMD това е нова архитектурна ера, поради което е избрано името. Новите графични процесори предлагат отлични възможности за графична обработка и производителност, но направените архитектурни промени са предназначени основно да подобрят позицията в неграфичните изчисления - повишаване на производителността и ефективността при сложни задачи с общо предназначение. Нов дизайнГрафичният процесор е предназначен за така наречените хетерогенни изчисления - смес от графични и универсални изчисления в многозадачна среда. Архитектурата на GCN стана по-гъвкава и трябва да бъде още по-подходяща за енергийно ефективно изпълнение на различни задачи.

Основният блок в новата архитектура е блокът GCN. На тези "тухли" се основават всички нови графични процесори от серията Southern Islands. Архитектурата за първи път за графични чипове на AMD използва не-VLIW дизайн, използва векторни и скаларни блокове и една от най-важните промени е, че всеки от GCN изчислителните блокове има свой собствен планировчик и може да изпълнява инструкции от различни програми (ядро).

Новата изчислителна архитектура е проектирана за високоефективно зареждане на изчислителни единици в многозадачна среда. Изчислителната единица GCN е разделена на четири подсекции, всяка от които работи със собствен поток от инструкции всеки такт. Нишките могат също да използват скаларния блок, намиращ се в GCN за контрол на потока или операции с указател. Комбинацията от векторни и скаларни блокове предлага много прост модел на програмиране. Например указателите на функциите и указателите на стека са много по-лесни за програмиране и задачата на компилатора сега е значително опростена, тъй като изпълнителните единици са скаларни.

Всеки GCN блок има специален локално хранилищеданни за 64 KB за обмен на данни или локално разширение на стека за регистри. Също така, блокът включва както кеш памет от първо ниво с възможност за четене и запис, така и пълноценен конвейер за текстури (блокове за вземане на проби и филтриране). Следователно новото изчислително устройство може да работи независимо, без централен планировчик, който в предишните архитектури отговаряше за разпределянето на работата между блоковете. Сега всеки от GCN блоковете може да планира и разпределя команди самостоятелно, едно изчислително устройство може да изпълнява до 32 различни командни потока, които могат да бъдат от различни виртуални адресни пространства в паметта и са напълно защитени и независими един от друг.

Предишните GPU архитектури на AMD използваха архитектурните модели VLIW4 и VLIW5 и въпреки че те са достатъчно добри за графични задачи, но не са достатъчно ефективни за универсални изчисления, тъй като е много трудно да се заредят всички изпълнителни единици с работа в такива условия. Новата GCN архитектура предлага подобен голям брой изпълнителни единици, но в скаларно изпълнение, което премахва ограниченията и зависимостите на регистрите и инструкциите. Преходът от VLIW архитектура към скаларно изпълнение осигурява забележимо опростяване на задачите за оптимизиране на кода.

Когато изпълнява инструкции на предишната VLIW4 архитектура, компилаторът трябва да се справи с разрешаването на конфликти в регистъра, сложното разпределение на инструкциите към изпълнителните единици на етапа на компилиране на кода и т.н. В същото време, за да се постигне висока производителност, често се изисква нетривиална оптимизация изисква се, което е подходящо за повечето графични задачи и много по-малко гъвкаво за други изчисления. Новата архитектура предлага значително опростяване на разработката и поддръжката, опростено създаване, анализ и улавяне на грешки в код на ниско ниво, стабилна и предвидима производителност.

Подсистема за кеширане на паметта

Честотната лента, паметта и кеш паметта никога не са достатъчни и винаги има нужда и методи за увеличаването им. Новите графични процесори на AMD използват пълен двустепенен кеш за четене/запис. Всяка изчислителна единица има 16 килобайта кеш памет от първо ниво, а общият обем на кеш паметта от второ ниво е 768 килобайта (общо чипът получава 512 KB L1 и 768 KB L2), което е с 50% повече от предишния чип , който изобщо няма възможност да пише в L2 кеша.

По отношение на производителността, всяка GCN изчислителна единица може да получи или запише 64 байта данни от / в L1 кеша или глобалната памет в един цикъл, който служи за обмен на данни между командните потоци. Същото количество данни може да предава и получава всяка секция от L2 кеш паметта. В резултат на това графичният процесор от най-висок клас на компанията постига 2 терабайта/s за L1 и 700 GB/s за L2, което е с 50% повече от предишното топ решение на AMD.

Tahiti GPU

Сега, след като разгледахме архитектурните промени на ниско ниво в новата серия Southern Islands, време е да преминем към детайлите на най-мощното решение на линията, Radeon HD 7900, което включва два модела. На първо място, нека просто да отбележим огромната сложност на новия графичен процесор, защото той включва повече от 4,3 милиарда транзистора, което е два пъти повече, отколкото в чипа, на който е базиран Radeon HD 5870! Естествено, такъв мощен чип стана възможен само благодарение на използването на нова 28 nm технология. И така, какво има той вътре?

Броят на геометричните блокове не се е променил, в сравнение с Cayman, все още има два от тях, но ефективността на тяхната работа е значително увеличена - ще се спрем на това по-подробно малко по-късно. На диаграмата на графичния процесор виждаме 32 изчислителни единици с архитектура GCN, налични в Radeon HD 7970, а в случай на младшето решение някои от тях ще бъдат деактивирани. Ако вземем предвид пиковата изчислителна производителност на решението, тогава тя е почти 3,8 терафлопа (броят операции с плаваща запетая в секунда), което е абсолютен рекорд за GPU днес.

Всеки GCN блок има 16 текстурни единици, което дава обща цифра от 128 TMU на чип, или повече от 118 гигатексела / сек - и това е още един рекорд към момента на пускане и няма да е последният. Но броят на блоковете ROP не се е променил, все още има 32 от тях в 8 уголемени блока RBE. Друга интересна архитектурна промяна е, че сега ROP блоковете са „прикрепени“ не към каналите на паметта, както беше преди, а към GCN блоковете.

Въпреки че теоретичната скорост на запис на framebuffer не се е променила много и максимално възможните са същите 32 цветови стойности и 128 стойности на дълбочина на часовник, практическата скорост на запълване (скорост на запълване) в реални приложения се е увеличила значително поради увеличената честотна лента на паметта. AMD измери Cayman само на 23 пиксела на такт, докато новият Tahiti се доближи до теоретичните 32 пиксела на такт.

Това е разбираемо, тъй като новият видеочип на AMD има 384-битова шина на паметта - шест 64-битови канала, точно както сегашното решение на най-високия конкурент. Именно това 1,5-кратно увеличение на честотната лента на паметта прави възможно увеличаването на действителната скорост на извличане на текстури и запис в буфера на кадрите. Широчината на честотната лента от 264 GB / s трябва да помогне да се изстиска близо до теоретичните цифри от 118 гигатексела / сек и 30 гигапиксела / сек, а в практическата част ще проверим това.

В случай на „съкратения“ графичен процесор Radeon HD 7950, Tahiti включва 28 активни изчислителни единици на GCN архитектурата от 32 физически налични на чипа. В случай на младшето решение от серията Radeon HD 7970 беше решено да се деактивират четири от тях. Тъй като всеки GCN има 16 текстурни единици, общата стойност на TMU за новия модел е 112 TMU, което дава пропускателна способност от почти 90 гигатексела/сек.

Но броят на ROP и контролерите на паметта в HD 7950 не се е променил, те решиха да не ги намалят и да запазят същите 32 и 6 броя, съответно. Следователно видео чипът Tahiti Pro има същата 384-битова шина на паметта, събрана от шест 64-битови канала, като топ решението на AMD. Очевидно изчислителните функционални устройства страдат най-много от брака по време на производството и те решиха да не съкращават всичко останало.

Теселация и обработка на геометрия

От архитектурна гледна точка нищо особено не се е променило в геометричните блокове на Таити след Каймана. Той все още използва два блока за обработка (задаване на върхове и теселация) на геометрични данни и растеризация и схемата е много подобна на тази, която видяхме по-рано, с изключение на това, че теселаторите вече се наричат ​​9-то поколение:

Въпреки схематичните прилики, последното поколение на тези блокове е способно на значително по-добра производителност на теселация и обработка на геометрията, тъй като блоковете са претърпели значителни модификации. Въпреки че пиковата производителност е нараснала само до почти два милиарда върха и примитиви в секунда (925 MHz и два върха на такт), реално изпълнениенарасна повече. Това беше постигнато чрез увеличаване на размера на кеш паметта, подобряване на буферирането на геометрични данни и повторно използване на данни за върхове.

В резултат на това производителността на теселацията е подобрена при всички съотношения на триъгълно разделяне до четири пъти в сравнение с предишното поколение Radeon HD 6970. Но четири пъти не се постига във всички случаи, дори на диаграмата от самата AMD:

Графиката показва сравнение на производителността на теселация на Radeon HD 7970 в сравнение с HD 6970 при съотношения на разделяне от 1 до 32. И както можете да видите, разликата в производителността е от 1,7 до 4 пъти. Но това е гола синтетика. И за да се доближим до реалността, ще дадем повече данни за скоростта на теселация вече в приложенията за игри:

Както можете да видите, синтетичните числа на AMD се поддържат добре от тези за игри - производителността в реални приложения с "тежка" теселация е нараснала значително. Това е много добър резултат, който определено ще проверим в практическата част, използвайки примера на синтетика и приложения за игри.

Неграфични изчисления

От гледна точка на разнородни и неграфични изчислителни задачи се появиха две асинхронни изчислителни машини (Asynchronous Compute Engines - ACE). Те са проектирани да планират и разпределят работата между изпълнителните единици за ефективна многозадачност и работят заедно с графичен команден процесор (Command Processor).

Radeon HD 7900 има две независими изчислителни машини и една графична машина. Общо това дава три програмируеми блока и три потока инструкции, напълно отделени един от друг. И в допълнение към асинхронното издаване на команди за бързо превключване на контекста, новият графичен процесор разполага и с два двупосочни контролера за директен достъп до паметта (DMA), представени в Cayman. Тези два контролера са необходими, за да се възползват напълно от новата шина PCI Express 3.0.

Както знаем, от гледна точка на сериозни изчисления е важна не само скоростта на извършване на операции с плаваща запетая с единична точност, но и двойна точност (плаваща запетая с двойна точност). И новата архитектура на AMD се справя доста добре с това. На този моментПредполага се, че има две версии на GCN изчислителни единици с различни скорости на изпълнение за FP64 инструкции. За по-старите GPU скоростта на изпълнение е 1/4 от скоростта на FP32, а за по-младите чипове скоростта на изпълнение е 1/16, което е напълно достатъчно за поддържане на съвместимостта, но не усложнява много евтините решения. В резултат на това Radeon HD 7970 е способен на 947 милиарда операции с двойна точност в секунда (о, те едва достигнаха терафлопа!) - има още едно най-високо постижение на новия чип на AMD.

Освен това, това не са същите гигафлопи, както в случая на предишни архитектури, а по-„дебели“. В края на краищата ефективността на новия GPU при сложни изчислителни задачи трябва сериозно да се увеличи. Първо, подсистемата за памет и кеширане е подобрена. Второ, всяка GCN изчислителна единица има свой собствен планировчик, който трябва да подобри изпълнението на разклонения код и цялостната ефективност. И трето, отбелязваме скаларното изпълнение, което не изисква сложни оптимизации от компилатора, в резултат на което изчислителните единици ще бъдат бездействащи много по-рядко. И в резултат на това при всякакви задачи ще бъде по-лесно за новия чип да покаже висока производителност и натоварване на ALU.

Сред другите иновации, свързани с изчислителните възможности, отбелязваме пълната поддръжка на ECC за DRAM и SRAM. От страна на софтуера е важно, че Tahiti е първият GPU с пълна поддръжка за нови версии на API: OpenCL 1.2, DirectCompute 11.1 и C++ AMP и техните възможности. Например, OpenCL 1.2 ви позволява да комбинирате възможностите на няколко изчислителни устройства в едно и AMDвече пусна поддръжка под формата на AMD APP SDK 2.6 и драйвера Catalyst 11.12.

Архитектурно изпълнение и ефективност

След като прегледахме всички архитектурни иновации на примера на най-добрия чип от серията Southern Island, е време да поговорим за ефективността на всички тези промени. Ясно е, че производителността на новите чипове е много по-висока от тази на предишните, обратното би било доста изненадващо. Въпросът е колко по-бързо. В различни задачи се получават цифри от 40-50% (минимум!) До петкратна разлика. Подобренията в архитектурата позволяват да се надхвърли теоретичната 1,4-кратна разлика в тъпите гигафлопси. Нека да разгледаме това с примери:

Диаграмата сравнява новото топ решение и предишното едночипово решение: Radeon HD 7970 и HD 6970, което е съвсем справедливо. Избрани са различни тестове за производителност: SmallptGPU и LuxMark са проследяване на лъчи на OpenCL, SHA256 е защитен алгоритъм за хеширане, а AES256 е алгоритъм за симетрично криптиране. Е, Манделброт е добре познат проблем, изчислен с изчисления с двойна точност.

Вертикалната прекъсната линия на графиката показва теоретичната разлика в производителността, но данните за скоростта показват, че при три от пет задачи скоростта на новия GPU е значително по-висока. Това се дължи на всички промени, насочени към повишаване на ефективността: отдалечаване от VLIW, наличие на планировчик във всяка изчислителна единица, подобрено кеширане и др.

Промени в качеството на изобразяване

Всъщност тази част можеше да бъде пропусната, тъй като напоследък няма специални претенции към качеството на изображението и не може да бъде - по различни причини. Например, качеството на антиалиасинг на цял екран за видеокарти от различни производители е много близко, особено като се има предвид широкото използване на софтуерни методи за антиалиасинг, използващи филтри за последваща обработка, които се изпълняват на всички графични процесори по абсолютно същия начин .

Същото важи и за филтрирането на текстури - сега качеството му е такова, че е много трудно да се направи разлика между решенията на AMD и NVIDIA, дори ако направите сравнение пиксел по пиксел. Radeon HD 6900 - предишното поколение на компанията - е подобрило анизотропното филтриране малко повече и сега дори "микроскоп" няма да помогне да се намерят значителни недостатъци там. Единствената забележка е, че в движение видеокартите Radeon са малко по-ниски от GeForce поради по-забележими специфични артефакти, като "шум" или "пясък".

С пускането на новото поколение видео чипове, теглата на текселите във филтъра за текстури бяха преразгледани отново, модифицирани по такъв начин, че да намалят подобни артефакти, понякога видими на Radeon HD 6900 при наличие на текстури от определен тип („високочестотен“, с резки преходи от тъмно към светло, например). Промяната в качеството е толкова трудна за показване с примери, че AMD не предоставя сравнителни снимки на HD 7900 срещу HD 6900, а просто сравнява качеството на „хардуерния“ алгоритъм с чисто софтуерен алгоритъм, работещ на GPU поточни процесори, и следователно идеален :

На такава малка екранна снимка разликата в качеството не се вижда, но AMD уверява, че всички направени промени не са довели до спад в производителността и не са влошили качеството на изображението в нито един от аспектите - все още не зависи от ъгъла и качеството на филтриране е близко до идеалното. В един от бъдещите практически материали определено ще проверим това.

Частично резидентни текстури

Идеята на Partially Resident Textures (PRT) е да се използват хардуерните възможности на представения GPU - виртуална памет. Със сигурност много потребители вече са виждали играта RAGE на id Software, която използва технология за виртуално текстуриране, така нареченото мегатекстуриране („MegaTexture“), което предоставя възможността да се използват огромни количества текстурни данни и да се разменят (стриймват) във видео паметта.

Използвайки виртуална видео памет, е много лесно да получите ефективна хардуерна поддръжка за такива алгоритми, които позволяват използването на до 32 терабайта текстури в приложение, което прави възможно създаването на уникални места в игрите, без повтарящи се части от текстури, докато пълно отсъствиепроблеми при зареждане на текстурни данни. Вярно е, че илюстративният пример на AMD е твърде странен, от който нищо не е ясно:

PRT ви позволява да постигнете високо качество на картината и спомага за увеличаване на ефективността на използването на видео паметта. Подобни алгоритми вече се използват в id Software engine и се очаква да се появят в много машини от следващо поколение. Игрите на бъдещето трябва да работят с огромни количества данни и предимството на новия GPU е, че локалната графична памет в PRT алгоритмите работи като хардуерна кеш памет и текстурите се зареждат в нея, когато е необходимо. Графичните процесори от семейството на Южните острови поддържат „мега-текстури“ до 32 терабайта (резолюция до 16384×16384) и най-важното – хардуерно текстурно филтриране за тях, което не е налично при по-ранните видеочипове.

Виртуалните текстури са разделени на парчета от 64 килобайта (килобайта, не тексели) и този размер на парчето е фиксиран. И само тези, които са необходими при рендиране на текущия кадър, се зареждат в локалната памет на видеокартата. Технологията работи независимо от формата на текстурата, просто размерите на парчетата в текселите ще бъдат различни. Например, за обикновена некомпресирана текстура с 32 бита на цвят, размерът на парчето ще бъде 128x128 тексела, а за DXT3-компресирана текстура ще бъде 256x256 тексела.

Технологията също така включва използването на mip-нива на текстури (по-малки копия, използвани при филтриране на текстури). При рендиране и филтриране те трябва да бъдат достъпвани многократно. Разгледайте работата на алгоритъма на пример.

Тази фигура подчертава четири различни части от различни mip нива, необходими за рендиране. Когато шейдърната програма поиска данни от тях, някои от частите вече са в локалната памет и тези данни незабавно се изпращат на шейдъра за допълнителни изчисления. Но някои фигури липсват от масата и приложението трябва да реши какво да прави по-нататък при такъв пропуск. Например, можете да поискате данни от mip-level с по-ниска разделителна способност, тогава изображението ще бъде размито, но поне ще изглежда като истината и ще бъде нарисувано без забавяне. И докато бъде изобразен следващият кадър, той вече може да бъде зареден в кеша - локалната видео памет. Игралите RAGE ще ни разберат.

Това е мощен алгоритъм, който ви позволява да използвате огромни текстури, които са уникални за всеки от обектите. Подобни алгоритми отдавна се използват при офлайн рендиране, с изключение на необходимостта от изчисления в реално време. AMD дори направи демонстрация, използвайки техниката Per-Face Texture Mapping, разработена от Walt Disney Animation Studios за техните анимационни филми. За съжаление, демонстрацията все още не е готова и сме виждали само екранни снимки с ниска разделителна способност.

Същността на тази техника за картографиране на текстури е да се присвои определена част от текстурата на всеки полигон, без да е необходимо да се използва UV-трансформация (намиране на съответствие между координатите на повърхността на триизмерен обект и координатите на двумерен обект размерна текстура). Този подход решава някои от проблемите при създаването на теселирано съдържание, като прави алгоритъма за картографиране на изместване много прост. И PRT в този метод се използва за ефективно съхранение и достъп до данните за текстурата.

Инструкции за работа с носители

Интересна иновация в Южните острови изглежда е поддръжката на специализирани инструкции, използвани при обработката на изображения, както статични, така и динамични. Например, широко използвана инструкция, наречена „сума от абсолютни разлики“, по-известна като SAD (Sum of Absolute Differences), е подобрена. Скоростта на неговото изпълнение е много критично за производителността тясно място в много алгоритми за обработка на изображения и видео данни, като откриване на движение, разпознаване на жестове, търсене на изображения, компютърно зрение и много други.

Но в нашия преглед на древната видеокарта Radeon HD 5870 вече писахме за поддръжката на SAD. Сега, в допълнение към обичайния SAD (4 × 1), Южните острови имат нова инструкция- QSAD (четворно SAD), което комбинира SAD с оператори за смяна за увеличаване на производителността и енергийната ефективност, както и инструкцията за "маска" MQSAD, която игнорира фоновите пиксели и се използва за изолиране на обекти, движещи се в рамката от фона.

Новите GPU могат да обработват до 256 пиксела на GCN изчислителна единица на такт, което в случая на модела AMD Radeon HD 7970 означава способността да обработва до 7,6 трилиона пиксела в секунда в случай на 8-битови целочислени цветови стойности. Въпреки че това е теоретична цифра, възможностите за визуална обработка на новите GPU са доста впечатляващи - много задачи за обработка на видео могат да се изпълняват в реално време.

PCI Express 3.0

Не можахме да подминем поддръжката на третата версия на PCI Express от цялата гама нови графични решения от Южните острови. Тази поддръжка беше доста очаквана, тъй като спецификациите на третата версия на PCI Express бяха окончателно одобрени през есента на 2010 г., но все още нямаше хардуерни решения с неговата поддръжка, въпреки че дънни платкивече се появяват, видеокартите бяха пуснати в края на 2011 г. и има съответните централни процесори.

Актуализираният интерфейс има скорост на трансфер от 8 гигатранзакции в секунда вместо 5 GT/s за версия 2.0 и пропускателна способностоще веднъж удвоен (до 32 Gb / s), в сравнение със стандарта PCI Express 2.0. Новата шина използва различна схема на кодиране за данни, изпратени през шината, но съвместимостта с предишните версии на PCI Express е запазена.

Първите дънни платки с PCI поддръжка Express 3.0 беше представен през лятото на 2011 г. в основната база Intel чипсет Z68 и се появиха в широка продажба едва през есента на същата година. Така видеокартите пристигнаха навреме и AMD отново изпревари останалите по отношение на скоростта на пускане на нови графични процесори с поддръжка на най-модерните технологии. Но е твърде рано да се прецени дали PCI-E 3.0 ще бъде от някаква практическа полза.

Технология AMD PowerTune

Едно от най-интересните нововъведения в Cayman беше усъвършенстваната технология за управление на захранването PowerTune. Гъвкавото управление на мощността на GPU се използва от дълго време, но преди Radeon HD 6900 всички тези технологии бяха доста примитивни и предимно софтуерни методи и променяха честотата и напрежението на стъпки, без да могат да изключат големи части от видео чиповете .

Дори в семейството Radeon HD 5000 се появи ограничител на производителността, когато се превиши определено ниво на потребление, а в Radeon HD 6900 системата се премести на качествено различно ниво. За да направите това, в чипа бяха включени специални сензори във всички блокове, които следят параметрите за зареждане. Графичният процесор постоянно измерва натоварването и консумацията на енергия и не позволява последното да надхвърли определен праг, като автоматично регулира честотата и напрежението, така че параметрите да останат в рамките на определения термичен пакет.

За разлика от ранните технологии за управление на захранването, PowerTune осигурява директен контрол върху консумацията на енергия на графичния процесор, за разлика от индиректния контрол чрез промяна на честотите и напреженията. Тази технология помага да се зададат високи честоти на GPU, да се постигне висока производителност в игрите и да не се страхувате, че консумацията може да надхвърли безопасните граници. В края на краищата, повечето игри и обикновени приложения, които използват GPU изчисления, имат значително по-ниски изисквания за мощност и не се доближават до опасни граници на консумация на енергия, за разлика от тестовете за стабилност като Furmark и OCCT.

Дори най-тежките игри не изискват максимална консумация на енергия и ако ограничите консумацията по честота, тествайки видеокарти с екстремни тестове, тогава в случай на 3D игри ще има доста неизползвани възможности за производителност и мощност. В случай, че видеокартата не е достигнала границата на безопасното ниво на потребление, графичният процесор ще работи на фабрично зададената честота, а при тестовете FurMark и OCCT честотата на графичния процесор ще намалее, за да остане в границите на потребление.

По този начин PowerTune помага да се зададат по-високи фабрични честоти и да се настрои системата за най-ефективно използване на GPU ресурсите при зададеното максимално ниво на мощност. В примера, показан по-горе, HD 5870 не използва PowerTune и поради ограничението на честотата на GPU на висока консумация при тестове за издръжливост не използва пълния си потенциал. Докато максималният TDP е зададен за Radeon HD 7970, а видеочипът нулира честотите само когато е превишен, като получава възможно най-високата производителност във всяко приложение.

Това е ясно показано на следващата диаграма. В случай на приложения за игри TDP може да се постигне чрез увеличаване на честотата на GPU, а при пикови натоварвания тестовете за издръжливост намаляват честотата до безопасно ниво на консумация на енергия. Без PowerTune ще трябва да избирате - или да получите вероятността от повреда на видеокартата, когато FurMark и OCCT работят дълго време, или да намалите потенциалната производителност в игрите. Новата технология решава тези проблеми възможно най-ефективно.

AMD PowerTune се отличава с бърза реакция на променящите се условия (микросекунди), тъй като е хардуерна технология. Освен това се отличава с гъвкава настройка на честотата, а не стъпаловидна, както беше в предишните чипове. Всички измервания са независими от драйвера, но могат да се коригират от потребителя чрез настройките на видеокартата.

Разликата между PowerTune и досегашния общоприет подход е, че в други случаи се използва термично дроселиране, което поставя GPU в режим на значително намалена консумация, а PowerTune просто плавно намалява честотата си, довеждайки консумацията на GPU до зададения лимит. Това води до по-високи тактови честоти и по-висока производителност.

Технология AMD ZeroCore

AMD не се ограничи до използването на технология за управление на захранването, вече позната от предишни решения. В първите чипове от фамилията Southern Islands той въвежда технологията AMD ZeroCore, която помага за постигане на още по-голяма енергийна ефективност в режим на "дълбок празен ход" (или "заспиване") с деактивирано устройство за показване, което се поддържа от всички операционни системи .

В края на краищата почти всяка система, дори и игрална, прекарва по-голямата част от времето в режим на ниско натоварване на графичния процесор. И видеокартата не трябва да консумира много енергия в този режим. И още повече, да не говорим за режима с изключен монитор - в този случай е препоръчително да изключите GPU напълно. Това направи AMD. Благодарение на ZeroCore, новият графичен процесор консумира по-малко от 5% от мощността в пълен режим, когато е в дълбок празен ход, дезактивирайки повечето от функционалните блокове в този режим.

AMD предоставя схематично сравнение със собствената си Radeon HD 5870, която не поддържа тази технология. ZeroCore е изключителна иновация за Южните острови в десктоп решения от мобилни графични процесори, предназначени за лаптопи. Между другото, предимствата на тази технология са свързани не само с намаленото потребление. Освен това в режим на дълъг празен ход, когато дисплеят е изключен, видеокартата също изключва напълно вентилатора на охладителя на видеокартата!

Това е точно това, което много потребители чакат от дълго време. Най-интересното е, че според нашите данни лабораторните тестове на решения като PowerTune и ZeroCore са проведени преди няколко поколения видеокарти. Някои от инженерните образци на видеокарти от серията AMD, които отдавна са напуснали пазара, работеха точно по този начин, напълно изключвайки охладителя по време на неактивност.

Но не само потребителите с един GPU се възползват от намаляването на шума и консумацията на енергия с новите ZeroCore графични карти на AMD. Подобни подобрения очакват щастливи собственици на системи CrossFire, базирани на две, три и дори четири графични процесора. Логично ли е все пак в режим на изобразяване на двуизмерния интерфейс на операционната система всички видеокарти, с изключение на основната, да не работят изобщо? Но така работят сега!

В случай на системи CrossFire на видеокарти с поддръжка на ZeroCore в 2D режим, всички вторични видеокарти са потопени в дълбок сън с минимална консумация на енергия и деактивиран охладител. Този режим работи както за няколко едночипови видеокарти, така и за двучипови решения. В допълнение, основната графична карта CrossFire също ще влезе в този режим в случай на дълго време на бездействие, конфигурирано в Windows. Визуално разликата в работата изглежда така:

Между другото, технологията не е толкова проста, колкото може да изглежда. Инженерите на AMD трябваше да решат много проблеми, свързани с работата на операционната система в неактивен режим. Например те откриха, че Windows се опитва да актуализира информацията на екрана дори когато мониторът е изключен. Което, разбира се, не ви позволява изобщо да деактивирате GPU. Затова програмистите на компанията трябваше да предприемат заобиколно решение, като игнорираха всички команди за рисуване на екрана, когато мониторът беше изключен в режим на заспиване.

Технология AMD Eyefinity 2.0

Естествено, в новата архитектура имаше място и за подобрения на доказалата се технология за показване на изображения на множество монитори - AMD Eyefinity, вече във версия 2.0. Той получи нови функции, по-високи разделителни способности, поддръжка за повече дисплеи и повишена гъвкавост.

Тази технология е доста интересна, въпреки че изключително малък брой потребители ще намерят място в стаята и ще съберат смелост пред семейството да инсталират повече от два монитора. Но е по-добре да имате възможност винаги да можете да го използвате, отколкото да го нямате изобщо. Освен това цените на мониторите с големи диагонали почти не намаляват, но решенията от среден клас постоянно поевтиняват.

Всъщност сега е по-изгодно да закупите три монитора с диагонал на екрана 24 инча, отколкото един 30-инчов. AMD дава точно такъв пример, където 30-инчов 2560x1600 монитор струва над $1000, докато три 24-инчови FullHD монитора могат да бъдат закупени на половината от тази цена:

Но как да харчите парите и пространството в стаята е личен въпрос за всеки потребител. Основното е, че има такава възможност. Освен това Eyefinity 2.0 вече поддържа извеждане на изображения в HD3D стерео режим - нещо, което липсваше в предишните решения, които бяха по-ниски от конкурентните по този параметър. Комбинирайки технологиите AMD Eyefinity и HD3D, Radeon HD 7970 е първото едночипово решение, което поддържа три монитора в стерео режим.

Стерео изобразяването с висока разделителна способност изисква много бърз интерфейс за пренос на данни. И с предишните HDMI версииизходи, възможностите бяха ограничени до 24 Hz на око, което е напълно достатъчно за гледане на филми на Blu-ray 3D, но очевидно твърде малко за геймърите.

За такива задачи те започнаха да използват формата за пакетиране на кадри, когато рамките за лявото и дясното око се комбинират в едно, а AMD Radeon HD 7970 поддържа формат за пакетиране на кадри HDMI 1.4a за стерео изход. Това е първата видеокарта, която поддържа 3 GHz HDMI с пакетиране на кадри, където всяко око има FullHD картина при 60 Hz (120 Hz общо):

Друга интересна новост ни се струва многоканалната аудио изходна технология Discrete Digital Multi-Point Audio (DDMA), която работи заедно с Eyefinity. Всички предишни графични процесори са способни да извеждат през HDMI и DisplayPort само един аудио поток. Тоест, дори ако три монитора, разположени в различни стаи, са свързани към компютъра чрез HDMI, тогава звуков каналпредава се само един. Но AMD Radeon HD 7900 получи поддръжка за едновременен изход на няколко независими аудио канала наведнъж, което може да бъде полезно в някои конфигурации с няколко монитора.

Същата функция ще бъде много полезна за приложения за видеоконференции с извеждане на няколко събеседника на отделни екрани, както и приложения за многозадачност, като игра на три монитора с аудио игра и гледане на новини на отделен екран с независим аудио поток. Преди това за всичко това беше необходимо да се използват няколко отделни аудио системи, но сега всичко работи възможно най-удобно.

Софтуерната поддръжка на Eyefinity също не е забравена, почти всеки месец технологията се актуализира - появяват се нови възможности. Така през октомври се появи поддръжка за разделителни способности до 16384 × 16384 и нови конфигурации с няколко монитора: хоризонтални и вертикални 5 × 1, както и базирани на шест монитора в режим 3 × 2.

Актуализацията на видео драйвера на AMD Catalyst през декември осигурява съвместна работа на Eyefinity и HD3D, а през февруари е обявена поддръжка за персонализирани резолюции, настройки на разположението на лентата на задачите и подобрения в управлението на предварително зададени настройки.

Изход към шест монитора може да се постигне с помощта на два DisplayPort 1.2 порта и два MST хъба (за които писахме по-рано), докато три или дори четири монитора изискват само един порт и съответния хъб. Тези хъбове предлагат гъвкави конфигурации на дисплея, поддържат до четири FullHD устройства на DisplayPort 1.2 конектор и трябва да бъдат налични до лятото на 2012 г.

Говорейки за разрешение. Висока разделителна способност или дори свръхвисока - Ultra High Resolution. Текущите устройства с резолюция от 4000 пиксела от по-голямата страна изискват връзка с помощта на няколко кабела наведнъж: два DP 1.1 или четири DVI. Мониторите с тази резолюция от следващото поколение ще бъдат свързани само с един кабел: DP 1.2 HBR2 или HDMI 1.4a 3 GHz. И нова графична карта AMD вече е готова за такива монитори, отново стана първа в света.

Видео кодиране и декодиране

Съвсем естествено е, че AMD Radeon HD 7970 включва същия UVD блок за декодиране на видео данни, който се появи в предишното поколение видеочипове на компанията. Той просто не се нуждае от никакви модификации, поддържа MVC многопоточен кодек, MPEG-2/MPEG-4 (DivX), VC-1 и H.264 декодиране, както и декодиране на два FullHD потока във всички поддържани формати.

Решенията на AMD предоставят максимално качестводекодиране на видео поток, използвайте десетки специални алгоритми за подобряване на качеството и предоставяйте максимални резултати при тестове за качество като HQV. Сред поддържаните функции отбелязваме: настройка на цвета и тона, намаляване на шума, изостряне, висококачествено мащабиране, динамичен контраст, усъвършенствано деинтерлейсинг и обратно телесино. Ето пример за подобряване на контраста в движение:

Но с декодирането всички видео чипове са повече или по-малко в ред от дълго време. Всички нови графични процесори осигуряват прилично качество и производителност при гледане на видео данни. Но кодирането на видео на GPU е все още в начален стадий и основните оплаквания от потребителите са насочени към ниското качество на полученото компресирано изображение.

Може би новата серия Radeon HD 7000 може да помогне с това, защото всички графични процесори в серията имат Video Codec Engine (VCE) единица за видео кодиране. Radeon HD 7970 беше първата видеокарта, която поддържаше хардуерно ускорено кодиране и видео компресия с помощта на специализиран блок (по-рано поточните процесори участваха в кодирането).

Качеството и производителността трябва да бъдат очевидно по-добри от преди, с поддръжка за 1080p при 60fps кодиране, дори по-бързо от реално време. Трудно е да се каже нещо за качеството без тестове, но ни се обещават различни нива на оптимизация на енкодера за видео данни и игри, както и променливо качество на компресия (възможност да избирате между подобряване на качеството или производителност).

Засега няма къде да опитате VCE - просто няма приложения с поддръжка за него, но AMD работи с партньори като ArcSoft, за да предостави поддръжка за VCE в съответните софтуерни продукти. В бъдеще планираме да пуснем софтуерна библиотека за ускоряване на кодирането на видео, което ще улесни разработчиците да поддържат следващо поколение продукти на AMD.

Кодирането може да се извърши в два режима: пълен и хибриден (използвайки възможностите на GPU поточните процесори). Пълният режим е предназначен за приложения, които изискват максимална енергийна ефективност и постоянно ниво на производителност. Кодиране в пълен режимна VCE е по-бързо от реално време и осигурява ниска латентност. Но има и хибриден режим:

В този режим математическите блокове на GPU работят заедно с VCE. Всички силно паралелизирани етапи, които са оградени в жълто в диаграмата, могат да използват мощността на изчислителните единици GCN, а специалното VCE устройство е ангажирано с ефективно хардуерно ентропийно кодиране. Този режим е много подходящ за видеокарти с голяма математическа мощност, като например Radeon HD 7970. Все още има въпроси относно качеството на тези два режима, но това изисква задълбочен анализ в отделна статия.

AMD Steady Video

В допълнение към кодирането и декодирането на видео данни, има още една област, в която може да се използва силата на новата графика на AMD - подобряване на ръчни видеоклипове с лошо качество без използването на статив или други подобни инструменти за стабилизиране на изображението. Технологията за стабилизиране на видео се нарича AMD Steady Video, като вече е пусната втората й версия.

Алгоритъмът на софтуерния стабилизатор е доста прост: въз основа на видеопотока се събира статистика за движението на камерата (изместване, завъртане, мащабиране) и това движение се компенсира в текущия кадър спрямо предишните - изображението се измества, завърта и мащабира, така че картината да не скача много и да остане стабилна.

Колкото и просто да е на думи, толкова е и трудно за изпълнение. Просто защото на екрана има два милиона пиксела и до 30 или дори 60 кадъра в секунда.Представете си колко изчисления трябва да направите, за да проследите всички възможни смени на кадрите. Вече писахме по-горе за функцията QSAD, използвана при обработката на видео, а също така се използва и в Steady Video 2.0 за ускоряване на алгоритъма за откриване на движение. Така GPU трябва да обработва произволни смени с амплитуда до 32 пиксела във всяка посока и това изисква производителност, съответстваща на повече от 500 милиарда SAD операции в секунда (за 1920x1080 при 60 FPS).

Поддържайки новите QSAD инструкции в Radeon HD 7970, нейното предимство пред мощните процесори в алгоритъма за откриване на движение надхвърля 10 пъти! Тоест, вече ще ни се предоставя висококачествено видео, и то не само при обработката на домашни видеоклипове във видео редактори, но и при гледане на чужди онлайн видеоклипове, заснети от неизвестно какво и неизвестно как.

Подробности: Radeon HD 7800 серия

  • Кодово име на чип: "Pitcairn"
  • Технология на производство: 28 nm
  • 2,8 милиарда транзистора (малко повече от Cayman, който е в основата на серията Radeon HD 6900)
  • Унифицирана архитектура с масив от общи процесори за поточно обработване на множество типове данни: върхове, пиксели и други.
  • Хардуерна поддръжка за DirectX 11.1, включително шейдър модел Shader Model 5.0
  • 256-битова шина на паметта: четири 64-битови широки контролера с поддръжка на GDDR5 памет
  • Честота на ядрото: до 1000 MHz (за Radeon HD 7870)
  • 20 GCN изчислителни единици с 80 SIMD ядра за общо 1280 ALU с плаваща запетая (формати Integer и Float, поддръжка за прецизност на IEEE 754 FP32 и FP64)
  • 80 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 32 ROPs с поддръжка на режими на антиалиасинг с възможност за програмируемо семплиране на повече от 16 семплиране на пиксел, включително с FP16 или FP32 framebuffer формат. Пикова производителност до 32 проби за такт и в безцветен режим (само Z) - 128 проби за такт

Radeon HD 7870 Графични спецификации

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 1280
  • Брой текстурни единици: 80, смесващи единици: 32
  • Тип памет: GDDR5
  • Капацитет на паметта: 2 гигабайта
  • Теоретична максимална скорост на запълване: 32,0 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 80,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: 3 до 175 W
  • Два 6-пинови захранващи конектора
  • Дизайн с двоен слот
  • MSRP в САЩ: $349

Radeon HD 7850 Графични спецификации

  • Честота на ядрото: 860 MHz
  • Брой универсални процесори: 1024
  • Брой текстурни единици: 64, смесващи единици: 32
  • Ефективна честота на паметта: 4800 MHz (4×1200 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 2 гигабайта
  • Честотна лента на паметта: 153,6 гигабайта в секунда
  • Теоретична максимална скорост на запълване: 27,5 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 55,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: 3 до 130 W
  • Дизайн с двоен слот
  • MSRP за САЩ: $249

И този път принципът на именуване на продуктите на компанията не беше променен и бяха продължени тенденциите от предишната серия. Среднобюджетната серия видеокарти, базирани на архитектурата GCN, се различава от горната и бюджетната линия във втората цифра в индекса: вместо 7 и 9 е зададено числото 8, което е съвсем логично. Тъй като AMD е приела психологическия праг от 1000 MHz за честотата на графичния процесор, Radeon HD 7870 получи добавката „GHz Edition“ към името, което показва приемането на тази честота.

От името става ясно, че Radeon HD 7800 е по-производителен от HD 7700, но има по-ниска скорост в сравнение с по-старите модели - HD 7900. Що се отнася до решенията на NVIDIA, по-старият HD 7870, пуснат по време на пускането конкурира се с видеокартата GeForce GTX 570, а по-младият е насочен към борба с GTX 560 Ti, а NVIDIA все още не е пуснала нови 28 nm чипове от среден клас.

И двата модела видеокарти на AMD имат GDDR5 памет с еднакъв обем от 2 гигабайта. И двете използват 256-битова шина на паметта, така че можете да поставите 1, 2 или 4 GB върху тях. 1 гигабайт е твърде малък, а 4 GB са твърде скъпи за това ценови сегмент. Следователно можем да кажем, че е избрано идеалното количество от 2 GB видео памет, което е напълно достатъчно за по-голямата част от игрите дори при високи резолюции и не е твърде скъпо като цена.

В други отношения, от гледна точка на потребителя, моделите HD 7850 и HD 7870 все още са различни. По-старата Radeon HD 7870 има по-висока консумация на енергия, така че се нуждае от два допълнителни 6-пинови захранващи конектора, а HD 7850 се задоволява само с един от тях. И двете платки имат дизайн на охладителна система с два слота, но повечето производители произвеждат платки със собствен дизайн на поне охладител и дори печатна платка.

Архитектурни характеристики на семейството Radeon HD 7800

По-горе внимателно описахме всички характеристики на новата архитектура Graphics Core Next (GCN), така че ще повторим само най-важните. Всички нови графични процесори на компанията предлагат отлични характеристики и производителност не само при графична обработка, но и при неграфични изчисления, включително комбинация от различни видове изчисления. Също така, новата GCN архитектура предлага сериозно опростяване на задачите за оптимизиране на кода, опростяване на разработката и поддръжката, както и стабилна и предвидима производителност и като цяло доста висока ефективност.

Базовият блок на новата архитектура е блокът GCN и всички графични процесори от серията Southern Islands са сглобени от тях. Помислете за блоковата схема на чипа Pitcairn:

Диаграмата показва графичния процесор Radeon HD 7870 ("опростеният" HD 7850 се различава от него с няколко отделени блока), виждаме 20 изчислителни единици на архитектурата GCN. В случая на младшото решение от серията Radeon HD 7800, четири от тях бяха деактивирани, а броят на активните блокове в него е 16. Това съответства съответно на 1280 и 1024 поточни процесора (точно както в случая с HD 7700 семейство, само че има точно два пъти повече блокове) . Тъй като всяка GCN единица има четири текстурни единици, общият брой на TMU за по-стария модел е 80 TMU, а за по-младия - 64 TMU.

Но броят на ROP и контролерите на паметта в HD 7870 и HD 7850 също е същият като в решенията на най-младата линия. Броят на ROP блоковете е оставен доста голям - 32 броя за двата модела. Шината на паметта за платки, базирани на Pitcairn, е намалена до 256 бита, тя се сглобява от четири 64-битови канала. Това не е лошо за решение от такова ниво, въпреки че е един път и половина по-малко, отколкото в горния ред, тъй като шината на паметта традиционно се изрязва първо. Добре е, че използването на бърза GDDR5 памет даде сравнително висока честотна лента от 153 GB / s.

Подобно на останалите архитектурни чипове на GCN, Pitcairn включва теселаторен блок от 9-то поколение, включващ множество оптимизации за буфериране и кеширане, които могат значително да подобрят производителността на обработката на геометрията. Ето сравнение на новата платка на AMD с решението на предишното поколение в синтетична задача, според която можем да предположим увеличение на скоростта на теселация до четири пъти:

По същия начин се поддържат и много технологии на AMD, които са въведени и подобрени в новите видео чипове Radeon HD 7000. Ето непълен списък от тях: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, качество на филтриране на текстури подобрения и др. Всичко това е описано по-подробно по-горе. За да добавим към списъка, Radeon HD 7800 поддържа напълно както подобрения алгоритъм за анти-алиасинг MLAA 2.0, така и анти-алиасинг със суперсемплиране (SSAA).

Що се отнася до производителността на игрите, Radeon HD 7870 е значително по-бърз от прекия си конкурент GeForce GTX 570, особено като се има предвид 1,25 GB VRAM на последния (в сравнение с 2 GB за въпросните решения), наблюдаван в съвременните игри при високи резолюции на рендиране . По-младият Radeon HD 7850 може да се сравни с GeForce GTX 560 Ti и тук вече не може да се похвали с количеството памет. Въпреки това, според измерванията на AMD, тяхното ново решение все още е по-бързо от конкуренцията в повечето игри.

Подробности: Radeon HD 7700 Series

  • Кодово име на чип: "Кабо Верде"
  • Технология на производство: 28 nm
  • 1,5 милиарда транзистора (по-малко от Barts, който е в основата на серията Radeon HD 6800)
  • Унифицирана архитектура с масив от общи процесори за поточно обработване на множество типове данни: върхове, пиксели и други.
  • Хардуерна поддръжка за DirectX 11.1, включително шейдър модел Shader Model 5.0
  • Честота на ядрото: до 1000 MHz (за Radeon HD 7770)
  • 10 GCN изчислителни единици с 40 SIMD ядра за общо 640 ALU с плаваща запетая (формати Integer и Float, поддръжка за прецизност на IEEE 754 FP32 и FP64)
  • 40 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • Интегрирана поддръжка за до шест монитора, включително HDMI 1.4a и DisplayPort 1.2

Radeon HD 7770 Графични спецификации

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 640
  • Брой текстурни единици: 40, смесващи единици: 16
  • Тип памет: GDDR5
  • Капацитет на паметта: 1 гигабайт
  • Теоретична честота на дискретизация на текстурата: 40,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: 3 до 80 W
  • Един 6-пинов захранващ конектор
  • Дизайн с двоен слот
  • MSRP за САЩ: $159

Radeon HD 7750 Графични спецификации

  • Честота на ядрото: 800 MHz
  • Брой универсални процесори: 512
  • Брой текстурни единици: 32, смесващи единици: 16
  • Ефективна честота на паметта: 4500 MHz (4×1125 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 1 гигабайт
  • Честотна лента на паметта: 72 гигабайта в секунда
  • Теоретична максимална скорост на запълване: 12,8 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 25,6 гигатексела в секунда
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, един DisplayPort 1.2
  • Консумирана мощност: 3 до 55 W
  • Не изисква допълнително захранване
  • Дизайн с един слот
  • MSRP за САЩ: $109

Серията евтини видеокарти, базирани на архитектурата GCN, се различава от горната и средната линия във втората цифра в индекса: 9-то място беше заето от номер 7, както беше преди. Radeon HD 7770 е по-продуктивно решение, но има и по-млад модел - HD 7750. По-старата платка нямаше директни конкуренти на пазара към момента на пускане, като се намираше някъде между GeForce GTX 560 и GTX 550 Ti , а по-младият е насочен към борбата с GTX 550 Ti. За HD 7770 по-късно беше обявен конкурент в лицето на GeForce GTX 560 SE (всички решения на NVIDIA са базирани на по-стари графични процесори).

И двата разглеждани модела видеокарти на AMD имат GDDR5 памет с еднакъв обем от 1 гигабайт. Поради използването на 128-битова шина на паметта, на тях може да се постави 2 GB памет, но това количество GDDR5 памет ще струва твърде много за техния ценови сегмент. Ето защо досега са пуснати модели с такъв обем, въпреки че в бъдеще може да бъдат пуснати опции с 2 GB видео памет. Междувременно решихме да оставим този обем за HD 7800.

По отношение на други потребителски характеристики, моделите HD 7750 и HD 7770 са доста различни. Ако по-старият Radeon HD 7770 има двуслотов дизайн на охладителната система и неговият охладител е покрит с пластмасов корпус, както при по-старите решения, тогава по-младият HD 7750 изглежда значително по-прост, заема един слот и има обикновен охладител. Повечето производители обаче все още произвеждат дъски със собствен дизайн. Консумацията на енергия на новите модели в този ценови диапазон също е различна, по-старият има един 6-пинов конектор за допълнително захранване, а по-младият се захранва от PCI Express.

Архитектурни характеристики Radeon HD 7700

Базовият блок на новата архитектура е блокът GCN и всички графични процесори от серията са сглобени от тях. Всеки от наличните GCN блокове е способен да планира и разпространява инструкции самостоятелно, а едно изчислително устройство може да изпълни до 32 независими потока инструкции. Нека да разгледаме блоковата схема на чипа на Кабо Верде:

Диаграмата показва графичния процесор Radeon HD 7770 („съкратеният“ HD 7750 включва няколко несвързани единици), виждаме 10 изчислителни единици на архитектурата GCN. В случая на младшото решение от серията Radeon HD 7700 беше решено да се деактивират два от тях и броят на блоковете стана 8. Това съответства на 640 и 512 поточни процесори. И тъй като всяка GCN единица има 4 текстурни единици в състава си, крайната цифра за броя на TMU за по-стария модел е 40 TMU, а за по-младия - 32 TMU.

Броят на ROP и контролерите на паметта в HD 7770 и HD 7750 е еднакъв и ние решихме да не намаляваме много ROPs, оставяйки ги на 16 всеки. Но шината на паметта в Кабо Верде е намалена до 128-битова, която е събрана от два 64-битови канала. Като цяло, това е три пъти по-малко, отколкото в топ серията, и видяхме още едно потвърждение, че шината на паметта традиционно се съкращава преди всичко в евтините чипове. Въпреки че използването на бърза GDDR5 памет направи възможно оставянето на относително висока (за такива евтини решения) честотна лента от 72 GB / s.

Остава да отбележим и доста голямо количество L2 кеш - цели 512 килобайта (в сравнение със 768 KB за чип от най-висок клас - очевидно L2 кешът не заема твърде много място на чипа), както и като подобрения в геометричните характеристики. Подобно на най-добрия чип, Cape Verde разполага с теселатор от 9-то поколение, включващ множество оптимизации за буфериране и кеширане, за да осигури значително подобрение в производителността на обработка на геометрията в сравнение със серията Radeon HD 6000.

Като цяло няма да повтаряме цялата информация за технологиите на AMD, които са внедрени и подобрени в новите видео чипове Radeon HD 7000 (ето частичен списък: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, подобрения в качеството на филтриране на текстури , и т.н. .p.), всичко това е описано по-подробно по-горе. Серията HD 7700 поддържа всички характеристики, изброени там, включително AMD Eyefinity 2.0 с шест монитора и стерео изобразяване, както и подобрен блок за декодиране и кодиране на видео.

Но какво ще кажете за най-важното - производителността в игрите? Първите оценки на скоростта на изобразяване винаги могат да бъдат направени от презентациите на производителя. AMD вярва, че Radeon HD 7770 е някъде по средата между GeForce GTX 560 и GeForce GTX 550 Ti, съответно, и я сравнява в материалите си с втория конкурентен модел.

Но те не сравняват Radeon HD 7750 с нищо, просто отбелязват, че повечето съвременни игри могат да се играят на този модел при максимални настройки в FullHD резолюция. Това обаче не е изненадващо, тъй като последните годиниНа практика няма PC ексклузиви, а мултиплатформените игри са значително по-малко взискателни. Така че платките от серията Radeon HD 7700 са идеални за непретенциозни потребители.

Детайли: Модел Radeon HD 7790

  • Кодово име на чип: "Bonaire"
  • Технология на производство: 28 nm
  • 2,08 милиарда транзистора (повече от Cape Verde в Radeon HD 7700, но по-малко от Pitcairn в Radeon HD 7800)
  • Унифицирана архитектура с масив от общи процесори за поточно обработване на множество типове данни: върхове, пиксели и други.
  • Хардуерна поддръжка за DirectX 11.1, включително шейдър модел Shader Model 5.0
  • 128-битова шина на паметта: два 64-битови широки контролера с поддръжка на GDDR5 памет
  • Честота на ядрото: 1000 MHz
  • 14 GCN изчислителни единици от 56 SIMD ядра с общо 896 ALU с плаваща запетая (целочислени и плаващи формати, поддържа IEEE 754 FP32 и FP64 точност)
  • 56 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 16 ROPs с поддръжка на режими на антиалиасинг с възможност за програмируемо семплиране на повече от 16 семплиране на пиксел, включително с FP16 или FP32 framebuffer формат. Пикова производителност до 16 проби на такт и в безцветен режим (само Z) - 64 проби на такт

Radeon HD 7790 Графични спецификации

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 896
  • Брой текстурни единици: 56, смесващи единици: 16
  • Тип памет: GDDR5
  • Капацитет на паметта: 1 гигабайт
  • Честотна лента на паметта: 96 гигабайта в секунда
  • Теоретична максимална скорост на запълване: 16,0 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 56,0 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, HDMI 1.4, два Mini-DisplayPort 1.2
  • Консумирана мощност: 3 до 85 W
  • Един 6-пинов захранващ конектор
  • Дизайн с двоен слот
  • MSRP за САЩ: $149

Евтин модел видеокарта, базиран на нов чип от среден бюджет, се различава от предишния топ модел на подсемейството HD 7700 с третата цифра в индекса: вместо 7, те поставят числото 9, което показва увеличение на производителността. В същото време индексът Radeon HD 7790 ясно показва, че това е по-малко продуктивна видеокарта в сравнение с една стъпка по-висока линия - HD 7800.

Тук обаче всичко не е толкова просто - със сигурност ще може да спори с по-младия HD 7850. Но препоръчителната цена на Radeon HD 7790 е определена на $149, тоест приблизително по средата между цените на HD 7770 и HD 7850. Що се отнася до решенията на конкурента от същия ценови сегмент, HD 7790 очевидно е предназначен да имат NVIDIA GeForce GTX 650 Ti, базиран на чипа GK106, се намира точно между HD 7770 и HD 7850 по отношение на цена и скорост. Но NVIDIA веднага отговори на пускането на новата платка от AMD, като пусна овърклокната версия на GeForce GTX 650 Ti Boost, която се характеризира с по-голяма производителност.

Този модел графична карта на AMD има GDDR5 памет с капацитет само 1 гигабайт. Графичният процесор има 128-битова шина на паметта и теоретично може да се достави 2 GB, но това количество бърза GDDR5 памет все още е твърде скъпо за този ценови сегмент и AMD пусна модел с по-малка памет, въпреки че може да не е достатъчно за някои съвременни игри дори при ниски настройки и резолюции. Възможни са обаче и видео карти от партньори с 2 GB видео памет.

Подобно на моделите, които стоят до него в линията, Radeon HD 7790 има двуслотов дизайн на охладителната система, който е покрит с пластмасов корпус. Въпреки че повечето производители все още пускат платки със собствен дизайн на охладителя, така че референтният не е толкова важен. Интересното е, че консумацията на енергия на новия модел не се е увеличила много в сравнение с HD 7770, но подобрението в енергийната ефективност беше очаквано. Между другото, затова новостта също има само един 6-пинов конектор за спомагателно захранване.

архитектурни особености

Новият графичен процесор Bonaire, на който е базиран издаденият Radeon HD 7790, принадлежи към същата архитектура Graphics Core Next (GCN), която познаваме от година и половина, но AMD я нарича GCN 1.1, намеквайки за незначителни промени. Всъщност чипът е архитектурно почти същият като предишните, въпреки че наистина има някои малки промени. Например, новата архитектура въведе инструкции, които са полезни за хетерогенна архитектура (Heterogeneous System Architecture - HSA), поддръжка за повече едновременно изпълняващи се нишки, както и нова версия на технологията AMD PowerTune, за която ще говорим по-късно. Но всички тези промени не могат да се нарекат значителни, защото няма нищо ново в основните блокове и подобряването на тяхната ефективност.

Ето защо можем спокойно да се позоваваме на, който внимателно описва всички характеристики на новата архитектура Graphics Core Next (GCN), а тук ще повторим само най-важните характеристики и характеристики на конкретен продукт. Всички най-нови графични процесори на AMD предлагат отлични характеристики и производителност както при графична, така и при неграфична обработка, включително смеси от двете. Новата GCN архитектура също така осигурява значително опростяване на задачите за оптимизация и разработка на софтуер, като същевременно поддържа висока ефективност.

Както знаете, основният блок на архитектурата е блокът GCN, от който са събрани всички графични процесори от серията Southern Islands. Изчислителната единица GCN е разделена на подсекции, всяка от които работи със собствен поток от инструкции. GCN блоковете имат специално 64 KB локално хранилище за данни за обмен на данни или разширяване на стека на локалния регистър. Също така блокът има кеш памет от първо ниво с възможност за четене и запис и пълноценен конвейер за текстури с блокове за вземане на проби и филтриране. Всяка от съществуващите GCN единици е в състояние да планира и разпределя команди самостоятелно, а една изчислителна единица може да изпълнява няколко независими потока инструкции. Нека да разгледаме блоковата схема на новия чип:

Схемата Bonaire потвърждава целта на новото решение да предложи производителност между Кабо Верде, което има 10 GCN изчислителни единици, и Питкерн, което има 20 GCN единици. Тези два графични процесора, пуснати през 2012 г., се различават един от друг почти точно наполовина, така че между тях имаше доста голяма разлика в производителността, която Bonaire сега запълни.

Диаграмата показва графичния процесор под формата на Radeon HD 7790, което е цялостно решение без изрязване на блокове. Чипът включва 14 изчислителни единици от архитектурата GCN, което съответства на 896 поточни процесора. Тъй като всеки GCN има 4 текстурни единици, общият брой на TMU за новия модел е 56 TMU. Тоест, Bonaire е точно 1,4 пъти по-бърз от чипа на Кабо Верде по отношение на скоростта на математически изчисления и извличане на текстури, при условие че честотата е еднаква.

Но броят на ROP единиците и контролерите на паметта в Bonaire и Radeon HD 7790 е подобен на това, което видяхме в Кабо Верде и Radeon HD 7770 - беше решено да оставим 16 ROP единици, а шината на паметта на новия чип е 128-битова , събран от два 64-битови канала. Малкият брой ROP може да бъде „ахилесовата пета“ на решението, тъй като използването на бърза GDDR5 памет направи възможно осигуряването на относително висока пропускателна способност от 96 GB / s, но нищо не може да се направи за производителността на ROP.

Но в новия GPU има подобрения в геометричната производителност и скоростта на теселация. Да, Кабо Верде също има теселатор от 9-то поколение, но Bonaire също удвои броя на геометричните блокове, растеризаторите и командните процесори (показани като ACE на диаграмата) - сега има два от тях. Това подобрение дава на Bonaire способността да обработва до два геометрични примитиви на часовник - точно като по-мощните Pitcairn и Tahiti.

Както си спомняте, именно в Radeon HD 7770 AMD за първи път взе важния психологически праг на тактовата честота на GPU, равен на 1 GHz. И така, HD 7790 също има точно същата референтна честота от 1 GHz, така че увеличението на производителността в сравнение с HD 7770 ще бъде оправдано единствено от архитектурни промени и увеличаване на броя на изпълнителните единици.

Но честотата на видео паметта на новостта е много по-висока. Ако HD 7770 имаше сравнително ниска честота на паметта от 4,5 GHz, тогава HD 7790 е оборудван с бърза GDDR5 памет, работеща на 6 GHz, което осигурява една трета повече честотна лента. Увеличението с 33% на честотната лента на видео паметта в сравнение с подфамилията Radeon HD 7700 доведе до ясно увеличение на производителността при игри. AMD предоставя тази диаграма, сравнявайки кадровите честоти на HD 7790 с памет, работеща на 4,5 и 6,0 GHz:

Максималното ускоряване от увеличаването на честотната лента на паметта беше постигнато в игри като StarCraft II и Crysis 2. И средно 33% увеличение на честотната лента на паметта дава някъде около 10% увеличение на средната честота на кадрите в набор от съвременни игри. Не е лош показател, показващ, че честотната лента на паметта е доста важна в наше време, въпреки че не е единственият акцент върху производителността. Въпреки че е напълно възможно с повече ROP скоростта на Bonaire да е още по-висока...

Ясно е, че средната консумация на енергия се е увеличила леко в сравнение с HD 7770. Ако за стария модел тази стойност е 80 W, то за HD 7790 е 85 W - това е много малка цена за теоретично увеличение на производителността от 33-40%! Архитектурни подобрения (PowerTune), дизайн на нов графичен процесор въз основа на опита от предишни, както и непрекъснатото подобряване на техническия процес в TSMC - всичко това доведе до леко увеличение на потреблението със значително подобрение на скоростните характеристики.

Що се отнася до площта на чипа и броя на транзисторите в Bonaire, новият чип е очевидно по-голям от Кабо Верде, но добавянето на изчислителни, текстурни и геометрични единици не може да остане незабелязано. Според тези параметри Бонер също се намира приблизително по средата между Кабо Верде и Питкерн. Bonaire съдържа 2,08 милиарда транзистора в 160 mm 2 чип, за Кабо Верде тези цифри са съответно 1,5 милиарда и 123 mm 2, а за Pitcairn - 2,8 милиарда транзистора и 212 mm 2 площ на чипа.

Естествено, новият чип поддържа всички технологии на AMD, които са въведени и подобрени в новото семейство Radeon HD 7000 (техният непълен списък: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, подобрения на качеството на филтриране на текстури и т.н.), и двете всички тези е описано подробно в статията AMD Radeon HD 7970: Нов еднопроцесорен лидер. Моделът HD 7790 поддържа всички функции, изброени там, включително AMD Eyefinity 2.0 с шест монитора и стерео изобразяване, а също така има подобрен блок за декодиране и кодиране на видео.

Подобрена технология PowerTune

През 2010 г. AMD представи технологията PowerTune в своя чип Cayman (серия AMD Radeon HD 6900). Този GPU беше първият, който включваше динамично управление на захранването, наречено PowerTune. Това ни позволи да увеличим максималните тактови честоти за типични приложения, като същевременно избягваме твърде много консумация на енергия при специализирани тестове за стабилност като FurMark. След това технологията беше приложена към двучиповия модел AMD Radeon HD 6990, който имаше още по-голяма нужда от нея по обясними причини.

Технологията получи голяма актуализация в средата на 2012 г., когато към AMD PowerTune беше добавено автоматично повишаване на честотата - Boost. В AMD Radeon HD 7970 GHz Edition този алгоритъм позволи още повече подобрения на производителността в сравнение с обикновена версиявидео карти. Алгоритъмът за работа на PowerTune във видеокарти без автоматичен овърклок използва три състояния: неактивен (неактивен), режим на леко натоварване (ниско 3D) и пълна скорост. В HD 7970 GHz към тях беше добавен режимът за овърклок Boost. PowerTune служи за поддържане на необходимата консумация чрез превключване към режим на по-ниско натоварване, когато е необходимо. В този случай технологията рязко намалява стойностите на тактовата честота. На практика подобни скокове са рядкост - поради голямата разлика между двата активни режима.

Намаляването на тактовата честота на GPU намалява консумацията на енергия, но трябва да намалите напрежението за по-добър контрол. Точно това прави Radeon HD 7790. Новият графичен чип Bonaire има осем състояния с различни настройки на честотата и напрежението, което позволява по-високи тактови честоти от преди, като същевременно гарантира, че GPU винаги работи при оптимално напрежение и честота. Превключването между състояния се основава на натоварването на GPU, както и на текущата консумация на енергия на GPU.

В новия алгоритъм PowerTune не трябва рязко да пада честотата при превишаване на нивото на консумация, а заедно с честотата намалява и напрежението. Преходите между състоянията трябва да бъдат възможно най-бързи, за да не се превиши лимитът на потребление дори за кратко време, така че Bonaire превключва състоянията на PowerTune на всеки 10 ms, т.е. във всяка секунда състоянието на чипа се променя 100 пъти.

При такава постоянна промяна в честотите приложенията на трети страни като MSI Afterburner и GPU-Z няма да показват моментни тактови честоти, а средни стойности за период от време - така наречената "ефективна" честота. Друга интересна иновация е, че AMD отваря нови настройки на PowerTune приложения на трети страни. Партньорите могат също да задават свои собствени настройки на PowerTune, за да помогнат при създаването на фабрично овърклокнати графични карти и да предоставят повече функции извън референтните стойности на AMD. Истина, различни настройки PowerTune може да доведе до факта, че видеокарти от един и същи модел от различни производители не само ще имат различни тактови честоти, но и алгоритъма за промяната им във времето, което затруднява сравнението при едни и същи условия.

Продажбите на видеокарти от модела Radeon HD 7790 започнаха на пазара в самото начало на април 2013 г. AMD, заедно със своите партньори, организира пускането на двете дънни платки с референтни честоти и фабрично овърклокнати решения. И сега и двамата производители пускат нови видеокарти на пазара почти по един и същ начин, с различни опции, бързо достъпни от техните партньори. Всъщност партньорите пуснаха почти повече овърклокнати версии на HD 7790 от конвенционалните, а графичните чипове в тях работят на честоти от около 1075 MHz.

Детайли: Модел Radeon HD 7990

  • Кодово име "Малта"
  • Технология на производство: 28 nm
  • 2 чипа с по 4,3 милиарда транзистора всеки
  • Унифицирана архитектура с масив от общи процесори за поточно обработване на множество типове данни: върхове, пиксели и други.
  • Хардуерна поддръжка за DirectX 11.1, включително шейдър модел Shader Model 5.0
  • Двойна 384-битова шина на паметта: два пъти шест 64-битови широки контролери с поддръжка на GDDR5 памет
  • GPU честота: 1000 MHz
  • Два пъти 32 GCN изчислителни единици, включително 128 SIMD ядра, състоящи се от общо 4096 ALU с плаваща запетая (целочислени и плаващи формати, поддръжка за FP32 и FP64 точност в рамките на стандарта IEEE 754)
  • 2x128 текстурни единици, с поддръжка на трилинейно и анизотропно филтриране за всички текстурни формати
  • 2x32 ROPs с поддръжка на режими на антиалиасинг с възможност за програмируемо семплиране на повече от 16 семплиране на пиксел, включително с FP16 или FP32 framebuffer формат. Пикова производителност до 64 проби за такт и в безцветен режим (само Z) - 256 проби за такт
  • Интегрирана поддръжка за до шест монитора чрез HDMI 1.4a и DisplayPort 1.2

Radeon HD 7990 Графични спецификации

  • Честота на ядрото: 1000 MHz
  • Брой универсални процесори: 4096
  • Брой текстурни единици: 2x128, смесващи единици: 2x32
  • Ефективна честота на паметта: 6000 MHz (4×1500 MHz)
  • Тип памет: GDDR5
  • Капацитет на паметта: 2x3 гигабайта
  • Честотна лента на паметта: 2x288 гигабайта в секунда
  • Теоретична максимална скорост на запълване: 64 гигапиксела в секунда.
  • Теоретична честота на дискретизация на текстурата: 256 гигатексела в секунда.
  • Един CrossFire конектор
  • PCI Express 3.0 шина
  • Конектори: DVI Dual Link, четири Mini-DisplayPort 1.2
  • Консумирана мощност до 375 W
  • Два 8-пинови конектора за спомагателно захранване
  • Дизайн с двоен слот
  • Препоръчителната цена за Русия е 32 999 рубли. (за САЩ - $999).

Вече във второто поколение видеокарти на AMD принципът на именуване на моделите с два чипа остава непроменен. Най-доброто решение, базирано на два най-мощни видеочипа, се различава от съответния клас на модела от предишното поколение с първата цифра в индекса: вместо 6, той получи числото 7, което показва нова серия. Обявената видеокарта се различава от едночиповото решение с третата цифра, което показва максималната производителност в рамките на поколението.

Що се отнася до сравнението с конкурентите, за анонсирания днес модел Radeon HD 7990 основният съперник е видеокартата GeForce GTX 690, пусната преди почти година, и именно тези двучипови решения ще трябва да се борят помежду си. Вярно, NVIDIA има и едно по-мощно решение, но вече базирано на един GPU - GeForce GTX Titan, което също може да се счита за конкурент на въпросната платка на AMD.

Новата двучипова видеокарта Radeon е оборудвана с GDDR5 памет с капацитет от 3 гигабайта на GPU, което се дължи на 384-битовата шина на паметта на чиповете Tahiti. Такъв обем е напълно оправдан за продукт от такова високо ниво, тъй като в някои съвременни приложения за игри с максимални настройки, активиран anti-aliasing и високи разделителни способности, по-малко количество памет (2 гигабайта на чип или по-малко) може вече да не е достатъчно. И в още по-голяма степен това се отнася за изобразяване в стерео режим или на множество монитори в режим Eyefinity.

Ясно е, че такава мощна графична карта с два чипа има масивна система за охлаждане с два слота, която е различна от традиционните охладители за карти на AMD. Той разполага с масивен радиатор, скрит под кожух с три големи вентилатора, работещи на относително ниски скорости. Консумацията на енергия на dual-GPU картата е доста висока по обясними причини и има два 8-пинови захранващи конектора, но поне не са три, както беше при нереферентните образци, базирани на два чипа Tahiti.

Архитектура

Тъй като видеокартата с кодово име „Malta“ е базирана на два графични процесора „Tahiti“ от семейството на Южните острови, можете просто да се обърнете към това, което подробно описва всички характеристики на текущата архитектура Graphics Core Next (GCN). В базовите материали повтаряме само най-важните характеристики и характеристики на конкретни продукти.

Основният блок на архитектурата е блокът GCN, от който са събрани всички графични процесори от серията. Изчислителната единица е разделена на подсекции, всяка от които работи със собствен поток от команди, има специално локално хранилище за данни, кеш памет от първо ниво с възможност за четене и запис и пълноценен конвейер за текстури с единици за вземане на проби и филтриране. Всеки от GCN блоковете е способен да планира и разпределя команди сам, а един изчислителен блок може да изпълнява няколко независими командни потока. Radeon HD 7990 използва два чипа Tahiti, които вече са ни известни:

Диаграмата на графичния процесор (има две от тях в Radeon HD 7990) показва 32 изчислителни единици на архитектурата GCN и всички те са активни. По-рано се предполагаше, че за решение с два чипа някои от тях ще трябва да бъдат изключени и дори да се намали честотата, за да се влезе в консумацията на енергия от 375 W, но инженерите на AMD успяха успешно да решат тази трудна задача. Може би е пусната специална нова ревизия на Tahiti с по-ниска консумация на енергия или чиповете просто преминават много строг подбор.

Тъй като всяка GCN единица има 16 текстурни единици, броят на TMU е 128 единици на чип, което дава обща производителност от 256 гигатексела в секунда, което е много добро за конкурент на GeForce GTX 690. Броят на ROP единиците и контролерите на паметта в HD 7990 също не се промени в сравнение с едночиповия си аналог, те бяха оставени съответно в размер на 32 и 6 броя на GPU. Radeon HD 7990 има двойна 384-битова шина на паметта, съставена от дванадесет 64-битови канала за обща честотна лента на паметта от 576 GB/s, още един рекорд.

Иначе новата платка поддържа всичко модерни технологииот AMD, които бяха въведени и подобрени в новите видео чипове от линията Radeon HD 7000: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, подобрено качество на филтриране на текстури и др. Всичко това е описано подробно по-горе в описанието на Radeon HD 7970 и просто няма смисъл да го повтаряме.

Охладителна система и консумация на енергия

В случай на такива сериозни двучипови платки, високоефективната система за охлаждане става особено важна. Ако в случай на решения от партньори, базирани на две Tahiti, бяха използвани решения с три слота, а в случая на ASUS ARES II дори водно охлаждане, в този случай беше необходимо да се мине с по-малко мощност, така че беше проектиран охладител, който има много масивен радиатор и три вентилатора с подобрени акустични характеристики.

Шумът на охладителната система и предоставената температура за GPU са едни от най-важните потребителски характеристики за всяка видеокарта, включително и за топ решението, предназначено за ентусиасти. Твърде шумната или неефективна охладителна система ще се счита от купувачите за по-малко изгодна покупка, при (приблизително) равни други условия. Така че AMD взе този проблем много сериозно с Radeon HD 7990 в сравнение с други топ решения на пазара. Помислете за акустичните характеристики на новата система:

Диаграмата показва нивото на шума от три различни видеокарти: Radeon HD 7990 и двама конкуренти: двучипов GeForce GTX 690 и едночипов GTX Titan от NVIDIA. Освен това шумът е измерен в различни условия - в режим на празен ход (System Idle) и при максимално натоварване с помощта на Furmark. Ако се вярва на цифрите на AMD, дори едночиповият Titan не достига до тяхната новост по отношение на по-хладния шум, да не говорим за двучиповия GTX 690, който е най-шумният в това сравнение.

Но не е ли в ущърб на температурата на графичния процесор, че е постигната такава впечатляваща акустична производителност? Следващата диаграма показва температурите на GPU, измерени на Radeon HD 7990 на AMD и същите двама конкуренти. Този път AMD използва само режим на високо натоварване при тестване във Furmark.

И отново се използва „хитра“ координатна ос с ненулев произход. Истинската разлика между 80 и 82 градуса за Radeon HD 7990 и GTX Titan ще бъде почти незабележима, въпреки че 87 градуса за GTX 690 ясно се открояват към по-лошото. Отново отбелязваме, че всички тези тестове са извършени от заинтересованата страна и подлежат на независима проверка.

По отношение на консумацията на енергия, двучиповото решение не е нищо ново, но поддръжката на предварително обявената технология ZeroCore Power също е тук. Тази технологияпомага за постигане на значително по-ниска консумация на енергия в режим на "дълбок празен ход" (или "заспиване") с изключен дисплей. В този режим неактивният графичен процесор е почти напълно деактивиран и консумира по-малко от 5% от мощността на пълния режим, като изключва повечето от функционалните блокове. А в случай на двучипова платка е още по-важно, че в системата CrossFire при изчертаване на двуизмерен интерфейс на операционната система всички графични процесори, с изключение на основния, изобщо не работят. Тоест, в случая с Radeon HD 7990, един от чиповете в 2D режим ще бъде потопен в дълбок сън с минимална консумация на енергия, а вторият може да „заспи“ в режим на дълбок празен режим на компютъра.

AMD Radeon HD 7850M- графична карта с поддръжка на DirectX 11, базирана на архитектурата GCN. Картата е предназначена за средни и големи лаптопи. Това е една от най-производителните видео карти за 2012 г. При производството му се използва 28 nm технологичен процес.

Адаптерите от серията Radeon 7800M са изградени на чипа на Кабо Верде, както и Radeon HD 7770за настолни компютри, с 640 1D шейдърни ядра и 40 текстурни единици. Но по отношение на тактовата честота, HD 7850M е по-нисък от HD 7870M (675 MHz до 800 MHz, съответно). Като цяло 7850M е горе-долу на същото ниво HD 7750за настолни компютри.

Очаквано, Radeon HD 7850M се превърна в конкурент на GeForce GTX 560M на NVIDIA, тъй като освен по-висока производителност показва и по-ниска консумация на енергия (като GeForce GTX 660M). Така модерните взискателни игри вървят свободно на средни и високи настройки.

7850M разполага с нов UVD3 видео декодер за декодиране на MPEG-4 AVC/H.264, VC-1, MPEG-2, Flash, Multi-View Codec (MVC) и MPEG-4 част 2 (DivX, xVid) HD видео формати .

Картите от серията 7800M също поддържат автоматично превключванемежду интегрирана и дискретна графика. Тази функция се нарича Enduro и е подобна на технологията Optimus на NVIDIA. В допълнение, HD 7850M може да поддържа до 6 монитора едновременно с помощта на технологията Eyefinity, когато Enduro е деактивиран.

Следващата функция HD 7850Mе функция ZeroCore, която автоматично намалява консумацията на енергия, когато е в режим "заспиване" с изключен дисплей. Технологията PowerTune позволява на графичната карта да се овърклокне, стига консумацията на енергия да е в приемливи граници. Например, честотата може да намалее при стартиране на FurMark и OCCT и да се увеличи в някои игри (Planet, Crysis или Resident Evil 5).

Вграденият HD аудио процесор е в състояние да доставя висококачествено аудио (формати TrueHD или DTS Master Audio) през HDMI и DisplayPort (като Blu-ray видео). В допълнение, с помощта на DDMA технологията е възможно да се изведе звук от няколко устройства едновременно.

Енергийно ниво 7850Mмного по-ниска от 7870M поради по-ниската честота на ядрото.

производител: AMD
серия: Radeon HD 7800M
Кодът: Heathrow Pro
Архитектура: GCN
Теми: 640-унифициран
Тактова честота: 675*MHz
Честота на шейдъра: 675*MHz
Честота на паметта: 1000*MHz
Ширина на шината на паметта: 128 бита
Тип памет: GDDR5
Обща памет: Не
DirectX: DirectX 11.1, Shader 5.1
Консумация на енергия: 32 W
технология: 28 nm
Размер на тетрадка: голям
Дата на излизане: 24.04.2012

* Определените тактови честоти подлежат на промяна от производителя

Серия 7800 с различни спецификации. Чипът, изграден върху микроархитектурата Graphic Core Next, заема пространство, равно на 2,8 милиарда транзистора. Както повечето карти от Radeon, тук има технология Eyefinity, която ви позволява да свържете до шест монитора едновременно. Те могат да работят независимо един от друг или да образуват един голям монитор. Всичко зависи от това какви настройки ще бъдат изложени.

Radeon 7850

Тази графична карта от серия AMD 7800 има 800 мегахерца честота на процесора. Високата производителност и честотна лента (153 гигабита в секунда) осигурява размер на шината от 256 бита. Изчислителната система обработва данни, равняващи се на 1,76 терафлопа. Изчислителните единици присъстват в количество от 16 броя, а текстурните единици - в количество от 64 броя. Има две ядра за изчислителни процеси.

Форматът на паметта съответства на маркировката GDDR5, а поддръжката на DirectX версия 11 ще помогне за ускоряване на взаимодействието с приложенията на операционната система. За по-добра оптимизацияработа на картата, е необходимо да следвате актуализациите на драйверите, тъй като само те са в състояние напълно да разкрият всички възможности на графичния процесор и да осигурят достъп до необходими настройки. Базовите драйвери, които обозначават видеокартата в системата, са включени в картата, а актуализираната версия може да се види на уебсайта на AMD.

Този графичен процесор AMD Radeon HD 7800 Series е оборудван с най-новите вградени технологии, които ви позволяват да се наслаждавате на висококачествени и гладки изображения при 60 кадъра, докато разделителната способност може да достигне до 4096 x 2160 пиксела. Същото важи и за аудио потока, който отговаря на всички съвременни изисквания, издавайки висококачествен звук.

Radeon 7870

Тази графична карта AMD Radeon HD 7800 Series е мощен наследник на предишната карта по отношение на характеристиките. Тя има цял гигахерц за работа с графичния процесор. Производителността за изчислителни операции е много по-висока, отколкото в предишната версия - 2,56 терафлопа. Има 20 изчислителни единици и 80 текстурни единици.

Тъй като това е флагманът на серията 7800, той превъзхожда брат си в много отношения. Поддръжката на технологията за теселация е въведена във видеокартите на този производител от дълго време, но в тази версия тя е доведена до границата. Сега можете да се насладите на триизмерно изображение, поразително със своя реализъм и детайлност. А подобреното анти-алиасинг ще помогне за постигане на гладка и приятна картина.

По други параметри този представител на AMD Radeon HD 7800 Series е напълно идентичен по отношение на характеристиките на предишната видеокарта. И двете карти могат да поддържат 3D технология както във видео, така и в игри. Също така е възможно да свържете няколко карти, за да увеличите производителността, но този параметър може да зависи и от възможностите на дънната платка.

Страница 2 от 5

"Южни острови"

Първо, малко за етикетирането на най-новите продукти на AMD. Производителят ги е разделил на три нива според производителността. Кодовото име "Cape Verde" се отнася за Radeon HD 7700. Името "Pitcairn" се отнася за днешните тестери Radeon HD 7870 и HD 7850.

  • Входно ниво = Кабо Верде = серия Radeon HD 7700;
  • Mainstream = Pitcairn = серия Radeon HD 7800;
  • Продукти с висока производителност = Tahiti = серия Radeon HD 7900.

Тоест към момента AMD е покрила всички пазарни сегменти със своите 28 nm графични чипове. Очаква се само пускането на двуядрена видеокарта, базирана на чипове Tahiti. Условно име Radeon HD 7990.

Характеристики на серия AMD Radeon HD 7800

Графичният процесор Radeon HD 7800 (Pitcairn) има около 2,8 милиарда транзистора и микроархитектура Graphic Core Next. Както споменахме по-горе, чипът Radeon HD 7850 (Pitcairn Pro) има 16 изчислителни блока, а максималният му TDP е 130 вата. За Radeon HD 7870 (Pitcairn XT) тези цифри са съответно 20 и 175.

Слайдът по-долу показва основните спецификации на видеокартите Radeon HD 7850 и HD 7870.

2GB GDDR5 памет вече се превръща в стандарт за повечето модели от среден и висок клас. Благодарение на 256-bit. шина и висока тактова честота от 1200 MHz (4800 MHz ефективно), честотната лента е 154 GB / s. Това ще има положителен ефект върху производителността в игри с висока резолюция и качество на картината.

PCI Express 3 интерфейс

През втората половина на 2011 г. почти всички производители на дънни платки представиха своите модели дънни платки с интерфейс PCI Express 3-то поколение. С пускането на серията Radeon HD 7000 се появиха и видеокарти с този интерфейс. PCI Express 3 има два пъти по-голяма честотна лента (32 Gb/s) от предишното поколение PCI Express. В сравнение с PCIe 2, пропускателната способност на лента е удвоена от 500 Mb/s на 1 Gb/s.

Естествено, за да се възползвате от новия PCIe 3, имате нужда не само от видеокарта и дънна платка с този интерфейс, но и от поддръжка на процесора (не всички модели от фамилията Ivy Bridge ще поддържат PCIe 3).

Eyefinity 2.0

AMD отиде по-далеч с тяхната технология Eyefinity, която е проектирана да показва изображения на множество монитори. Благодарение на високото изчислителна мощностСерия HD 7000 и поддръжка на Eyefinity 2.0, вече можете да показвате изображение на множество монитори с обща разделителна способност 16000 x 16000. Това ви позволява да показвате изображението на 5 дисплея с разделителна способност 2560x1600, зададени в пейзажна ориентация. За работа с такива резолюции на по-старите модели от семейството са инсталирани рекордните 3 GB GDDR5 (HD 7970 и HD 7950).

AT AMD драйвери Catalyst ще поддържа персонализирана резолюция от февруари. Тоест можете да зададете необходимата резолюция в зависимост от конфигурацията на дисплеите в Eyefinity. От Catalyst 12.2 има опция да настроите менюто "Старт" на дисплей, който е удобен за вас, вместо най-лявото, както беше преди. В допълнение, Eyefinity 2 поддържа стерео HD3D изход. Поддържа комбинация от три монитора, които работят в 3D режим.

Подобрена теселация

Видео карти AMD семейства Radeon HD 7000 включва теселатор от девето поколение и е получил значително подобрение на производителността при обработката на геометрията в съвременните игри. Ядрото на GCN все още включва две графични машини, но ако преди са съдържали блокове за теселиране и растеризация, сега те се състоят от произволен брой конвейери, предназначени да обработват геометрия и пиксели.

Поддръжка на графични карти AMD Radeon HD 7800 HDMI интерфейс 1.4a, което ви позволява да показвате картина от 120 Hz (60 Hz за всяко око), което ви позволява да показвате 3D изображение. При по-ранните версии на HDMI това не беше възможно. От декември AMD активира HD3D и Eyefinity да работят заедно в техните драйвери.

DirectX 11.1

Видеокартите от семейството Radeon 7000 ще поддържат предстоящия DirectX 11.1. Какво ще даде това на практика е твърде рано да се каже, тъй като DX 11.1 ще бъде пуснат заедно с Windows 8. Основните предимства на новия API са посочени, както следва:

  • Самостоятелна растеризация;
  • Гъвкава комбинация от графични изчисления и обработка на видео;
  • Поддръжка на Native Stereo 3D.

AMD Unified Video Decoder

Това е хардуерна част от AMD GPU, отговорна за декодирането на видео поток. В серията Radeon 7000 UVF получи някои подобрения. Като цяло UVD запази всички характеристики на своите предшественици, а именно поддръжка за H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV профил D, Multi-View Codec (MVC), Video Codec Engine (VCE), AMD Steady Video 2.0. Добавена е поддръжка за формат Dual Stream HD+HD.

10 март 2016 г

На тази страница по-долу има връзки за изтегляне на най-новото безплатно Драйвери за графична карта amdот серията Radeon HD 7800, която е част от семейството на Radeon HD Series. Инсталационните файлове са взети от официалния сайт и са подходящи за: Windows 7, 10, 8, 8.1, XP, Vista 32/64-битов (x86/x64).

За удобство при избора на правилните файлове, версията на вашия Windows и неговата битова дълбочина („битова дълбочина“) са посочени по-долу.

Вашият компютър работи на:

  1. Изтегли (153,5 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 7 32-bit

  2. Изтегли (239,8 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 7 64-bit

  3. Изтегли (134,8 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 10 32-bit

  4. Изтегли (208,24 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 10 64-bit

  5. Изтегли (205 MB / версия 14.4 (Catalyst Software Suite) / дата на издаване 25.04.2014 г.)

    За Windows 8 32-bit

  6. Изтегли (260 MB / версия 14.4 (Catalyst Software Suite) / дата на издаване 25.04.2014 г.)

    За Windows 8 64-bit

  7. Изтегли (154,21 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 8.1 32-bit

  8. Изтегли (239,88 MB / версия 16.8.2 (Crimson Edition 16.8.2 Hotfix) / дата на издаване 08/12/2016)

    За Windows 8.1 64-bit

  9. Изтегли (179 MB / версия 14.4 (Catalyst Software Suite) / дата на издаване 25.04.2014 г.)

    За Windows XP 32 и 64 бита

  10. Изтегли (151 MB / версия 13.12 (Catalyst Software Suite) / дата на издаване 18.12.2013 г.)

    За Windows Vista 32-битов

  11. Изтегли (209 MB / версия 13.12 (Catalyst Software Suite) / дата на издаване 18.12.2013 г.)

    За Windows Vista 64-bit

Резервен вариант - Получаване на драйвери чрез автоматично откриване на AMD драйвери

Тази опцияудобно, тъй като програмата AMD Driver Autodetect автоматично ще избере и изтегли най-новите работещи драйвери, които са подходящи за вашата графична карта AMD и за вашата версия на Windows. Програмата не се нуждае от инсталиране, тя е създадена от AMD и файловете се изтеглят от техните официални сървъри.

Инструкция:

  1. Стартирайте AMD Driver Autodetect и той незабавно автоматично ще избере необходимите файлове за инсталиране на драйвери.
  2. За да изтеглите файлове, щракнете върху бутона "Изтегли сега".
  3. Изчакайте файловете да се изтеглят и започнете инсталацията.