Strona 2 z 5

„Wyspy południowe”

Najpierw trochę o etykietowaniu najnowszych produktów AMD. Producent podzielił je na trzy poziomy według wydajności. Nazwa kodowa „Wyspy Zielonego Przylądka” nawiązuje do Radeona HD 7700. Nazwa „Pitcairn” kryje w sobie dzisiejszych uczestników Testy Radeon HD 7870 i HD 7850. Produkty o wysokiej wydajności nazywane są „Tahiti” lub Radeon HD 7900. Poniżej pokazano to wyraźniej.

  • Poziom podstawowy = Republika Zielonego Przylądka = seria Radeon HD 7700;
  • Mainstream = Pitcairn = seria Radeon HD 7800;
  • Produkty o wysokiej wydajności = Tahiti = Seria Radeon HD 7900.

Oznacza to, że w tej chwili AMD objęło wszystkie segmenty rynku swoimi chipami graficznymi 28 nm. Spodziewane jest tylko wydanie dwurdzeniowej karty graficznej opartej na chipach Tahiti. Wstępna nazwa Radeon HD 7990.

Funkcje serii AMD Radeon HD 7800

Procesor graficzny Radeon HD 7800 (Pitcairn) ma około 2,8 miliarda tranzystorów i mikroarchitekturę Graphic Core Next. Jak wspomniano powyżej, chip Radeon HD 7850 (Pitcairn Pro) ma 16 jednostek obliczeniowych, a jego maksymalny TDP wynosi 130 watów. W przypadku Radeona HD 7870 (Pitcairn XT) liczby te wynoszą odpowiednio 20 i 175.

Poniższy slajd pokazuje główne specyfikacje kart graficznych Radeon HD 7850 i HD 7870.

2 GB pamięci GDDR5 staje się już standardem dla większości modeli średniej i wyższej klasy. Dzięki 256-bitowi. magistrali i wysokim taktowaniu 1200 MHz (efektywnie 4800 MHz), przepustowość wynosi 154 GB/s. Wpłynie to pozytywnie na wydajność w grach o wysokiej rozdzielczości i jakości obrazu.

Interfejs PCI Express 3

W drugiej połowie 2011 roku prawie wszyscy producenci płyt głównych zaprezentowali swoje modele płyt głównych z interfejsem PCI Express trzeciej generacji. Wraz z premierą serii Radeon HD 7000 pojawiły się również karty graficzne z tym interfejsem. PCI Express 3 ma dwukrotnie większą przepustowość (32 Gb/s) niż PCI Express poprzedniej generacji. W porównaniu z PCIe 2 przepustowość na linię została podwojona z 500 Mb/s do 1 Gb/s.

Oczywiście, aby skorzystać z nowego PCIe 3, musisz mieć nie tylko kartę graficzną i płyta główna z tym interfejsem, ale także wsparciem z procesora (nie wszystkie modele z rodziny Ivy Bridge będą obsługiwać PCIe 3).

Eyefinity 2.0

AMD poszło dalej dzięki technologii Eyefinity, która jest przeznaczona do wyświetlania obrazów na wielu monitorach. Dzięki dużej mocy obliczeniowej serii HD 7000 i obsłudze Eyefinity 2.0 możliwe jest teraz wyświetlanie obrazu na wielu monitorach o łącznej rozdzielczości 16000 x 16000. Pozwala to wyświetlać obraz na 5 wyświetlaczach o rozdzielczości 2560x1600 w orientacji poziomej. Aby pracować z takimi rozdzielczościami, w starszych modelach rodziny zainstalowany jest rekord 3 GB GDDR5 (HD 7970 i HD 7950).

Sterowniki AMD Catalyst będą obsługiwać niestandardową rozdzielczość od lutego. Oznacza to, że możesz ustawić wymaganą rozdzielczość w zależności od konfiguracji wyświetlaczy w Eyefinity. Od Catalyst 12.2 istnieje możliwość ustawienia menu Start na wygodny dla Ciebie wyświetlacz, a nie skrajnie lewy, jak kiedyś. Ponadto Eyefinity 2 obsługuje stereofoniczne wyjście HD3D. Obsługuje połączenie trzech monitorów pracujących w trybie 3D.

Ulepszona teselacja

Karty graficzne AMD Radeon HD 7000 są wyposażone w tesellator dziewiątej generacji i odnotowały znaczną poprawę wydajności przetwarzania geometrii w dzisiejszych grach. Rdzeń GCN nadal zawiera dwa silniki graficzne, ale jeśli wcześniej zawierały bloki teselacji i rasteryzacji, teraz składają się z dowolnej liczby potoków zaprojektowanych do przetwarzania geometrii i pikseli.

Karty graficzne AMD Radeon HD 7800 obsługują interfejs HDMI 1.4a, który umożliwia wyświetlanie obrazu o częstotliwości 120 Hz (60 Hz na każde oko), co pozwala na wyświetlanie obrazu 3D. W przypadku wcześniejszych wersji HDMI nie było to możliwe. Od grudnia AMD umożliwiło współpracę HD3D i Eyefinity w swoich sterownikach.

DirectX 11.1

Karty graficzne z rodziny Radeon 7000 będą obsługiwać nadchodzący DirectX 11.1. To, co da to w praktyce, jest zbyt wcześnie, aby powiedzieć, ponieważ DX 11.1 zostanie wydany wraz z Windows 8. Główne zalety nowego API są wskazane w następujący sposób:

  • Niezależna rasteryzacja;
  • Elastyczne połączenie obliczeń graficznych i przetwarzania wideo;
  • Natywna obsługa stereo 3D.

Zunifikowany dekoder wideo AMD

Reprezentuje sprzęt GPU AMD, która odpowiada za dekodowanie strumienia wideo. W serii Radeon 7000 UVF otrzymał pewne ulepszenia. Ogólnie rzecz biorąc, UVD zachowało wszystkie cechy swoich poprzedników, a mianowicie obsługę H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV profil D, Multi-View Codec (MVC), Video Codec Engine (VCE), AMD Steady Video 2.0. Dodano obsługę formatu Dual Stream HD+HD.

Problemy podczas rejestracji w serwisie? KLIKNIJ TUTAJ ! Nie omijaj bardzo ciekawej sekcji naszej strony - projektów odwiedzających. Tam zawsze znajdziesz najnowsze wiadomości, dowcipy, prognozę pogody (w gazecie ADSL), programy telewizyjne na antenie i ADSL-TV, najnowsze i najciekawsze wiadomości ze świata zaawansowanych technologii, najbardziej oryginalne i niesamowite zdjęcia z internetu, duże archiwum czasopism z ostatnich lat, apetyczne przepisy na zdjęciach, pouczające. Sekcja jest aktualizowana codziennie. Zawsze aktualne wersje najlepszych darmowych programów do codziennego użytku w sekcji Niezbędne programy. Jest prawie wszystko, co jest potrzebne do codziennej pracy. Zacznij stopniowo porzucać pirackie wersje na rzecz wygodniejszych i bardziej funkcjonalnych darmowych odpowiedników. Jeśli nadal nie korzystasz z naszego czatu, zdecydowanie zalecamy zapoznanie się z nim. Znajdziesz tam wielu nowych przyjaciół. Jest to również najszybszy i najskuteczniejszy sposób kontaktu z administratorami projektów. Sekcja Aktualizacje antywirusowe nadal działa - zawsze aktualne bezpłatne aktualizacje dla Dr Web i NOD. Nie miałeś czasu, żeby coś przeczytać? Pełną treść tickera można znaleźć pod tym linkiem.

Recenzja karty graficznej AMD Radeon HD 7870. Niedroga alternatywa dla flagowców

Niedawno opowiedzieliśmy wam o najlepszych kartach graficznych z nowej siedmiotysięcznej linii kart graficznych AMD - Radeon HD 7970 i Radeon HD 7950. Ale, jak wiecie, nie odniesiecie sukcesu z samymi szczytami. Dlatego nadszedł czas, aby porozmawiać o serii AMD Radeon 7800 - tańszej, ale wciąż produktywnej linii.

Wstęp. Szacowany koszt

Karta graficzna AMD Radeon HD 7870 powinna być sprzedawana w sklepach w cenie od 350 USD (w naszym przypadku należy ją przeliczyć na ruble po kursie Banku Centralnego). Sugerowana cena „młodszego brata”, AMD Radeona HD 7850, to 250 USD. Należy rozumieć, że w Rosji cena zawsze będzie nieco wyższa (według price.ru, około Zapytanie o wycenę: AMD Radeon HD 7870 0903 3 za 7870 i okolice Zapytanie o wycenę: AMD Radeon HD 7850 0903 3 dla 7850). Tak więc, zakładając, że kupię jedną z tych kart graficznych, spodziewałbym się, że za każdym razem wydam około 50-80 USD więcej. Ale nawet jeśli nie weźmiesz pod uwagę marż na rynku rosyjskim, koszt każdej z kart wideo jest bardzo wysoki, a za takie pieniądze kupujący będą liczyć na bardzo wysoką wydajność. Przekonajmy się, co otrzymujemy kupując jedną z tych kart.

Architektura serii 7800

Podlinia 7800 jest oparta na nowym GPU o nazwie kodowej Pitcairn.

Ten procesor graficzny ma bardzo atrakcyjny stosunek ceny do wydajności. Dla większości nabywców karty graficznej z linii 7900 jej wydajność będzie nadmierna i nie każdy chce przepłacać więcej pieniędzy jeśli nie widzą różnicy. Z kolei karty graficzne HD 7700 mogą okazać się za słabe do wygodnej rozgrywki na maksymalnych ustawieniach w popularnej rozdzielczości 1920x1080.

To trochę jak historia karty graficznej AMD Radeon HD 5850.

Pamiętasz ten? Pomimo tego, że nie dało się go przekształcić w HD 5870 poprzez zwykłe flashowanie BIOS-u, zdobył on sympatię kupujących dzięki optymalnym parametrom, które pozwoliły na uruchamianie nowoczesnych gier na maksymalnych ustawieniach przy zachowaniu odpowiedniej ceny. Obecna generacja kart wideo HD 7800 może dobrze wypełnić tę niszę.

Nowy procesor graficzny zawiera 20 jednostek obliczeniowych GCN (Graphic Core Next). Przypomnijmy, że w GPU Tahiti, wyposażonym w najwyższej klasy kartę graficzną Radeon HD 7970, było ich 32. Każda jednostka obliczeniowa zawiera cztery jednostki wektorowe, a każda jednostka wektorowa ma z kolei 16 skalarów.

Tym samym łączna liczba modułów obliczeniowych w nowym GPU wynosi 1280 sztuk. Liczba jednostek rasteryzacji (ROP) nie uległa zmianie i pozostaje równa 32. Częstotliwość zegara GPU wynosi 1000 MHz. Ilość pamięci wideo to 2048 MB GDDR5. Częstotliwość taktowania 1200 (4800 efektywnych) MHz. Magistrala pamięci 256 bitów. Wszystkie te cechy dotyczą starszej karty graficznej z podserii — HD 7870.

Młodszy brat Radeona HD 7850 jest wyposażony w ten sam procesor graficzny, tylko nieznacznie przycięty. Jednostki obliczeniowe zostały obcięte, ich liczba została zmniejszona do 16. Tym samym karta graficzna junior ma na pokładzie tylko 1024 modułów obliczeniowych, tj. dokładnie połowa ich liczby w GPU Tahiti. W związku z tym jest również mniej jednostek przetwarzających tekstury, pozostało ich 64. Częstotliwość zegara GPU wynosi 860 MHz. Pozostałe parametry pozostały niezmienione (w stosunku do Radeona HD 7870).

Tak więc, jak wspomniano powyżej, procesor graficzny Pitcairn jest oparty na architekturze Graphics Core Next (GCN). Oznacza to, że odziedziczył wszystkie rozwiązania z Tahiti (seria 7900). Nowy procesor graficzny jest zbudowany w procesie 28 nm. Karta graficzna jest wyposażona w PCI-E 3.0 (Gen3). Energooszczędne technologie AMD PowerTune i AMD ZeroCore Power również nie zniknęły. Technologia AMD Eyefinity 2.0 pozwoli nam połączyć wiele wyświetlaczy o maksymalnej ogólnej rozdzielczości 16384x16384. Obsługa 3D jest obecna i zaimplementowana przez technologię AMD HD3D. AMD kontynuuje również rozwój technologii zwiększania wydajności całego systemu przy użyciu procesorów graficznych. W tym przypadku proponujemy użycie technologii Video Codec Engine (VCE), która przyspiesza kodowanie wideo przez sprzęt karty graficznej, w ten sposób znacznie wspomagając centralny procesor i zmniejszając ilość czasu potrzebnego do przetwarzania danych.

Powyższy slajd potwierdza, że ​​GPU Pitcairn całkowicie odziedziczył wszystkie zalety swoich starszych braci. Co więcej, linia 7700 również nie jest pozbawiona funkcji, ale o tym w kolejnym artykule.

Sądząc po slajdach AMD, nowe karty graficzne mają skromny apetyt. Starszy HD 7870 zużywa nie więcej niż 175 watów obciążenia. TDP młodszej karty HD 7850 wynosi 130 watów. Gdy wyświetlacz jest wyłączony w trybie bezczynności, karty graficzne zużywają mniej niż trzy waty.

Wykresy na slajdzie wyglądają przekonująco. AMD obiecuje prawie dwukrotny wzrost wydajności. Nie jest to jednak zbyt zaskakujące: tryb CrossFireX zawsze dobrze się skalował. Kierowcy odgrywają tutaj ogromną rolę. Cieszę się, że przynajmniej tutaj wszystko jest w porządku. W tym celu przechodzimy do badania struktury kart wideo.

AMD Radeon HD 7870

Jak zwykle zaczniemy od zbadania wyglądu zewnętrznego, następnie przejdziemy do demontażu układu chłodzenia i nauki płytka drukowana i elementy na nim.

Wygląd karty graficznej jest absolutnie tradycyjny i rozpoznawalny. Jak można się domyślić, w laboratorium otrzymaliśmy referencyjną próbkę inżynieryjną. Długość deski wynosi 245 mm. Na razie o układzie chłodzenia można powiedzieć tylko jedno: gorące powietrze jest wydmuchiwane z obudowy za pomocą turbiny. Widać również, że zniknął przełącznik między układami BIOS. W rzeczywistości, patrząc w przyszłość, powiem, że zniknął również drugi układ BIOS. Od tej chwili podczas flashowania karty graficznej istnieje pewne ryzyko, że nie zostanie ona ponownie uruchomiona. Większość pomyśli, że to minus. Jednak jak często flashujesz karty wideo? Zwłaszcza jeśli rdzenie nie zostaną odblokowane w tym samym czasie? Cóż, nie sądzę, że to często. A dla większości użytkowników jest to plus, ponieważ brak takiej funkcji prowadzi do obniżenia kosztów produktu.

Możesz także zobaczyć tylko jedno złącze CrossFireX. Oznacza to, że możemy połączyć tylko dwie karty graficzne w tandemie. Sytuacja jest podobna do tej, którą omówiliśmy powyżej z chipem i przełącznikiem BIOS. Ilu użytkowników pakuje co najmniej trzy karty wideo? Myślę, że tacy ludzie stanowią absolutną mniejszość, zwłaszcza wśród tych, którzy nie korzystają z najlepszych kart wideo z najwyższej półki. Jednocześnie jego brak ponownie obniża ostateczny koszt produktu.

Na odwrocie nie ma nic godnego uwagi i ruszamy dalej.

Pod kratką do wydmuchiwania gorącego powietrza z obudowy, w zwykłym miejscu, znajdują się cztery wyjścia wideo - jedno DVI, jedno HDMI i dwa miniDP.

Karta graficzna wyposażona jest w dwa dodatkowe złącza zasilania. Może to pomóc w przetaktowaniu poprzez zwiększenie napięcia przyłożonego do GPU. W takich momentach zużycie energii dramatycznie wzrasta.

Dla lepszej wymiany ciepła, miejsce styku radiatora z GPU i sąsiadującym obszarem wykonano z miedzi. W odprowadzaniu ciepła pomagają trzy miedziane rurki cieplne.

Jeśli ktoś pamięta, jak wygląda płytka referencyjnego HD 6870, to zrozumie mnie w poczuciu, że już ją gdzieś widziałem. Rzeczywiście, w referencji HD 6970 zastosowano płytkę o bardzo podobnym rozmieszczeniu elementów.

W centrum płytki znajduje się sam GPU Pitcairn XT, obrócony o 45 stopni względem podłoża.


Wokół GPU znajduje się osiem układów pamięci wideo Hynix oznaczonych jako T2C, co oznacza, że ​​układy te mogą pracować z częstotliwościami do 5000 MHz.


Sercem podsystemu zasilania jest układ CHIL CHL 8225G. Podsystem zasilania GPU jest pięciofazowy. Zwróć uwagę na lokalizację faz zasilania.Na każdy podsystem zasilania pamięci wideo przypada jedna faza. Płytka drukowana wygląda w zamyśleniu i schludnie, nie ma wrażenia, że ​​zrobili to w ostatniej chwili „na kolanie”.

Na tym kończymy naszą znajomość z płytą Radeon HD 7870 i przechodzimy do badania Radeona HD 7850.

Radeon HD 7850

Przypomnę, że to młodszy brat karty graficznej Radeon HD 7850.

Zewnętrznie karta graficzna nie różni się niczym od swojego starszego brata.

I nie ma tu różnic, poza jedynym dodatkowym złączem zasilania. Ponieważ HD 7850 zużywa tylko 130 watów, w porównaniu do 175 watów w przypadku HD 7870, wystarczy jedno złącze sześciostykowe. Najważniejsze jest to, że nie pozostawia to śladu na potencjale podkręcania karty.

Nie ma też różnic w stosunku do HD 7850. Do dyspozycji mamy jedno DVI, jedno HDMI i dwa miniDP.

System chłodzenia nie różni się od tego z Radeona HD 7870. Oferujemy miedzianą podstawę w miejscu styku GPU z systemem chłodzenia oraz trzy miedziane rurki cieplne do wydajnego odprowadzania ciepła.

Zgodnie z oczekiwaniami, płytki obwodów drukowanych obu kart graficznych są również całkowicie identyczne. Nie obserwuje się różnic w lutowanych elementach. Jedyną różnicą jest faza „odcięcia” z podsystemu zasilania GPU. Do stabilnej pracy przy wartości nominalnej to zdecydowanie wystarczy, ale jak GPU pokaże się w przetaktowywaniu i jak stabilnie będzie to inna kwestia.


A oto serce HD 7850 - GPU AMDPitcairnPRO. Jest produkowany w Chinach i zawiera 1024 modułów obliczeniowych. Przypomnijmy: karta graficzna Radeon HD 6850 zawierała 960 modułów obliczeniowych, tj. przepaść nie jest tak duża, jeśli nie weźmie się pod uwagę nowej architektury i spojrzy się tylko na liczby.


Na płytce drukowanej tej karty przylutowanych jest 8 układów pamięci wideo o łącznej pojemności 2 GB. Gęstość jednego układu wynosi odpowiednio 256 MB. Oznaczenie nie uległo zmianie i brzmi „T2C”, co odpowiada nominalnej częstotliwości 5000 MHz. Bardzo bym chciał, żeby ten pasek został pokonany w podkręcaniu.

Alternatywne wersje Radeon HD 7800 Series

Jak zawsze większość producentów będzie chciała odejść od referencyjnych systemów chłodzenia i zaoferować coś własnego. Zobaczmy co dokładnie.

ASUS HD 7870 i HD 7850

Karty graficzne produkowane przez firmę ASUS z dobrze znanym systemem chłodzenia DirectCU II niewiele różnią się wyglądem, ale to nie jest najważniejsze. Najważniejsze jest to, że producent obiecuje wzrost wydajności nawet o 20% w porównaniu z wersją referencyjną.

Club3D HD 7870 i HD 7850

Club3D postanowił nie wychodzić daleko od zapasów. Radeon HD 7870 nie różni się niczym od referencji. Najwyraźniej młodszy brat osobiście dostał radiator do GPU z jedną rurką cieplną i wentylatorem. Jeśli jednocześnie nie ucierpiało chłodzenie pozostałych elementów, wszystko jest w porządku.

Gigabajt HD 7870 i HD 7850

Gigabyte zdecydowało się wyposażyć serię 7800 w autorskie systemy chłodzenia, a także zwiększyć częstotliwość taktowania. Karta graficzna HD 7850 jest zadowolona z systemu chłodzenia z dwoma wentylatorami, podczas gdy Radeon HD 7870 ma system chłodzenia z trzema wentylatorami. Zewnętrznie nie ma na co narzekać, poza dobrze znanym problemem z odprowadzaniem gorącego powietrza na zewnątrz obudowy.

JEGO HD 7870 i HD 7850

Firma HIS wyposażyła nowe produkty w własne systemy chłodzenia IceQ X. Te CO zawsze słynęły z dobrej wydajności. Młodsza karta graficzna miała tylko dwie rurki cieplne, podczas gdy starsza karta graficzna otrzymała wszystkie cztery.

MSI HD 7870 i HD 7850

System chłodzenia TwinFrozr III jest uważany za wysoce wydajny, ale zawsze podnosi cenę. Często zdarza się, że łatwiej jest wziąć kartę graficzną o kolejnej najwyższej wydajności. Ale nikt nie zrezygnował z zalet w postaci wysokiej wydajności i niskiego poziomu hałasu.

PowerColor HD 7870 i HD 7850

Firma PowerColor wprowadziła dwie wersje Radeona HD 7870 i jedną Radeona HD 7850. Najmłodszy HD 7850 będzie zadowolony ze standardowego układu chłodzenia, o ile wygląda. Nie jest to przerażające, ponieważ HD 7850 ma bardzo niskie zużycie energii, a zatem rozpraszanie ciepła. Dla HD 7870 przygotowywane są dwie wersje: jedna referencyjna, a druga z systemem chłodzenia PCS +.

Szafirowe HD 7870 i HD 7850

Karty graficzne produkowane przez Sapphire będą wyposażone w systemy chłodzenia bardzo podobne do autorskiego FleX. Nie ma powodu, aby wątpić w skuteczność tych CO, ponieważ przetestowaliśmy już podobne karty graficzne i nawet przy znacznie wyższych temperaturach temperatury pozostały w rozsądnych granicach.

XFXHD 7870

Firma XFX zaprezentowała w tej chwili tylko starszą kartę graficzną Radeon HD 7870. Będzie ona wyposażona w dwa wentylatory. Podobny projekt widzieliśmy już w kartach graficznych z serii 7900 tego producenta.

Tabela specyfikacji

Technologia procesu, nm

Procesory strumieniowe, szt

Jednostki rasteryzacji (ROP), szt

Częstotliwość GPU, MHz

Częstotliwość pamięci wideo, MHz

Rozmiar pamięci wideo, MB

Magistrala pamięci wideo, bit

Obsługiwana wersja DirectX

Koszt, pocierać*

Poproś o wycenę: HD 7870 0903 3

Zapytanie ofertowe: 7850 0903 3

Zapytanie ofertowe: 6970 0903 3

Zapytanie ofertowe: 7950 0903 3

*Cennik www.price.ru dla Moskwy

Podkręcanie i temperatury

Zacznijmy od najmłodszej karty graficznej, Radeona HD 7850


Nominalne częstotliwości taktowania to 860 MHz dla GPU i 1200 (4800 efektywnych) MHz dla pamięci wideo. Systemy chłodzenia w referencjach budzą zaufanie, więc możesz bezpiecznie liczyć na udane przetaktowanie.


Bez zwiększania napięcia karta graficzna została podkręcona do 1025 MHz dla GPU i 1375 (5500) MHz dla pamięci wideo. To są dobre wyniki. Prędkość wentylatora wynosiła 40%. Wyższe wartości uniemożliwiły pracę przy stoisku. Mimo to serii siedmiu tysięcy kart graficznych nie można porównać nawet z odkurzaczami, są cichsze. Oczywiście, na pierwszy rzut oka wszystko jest w porządku, karty graficzne nie są słyszalne w stanie spoczynku. Ale jeśli go rozproszysz i ręcznie odkręcisz prędkość, to wszystko, zgaś światło.


Nominalne częstotliwości dla starszej karty graficznej HD 7870 to 1000 MHz dla procesora wideo i 1200 (4800) MHz dla pamięci wideo.


Podobnie jak w przypadku młodszej karty graficznej, podkręciliśmy prędkość chłodzenia do 40%, co pomogło obniżyć temperaturę. Procesor wideo był w stanie działać stabilnie na częstotliwości 1120 MHz. Ale pamięć wideo jest bardzo zdenerwowana. Niestety nie mogła w ogóle pracować stabilnie na wyższych częstotliwościach. Najprawdopodobniej jest to szczególny przypadek i po prostu mieliśmy pecha. Prawdopodobnie jeden z układów pamięci wideo nie był w najlepszym stanie.


Temperatury pracy dwóch nowych produktów praktycznie nie różnią się od siebie w ujęciu nominalnym. Starsza karta graficzna HD 7870, zgodnie z oczekiwaniami, traci kilka stopni pod obciążeniem, jest to normalne. Podczas przetaktowywania temperatury są niższe ze względu na zwiększone prędkości chłodzenia do 40%. Jednocześnie HD 7950 okazuje się znacznie gorętszą kartą graficzną. Ale pod względem rozpraszania ciepła nikt nie może konkurować z HD 6970. Jak przystało na poprzednią generację kart graficznych, jest to najgorętsza karta wideo wśród wszystkich uczestników testu.

Zawodnicy

Aby porównać wydajność, wzięliśmy dwie karty graficzne: AMD Radeon HD 7950 i AMD Radeon HD 6970.

AMD Radeon HD 7950

Druga najpotężniejsza karta graficzna AMD jest dziś przeciwko kartom jednoukładowym. Mówiliśmy już o tej karcie graficznej. Zastanawiam się, jak nowe przedmioty będą się zachowywać na jego tle. Po stronie karty graficznej HD 7950 ilość pamięci wynosi trzy gigabajty, a liczba procesorów strumieniowych wynosi 1792 sztuk.

AMD Radeon HD 6970

Ta karta graficzna jest TOP poprzedniej generacji. Ma wysoką wydajność wystarczającą dla nowoczesnych gier. Oczywiście w rozdzielczości 2560 x 1600 nie ma nic specjalnego do złapania, ale w takich trybach mocniejsze karty graficzne też są wygięte. Ilość pamięci wideo to 2048 MB. Liczba procesorów strumieniowych to 1536 sztuk, pracują one z częstotliwością 880 MHz.

Stanowisko badawcze

  • Procesor — Intel Core i7 3960X
  • Płyta główna - ASUS P9X79 Deluxe
  • RAM – Corsair XMS3 1600MHz 9CL 4x4GB
  • Dysk twardy - Intel SSD 160 GB
  • Zasilacz - Corsair HX850W

Wyniki testu Wyniki testów AMD Radeon HD 78xx w Dirt 3





Nowa linia wykazuje dobre osiągi. W większości przypadków przetaktowany Radeon HD 7850 jest bardzo zbliżony do podstawowego Radeona HD 7870. Ten ostatni, w podkręcaniu, w większości przypadków z powodzeniem konkuruje z nominalnym Radeonem HD 7950. Wszystko jest naturalne. Wydajność HD 6970 znacznie przeskakuje od aplikacji do aplikacji. W niektórych miejscach przewyższa HD 7870, aw niektórych przegrywa z HD 7850. Ogólnie wydajność nowej linii jest bardzo przyjemna.

Wniosek

Seria AMD Radeon HD 7800 okazała się bardzo udana. Przy niższych kosztach Radeon HD 7870 w podkręcaniu często nadrabia zaległością z kartą graficzną ze starszej górnej linii - HD 7950. Pozwoli to zaoszczędzić pieniądze tym, którzy chcą uzyskać większą wydajność za mniejsze pieniądze.

Bardzo podobały mi się reżimy temperaturowe nowych kart wideo. Są naprawdę zimne. Pod obciążeniem przy częstotliwościach magazynowych HD 7870 nagrzewał się do 68 stopni, a HD 7850 do 66 stopni. To bardzo dobry wynik jak na taki występ. Staje się to bardzo zauważalne, jeśli zaczniesz porównywać wszystkie wyniki z kartą graficzną HD 6970.

Naprawdę nie podobał mi się hałas kart graficznych, jeśli ustawisz co najmniej 50% niższych obrotów na minutę. Nie wyobrażam sobie nawet, kto będzie mógł pracować w pobliżu komputera, jeśli ustawisz prędkość obrotową na więcej niż 50%.

Gdy tylko ceny zostaną ostatecznie ustalone, nowe produkty będą doskonałą inwestycją. Ten proces trwa zwykle miesiąc lub dwa. Co najważniejsze, parametr cena/wydajność nie przesunął się w kierunku wyższych cen.

Nowoczesne gry z roku na rok wymagają coraz mocniejszych kart graficznych do przetwarzania grafiki. Jednym z budżetowych rozwiązań dla graczy będzie seria AMD Radeon HD 7800. Rozważ parametry techniczne tej serii, a także jej funkcje i wydajność w grach.

Rozważ cechy serii AMD Radeon HD 7800 w formie tabeli:

Proces technologii 28 mil morskich
GPU Pitcairn
Częstotliwość (min. maks. w modelach) 800-1000 MHz
Baran Typ GDDR5
Tom 2 GB
Częstotliwość 800-1200 MHz
Pasmo 153,6 GB/s
Interfejsy Pojemność pamięci 256-bitowy
Typ opony PCI Express 3.0
Architektura GCN
Procesory strumieniowe na blok od 64 do 80
Liczba bloków od 16 do 20
Całkowite procesory strumieniowe 1024-1280
Rdzenie do obróbki geometrii 2 szt.
Rdzenie do obliczeń asynchronicznych 2 szt.
Złącza HDMI

Port wyświetlacza 1.2

Obsługiwane technologie i oprogramowanie DirectX 11 TAk
OpenGL 4.2 TAk
Eyefinity (podłączanie monitora) do 6 szt.
Zerowa moc rdzenia Tryb uśpienia
Katalizator Markowe sterowniki i ustawienie
Przyspieszenie aplikacji Poprawa jakości odtwarzania wideo
AMDHD3D Obróbka grafiki 3D
melodia mocy Dynamiczne ustawienie mocy

Linia została wyprodukowana w marcu 2012 roku. Na jej podstawie wydano następujące modele:

  • HD7850;
  • HD7870;
  • HD7890.

Asortyment nie jest już produkowany. Na początku sprzedaży średnia cena w sklepach wynosiła 249 i 349 USD.

Recenzja

W AMD, po wydaniu nowej technologii procesowej, zdecydowano się podzielić ogólną serię produkcyjną na podgrupy. Dlatego w oparciu o technologię procesu 28nm powstały 4 linie, które przedstawia tabela:


HD 7800 z procesorem graficznym „Pitcairn” wykorzystuje mikroarchitekturę Graphic Core Next. Seria została wydana w marcu 2012 roku i obecnie jest wyczerpana.

Kiedyś karty graficzne z Pitcairn były dość popularne i wykazały doskonałe połączenie ceny / jakości. Na rok 2018 obecna seria nie cieszy się popularnością i niezwykle trudno jest znaleźć urządzenie w nowym stanie. Pomimo tego, że rdzeń graficzny jest już przestarzały, w zestawie z potężnym procesorem PC może ciągnąć różne gry na średnich i wysokich ustawieniach.

Jakie gry będą działać na AMD Radeon HD 7800 Series

Karty wideo zostały wydane w 2012 roku, ale nadal można ich używać w nowoczesnych zabawkach. Testy w grach AMD Radeon HD 7800 Series zostały wykonane na następującym sprzęcie:

  • Procesor: Core I5 ​​6500 3,2 GHz.
  • RAM: 16 GB DDR4 2133 Dual.
  • Dysk twardy: Hitachi 1 TB.
  • Płyta główna: Asus H170M-Plus.
  • Rozdzielczość: 1920x1080px.

Wyniki są następujące:

Nazwa gry

Jakość grafiki
Assassin's Creed Syndicate wysokość 31
War Thunder Kino (Ultra) 55-65
Przerwa kwantowa Przeciętny 30-42
Społeczność Assassin's Creed Przeciętny 30
Wojownik Cienia 2 wysoki 35-45
Umierające światło wysoki 40-50
Fallout 4 Ultra 38-43
GTA 5 Powyżej średniej 45-50
LOS wysoki 40
wzrost Grób Bombowiec wysoki 30-40
działania wojenne wysoki 90-100
Wiedźmin 3: Krew i Wino wysoki 25-35
Świat czołgów wysoki 60-80

Ogólna wydajność w dużej mierze zależy od właściwej kombinacji procesora i karty graficznej. Jeśli weźmiesz potężny procesor obecnej generacji, taki jak Ryzen lub Core I5, będą w stanie pokazać wysoki FPS w większości nowoczesnych gier, nawet ze starą kartą graficzną.

Po przeanalizowaniu parametrów technicznych i testów w grach dochodzimy do następujących wniosków: nie zaleca się kupowania potężnych gier w 2018 roku, lepiej wybrać nowsze modele.

Spektakl wystarczy do wygodnej pracy domowej i do prowadzenia gier wieloosobowych, takich jak CS:GO, World Of Tanks.

Jak podkręcić kartę graficzną

Aby osiągnąć maksymalną wydajność, możesz przetaktować AMD Radeon HD 7800. Aby to zrobić, musisz zainstalować sterownik i go skonfigurować.

Główne zmiany należy wprowadzić w sekcji „Gry”. Jeśli używasz aktualnego sterownika, profile można konfigurować indywidualnie dla każdej gry wideo.

Przejdź do żądanego profilu do ustawienia Kontrola szybkości klatek. Domyślnie karta graficzna ściska maksymalny FPS i wydaje na nią wszystkie zasoby.

Do wygodnej rozgrywki w strzelanki wystarczy 60 klatek na sekundę. W przypadku CS:GO, WarFace, WarThunder wystarczy ustawić limit na 70 FPS.

Ustawienie OverDrive pozwala dostosować parametry pracy: częstotliwość GPU i pamięci, wydajność wentylatorów oraz poziom zużycia energii. Te ustawienia muszą być konfigurowane indywidualnie dla każdej kompilacji komputera.

Pobierz sterowniki dla AMD Radeon HD 7800 Series

Aby pobrać sterowniki dla Radeon HD 7800 Series, użyj zastrzeżonego programu do automatycznego wyszukiwania. Możesz go pobrać na oficjalnej stronie producenta. Znajdziesz tam również sterowniki dla każdej wersji systemu operacyjnego: Windows 7, Windows 10 itd.

Seria 7800 o różnych specyfikacjach. Układ zbudowany na mikroarchitekturze Graphic Core Next zajmuje przestrzeń równą 2,8 miliarda tranzystorów. Jak większość kart Radeona, nie zabrakło tu technologii Eyefinity, która pozwala na podłączenie do sześciu monitorów jednocześnie. Mogą pracować niezależnie od siebie lub mogą tworzyć jeden duży monitor. Wszystko zależy od tego, jakie ustawienia zostaną ujawnione.

Radeon 7850

Ta karta graficzna AMD 7800 Series ma częstotliwość procesora 800 megaherców. Wysoka wydajność i przepustowość (153 gigabity na sekundę) zapewnia rozmiar magistrali 256 bitów. System obliczeniowy przetwarza dane o wartości 1,76 teraflopów. Jednostki obliczeniowe występują w ilości 16 sztuk, a jednostki tekstur - w ilości 64 sztuk. Istnieją dwa rdzenie dla procesów obliczeniowych.

Format pamięci odpowiada oznaczeniu GDDR5, a obsługa DirectX w wersji 11 pomoże przyspieszyć interakcję z aplikacjami systemu operacyjnego. Aby lepiej zoptymalizować wydajność karty, musisz śledzić aktualizacje sterowników, ponieważ tylko one są w stanie w pełni odblokować wszystkie możliwości GPU i zapewnić dostęp do niezbędne ustawienia. Podstawowe sterowniki, które oznaczają kartę graficzną w systemie, są dostarczane z kartą i zaktualizowana wersja można obejrzeć na stronie AMD.

Ten procesor graficzny AMD Radeon HD 7800 Series jest wyposażony w najnowsze wbudowane technologie, które pozwalają cieszyć się wysokiej jakości i płynnym obrazem przy 60 klatkach, przy rozdzielczości do 4096 x 2160 pikseli. To samo dotyczy strumienia audio, który spełnia wszystkie współczesne wymagania, dając dźwięk wysokiej jakości.

Radeon 7870

Ta karta graficzna AMD Radeon HD 7800 Series jest potężnym następcą poprzedniej karty pod względem parametrów. Ma cały gigaherc do pracy z procesorem graficznym. Wydajność operacji obliczeniowych jest znacznie wyższa niż w poprzedniej wersji - 2,56 teraflopów. Istnieje 20 jednostek obliczeniowych i 80 jednostek tekstur.

Ponieważ jest to flagowy model serii 7800, pod wieloma względami przewyższa swojego brata. Obsługa technologii teselacji została wprowadzona do kart graficznych tego producenta od dawna, ale w tej wersji jest doprowadzona do granic możliwości. Teraz możesz cieszyć się trójwymiarowym obrazem, uderzającym realizmem i szczegółowością. A ulepszony antyaliasing pomoże uzyskać płynny i przyjemny obraz.

W innych parametrach ten przedstawiciel serii AMD Radeon HD 7800 jest całkowicie identyczny pod względem cech jak poprzednia karta graficzna. Obie karty są w stanie obsługiwać technologię 3D zarówno w wideo, jak iw grach. Możliwe jest również podłączenie kilku kart w celu zwiększenia wydajności, ale ten parametr może również zależeć od możliwości płyty głównej.

  • Nazwa kodowa chipa: „Tahiti”
  • 4,3 miliarda tranzystorów (ponad 60% więcej niż Cayman i dokładnie dwa razy więcej niż Cypress)
  • 384-bitowa magistrala pamięci: sześć 64-bitowych kontrolerów z obsługą pamięci GDDR5
  • Taktowanie rdzenia: do 925 MHz (dla Radeona HD 7970)
  • 32 jednostki obliczeniowe GCN, w tym 128 rdzeni SIMD, składające się w sumie z 2048 zmiennoprzecinkowych jednostek ALU (formaty całkowite i zmiennoprzecinkowe, obsługa precyzji FP32 i FP64 w standardzie IEEE 754)
  • 128 jednostek tekstur, z obsługą filtrowania trójliniowego i anizotropowego dla wszystkich formatów tekstur
  • 32 ROP z obsługą trybów antyaliasingu z możliwością programowanego próbkowania ponad 16 próbek na piksel, w tym w formacie bufora ramki FP16 lub FP32. Szczytowa wydajność do 32 próbek na zegar, a w trybie bezbarwnym (tylko Z) - 128 próbek na zegar
  • Zintegrowana obsługa sześciu monitorów, w tym HDMI 1.4a i DisplayPort 1.2

Dane techniczne karty graficznej Radeon HD 7970

  • Zegar rdzenia: 925 MHz
  • Liczba procesorów uniwersalnych: 2048
  • Liczba jednostek tekstury: 128, jednostki mieszania: 32
  • Efektywna częstotliwość pamięci: 5500 MHz (4×1375 MHz)
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 3 gigabajty
  • Przepustowość pamięci: 264 gigabajty na sekundę
  • teoretyczny maksymalna prędkość wypełnienia: 29,6 gigapikseli na sekundę
  • Teoretyczna częstotliwość próbkowania tekstury: 118,4 gigatekseli na sekundę
  • Dwa złącza CrossFire
  • Magistrala PCI Express 3.0
  • Pobór mocy: 3 do 250 W
  • Jedno 8-pinowe i jedno 6-pinowe złącze zasilania
  • Konstrukcja z dwoma gniazdami
  • Sugerowana cena detaliczna w USA: 549 USD

Dane techniczne karty graficznej Radeon HD 7950

  • Częstotliwość rdzenia: 800 MHz
  • Liczba procesorów uniwersalnych: 1792
  • Liczba jednostek tekstury: 112, jednostki mieszania: 32
  • Efektywna częstotliwość pamięci: 5000 MHz (4×1250 MHz)
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 3 gigabajty
  • Przepustowość pamięci: 240 gigabajtów na sekundę
  • Teoretyczna maksymalna szybkość wypełniania: 25,6 gigapikseli na sekundę.
  • Teoretyczna częstotliwość próbkowania tekstur: 89,6 gigatekseli na sekundę
  • Dwa złącza CrossFire
  • Magistrala PCI Express 3.0
  • Złącza: DVI Dual Link, HDMI 1.4, dwa Mini-DisplayPort 1.2
  • Pobór mocy: 3 do 200 W
  • Konstrukcja z dwoma gniazdami
  • Sugerowana cena detaliczna w USA: 449 USD

Uwagę zwraca wysoka złożoność nowego układu - 4,3 miliarda tranzystorów, czyli ponad połowę liczby tranzystorów w poprzednim topowym procesorze graficznym. Możliwość wykonania tak złożonego kryształu była możliwa dzięki zastosowaniu nowoczesnej 28-nanometrowej technologii procesowej, a nowy chip okazał się nawet nieznacznie mniejszy rozmiar Kajman. A jego praktyczne cechy, które wpływają na wydajność, zostały zauważalnie ulepszone: liczba jednostek ALU, TMU, magistrala pamięci. Jedynie liczba ROP nie wzrosła, a częstotliwość pamięci wideo GDDR5 pozostała na tym samym poziomie.

Zasada nazewnictwa kart graficznych firmy pozostała taka sama. Radeon HD 7970 to najbardziej produktywne rozwiązanie jednoukładowe firmy, po pewnym czasie został wydany młodszy model HD 7950, który został ogłoszony nieco później. Początkowo HD 7970 nie miał konkurentów na rynku i nie zastąpił żadnej konkretnej karty graficznej z linii AMD, a raczej przesunął ją w dół. Jeśli chodzi o porównanie z konkurentem, nVIDIA wypuściła swoje rozwiązanie 28 nm znacznie później.

Ta sama pamięć GDDR5 jest zainstalowana na nowej karcie graficznej AMD, ale jej objętość, zamiast 2 gigabajtów w poprzedniej generacji, wzrosła do 3 gigabajtów. Stało się tak dzięki rozszerzeniu magistrali pamięci z 256-bitowej do 384-bitowej. A teraz na nowej płycie możesz umieścić 1,5 GB lub 3 GB. Naturalnie, z marketingowego punktu widzenia, instalacja mniejszego wolumenu byłaby wyraźną wadą, więc podjęto decyzję o wstawieniu 3 GB, choć dziś to trochę za dużo. Tylko powyżej wysokie rozdzielczości Tak, przy MSAA 16x 1,5-2 GB to za mało. Jednak AMD ma też Eyefinity, a w przypadku gier na trzech lub więcej monitorach bufor ekranu zajmie po prostu bardzo dużą ilość.

Przyjrzyjmy się więc Radeonowi HD 7970. Nowa karta graficzna z wyższej półki cenowej ma dwuslotowy układ chłodzenia, przykryty plastikową obudową, która jest znana wszystkim nowoczesnym płytom głównym AMD, na całej długości karta. Jedynie konstrukcja tej obudowy trochę się zmieniła, chociaż tylny koniec nadal wykracza poza płytkę drukowaną. Zmieniono jednak konstrukcję paska z pinami - aby poprawić chłodzenie karty graficznej, jedno z dwóch gniazd (połowa paska) było zajęte wyłącznie przez otwór wentylacyjny do rozpraszania ciepła.

Ale użytkownicy nie powinni cierpieć z powodu zmniejszenia liczby złączy DVI lutowanych bezpośrednio na płycie. Dla ich wygody do zestawu zostanie dołączona specjalna przejściówka HDMI-DVI, która pozwoli na podłączenie dwóch monitorów ze złączami DVI. Nawiasem mówiąc, zużycie energii nowa karta nie niższy niż Radeon HD 6970, więc musiał zainstalować zestaw jednego 8-pinowego i jednego 6-pinowego złącza zasilania.

Ale w nowym Radeonie HD 7970 system chłodzenia zmienił się na lepsze. Zastosowano komorę parownika nowej generacji i nową, większą chłodnicę o zmodyfikowanym kształcie łopatek i zwiększonej wydajności (zapewniony jest większy przepływ powietrza). Rezultatem jest wzrost wydajności chłodzenia przy jednoczesnej redukcji hałasu.

Przełącznik firmware Dual BIOS, o którym pisaliśmy w opisie Radeona HD 6900, nie zniknął z płyty. Zarówno użytkownikom, jak i AMD tak bardzo spodobało się to wygodne rozwiązanie, że AMD zdecydowało się na dalsze uzupełnianie nim rozwiązań z najwyższej półki.

Możemy się tylko przywitać ta decyzja, co naprawdę pomaga w różnych przypadkach związanych zarówno z nieoczekiwanymi problemami podczas flashowania (na przykład wyłączaniem zasilania w procesie), jak i pozwala bez obaw przeprowadzać różne eksperymenty z obrazami BIOS. Nic dziwnego, że AMD raz po raz wskazuje na doskonałe możliwości przetaktowywania nowej karty graficznej:

Jak widać, podkręcanie do częstotliwości 1 GHz i wyższej jest praktycznie obiecane, jeśli nie weźmiesz pod uwagę małego napisu (który nie został uwzględniony na zrzucie ekranu), że gwarancja przestaje obowiązywać, nawet jeśli karta graficzna ulegnie awarii jako wynik eksperymentu z podnoszeniem częstotliwości z ustawień sterownika wideo.

Cechy architektoniczne Radeon HD 7970

Aby ocenić znaczenie modyfikacji architektonicznych na Wyspach Południowych, najpierw rozważ rozwój GPU w ciągu ostatnich kilku lat w widoku AMD. Przed 2002 rokiem chipy graficzne były specyficznym sprzętem zdolnym do przetwarzania czysto graficznego. Chipy wideo z tamtych czasów miały ograniczoną funkcjonalność, mogły jedynie nakładać i filtrować tekstury, przetwarzać geometrię, angażować się w prymitywną rasteryzację i dlatego w ogóle nie nadawały się do uniwersalnych zadań obliczeniowych.

W ciągu następnych kilku lat do GPU dodano podstawową programowalność, ale także skupiono się wyłącznie na zadaniach graficznych. Był to czas wsparcia dla DirectX 8 i 9, programów cieniujących o ograniczonej funkcjonalności z możliwością obsługi zmiennoprzecinkowych. Chipy wideo z tamtych czasów miały wyspecjalizowane jednostki ALU do przetwarzania wierzchołków i pikseli, a także dedykowane pamięci podręczne dla pikseli, tekstur i innych danych. Uniwersalność wciąż nie była nawet bliska.

I dopiero w 2007 roku AMD otrzymało zunifikowaną architekturę shaderów DirectX 10, a także możliwość programowania GPU za pomocą specjalnych narzędzi: CAL, Brook, ATI Stream. W tamtych czasach procesory graficzne miały już zaawansowane buforowanie i obsługę lokalnych i globalnych udostępnianych danych. Architektonicznie chipy były oparte na blokach VLIW5 i VLIW4, wystarczająco elastycznych, aby można było korzystać z podstawowych obliczeń niegraficznych, ale nadal skupiały się na algorytmach graficznych.

A teraz czas na nową architekturę, jeszcze lepiej przystosowaną do uniwersalnego przetwarzania - Grafika Core Next (GCN). Dla AMD to nowa era architektury, dlatego wybrano nazwę. Nowe procesory graficzne oferują doskonałe możliwości przetwarzania grafiki i wydajność, ale wprowadzone zmiany architektoniczne mają na celu przede wszystkim poprawę pozycji w obliczeniach innych niż graficzne - zwiększenie wydajności i efektywności w złożonych zadaniach ogólnego przeznaczenia. Nowa konstrukcja GPU została zaprojektowana z myślą o tak zwanym przetwarzaniu heterogenicznym - mieszance grafiki i ogólnego przeznaczenia w środowisku wielozadaniowym. Architektura GCN stała się bardziej elastyczna i powinna być jeszcze lepiej dostosowana do energooszczędnego wykonywania różnych zadań.

Podstawowym blokiem w nowej architekturze jest blok GCN. To właśnie na tych „cegłach” opierają się wszystkie nowe procesory graficzne z serii Southern Islands. Architektura po raz pierwszy dla układów graficznych AMD wykorzystuje konstrukcję inną niż VLIW, wykorzystuje bloki wektorowe i skalarne, a jedną z najważniejszych zmian jest to, że każdy z bloków obliczeniowych GCN ma swój własny harmonogram i może wykonywać instrukcje z różnych programów (jądro).

Nowa architektura obliczeniowa została zaprojektowana z myślą o wysokowydajnym ładowaniu jednostek obliczeniowych w środowisku wielozadaniowym. Jednostka obliczeniowa GCN jest podzielona na cztery podsekcje, z których każda działa na własnym strumieniu instrukcji w każdym cyklu zegara. Wątki mogą również używać bloku skalarnego znajdującego się w GCN do sterowania przepływem lub operacji wskaźnika. Połączenie bloków wektorowych i skalarnych daje bardzo prosty model programowania. Na przykład wskaźniki funkcji i wskaźniki stosu są znacznie łatwiejsze do zaprogramowania, a zadanie kompilatora jest teraz znacznie uproszczone, ponieważ jednostki wykonawcze są skalarne.

Każdy blok GCN ma dedykowaną lokalną pamięć danych 64 KB do wymiany danych lub lokalne rozszerzenie stosu dla rejestrów. Ponadto blok zawiera zarówno pamięć podręczną pierwszego poziomu z możliwością odczytu i zapisu, jak i pełnoprawny potok tekstur (bloki próbkowania i filtrowania). Dzięki temu nowa jednostka obliczeniowa może pracować samodzielnie, bez centralnego harmonogramu, który w poprzednich architekturach odpowiadał za dystrybucję pracy między blokami. Teraz każda z jednostek GCN jest w stanie samodzielnie planować i dystrybuować polecenia, jedna jednostka obliczeniowa może wykonywać do 32 różnych strumieni instrukcji, które mogą pochodzić z różnych wirtualnych przestrzeni adresowych w pamięci i są całkowicie chronione i niezależne od siebie.

Poprzednie architektury procesorów graficznych AMD wykorzystywały modele architektury VLIW4 i VLIW5 i chociaż są wystarczająco dobre do zadań graficznych, nie są wystarczająco wydajne do obliczeń ogólnego przeznaczenia, ponieważ bardzo trudno jest załadować wszystkie jednostki wykonawcze pracą w takich warunkach. Nowa architektura GCN oferuje podobnie dużą liczbę jednostek wykonawczych, ale w wykonaniu skalarnym, które usuwa ograniczenia i zależności rejestrów i instrukcji. Przejście z architektury VLIW do wykonania skalarnego zapewnia zauważalne uproszczenie zadań optymalizacji kodu.

Podczas wykonywania instrukcji na poprzedniej architekturze VLIW4 kompilator musi radzić sobie z konfliktami rejestrów, dokonywać złożonej dystrybucji instrukcji do jednostek wykonawczych na etapie kompilacji kodu itp. Jednocześnie, aby osiągnąć wysoką wydajność często stosuje się nietrywialną optymalizację wymagane, co jest odpowiednie dla większości zadań graficznych i znacznie mniej elastyczne w przypadku innych obliczeń. Nowa architektura oferuje znaczne uproszczenie programowania i wsparcia, uproszczone tworzenie, analizę i wyłapywanie błędów w kodzie niskopoziomowym, stabilną i przewidywalną wydajność.

Podsystem buforowania pamięci

Przepustowość, pamięć i pamięć podręczna nigdy nie wystarczą i zawsze istnieje potrzeba i metody ich zwiększenia. Nowe procesory graficzne AMD wykorzystują w pełni dwupoziomową pamięć podręczną odczytu/zapisu. Każda jednostka obliczeniowa ma 16 kilobajtów pamięci podręcznej pierwszego poziomu, a całkowita objętość pamięci podręcznej drugiego poziomu wynosi 768 kilobajtów (w sumie chip otrzymuje 512 KB L1 i 768 KB L2), czyli o 50% więcej niż w poprzednim układzie , który w ogóle nie ma możliwości zapisu do pamięci podręcznej L2.

Jeśli chodzi o wydajność, każda jednostka obliczeniowa GCN może w jednym cyklu odbierać lub zapisywać 64 bajty danych z/do pamięci podręcznej L1 lub pamięci globalnej, która służy do wymiany danych między strumieniami poleceń. Ta sama ilość danych jest w stanie przesłać i odebrać każdą sekcję pamięci podręcznej L2. W rezultacie najwyższej klasy procesor graficzny firmy osiąga 2 terabajty / s dla L1 i 700 GB / s dla L2, czyli o 50% więcej niż poprzednie topowe rozwiązanie AMD.

Tahiti GPU

Teraz, gdy przyjrzeliśmy się niskopoziomowym zmianom architektonicznym w nowej serii Southern Islands, nadszedł czas, aby przejść do szczegółów najpotężniejszego rozwiązania z tej linii, Radeona HD 7900, który obejmuje dwa modele. Przede wszystkim zwróćmy uwagę na ogromną złożoność nowego GPU, ponieważ zawiera ponad 4,3 miliarda tranzystorów, czyli dwa razy więcej niż w układzie, na którym oparty jest Radeon HD 5870! Oczywiście tak potężny chip stał się możliwy tylko dzięki zastosowaniu nowej technologii procesu 28 nm. Więc co on ma w środku?

Liczba bloków geometrycznych nie uległa zmianie, w porównaniu do Kajmana, są jeszcze dwa, ale wydajność ich pracy znacznie wzrosła - o tym bardziej szczegółowo omówimy nieco później. Na diagramie procesora graficznego widzimy 32 jednostki obliczeniowe architektury GCN dostępne na Radeonie HD 7970, a w przypadku rozwiązania junior część z nich zostanie wyłączona. Jeśli weźmiemy pod uwagę szczytową wydajność obliczeniową rozwiązania, to jest to prawie 3,8 teraflopów (liczba operacji zmiennoprzecinkowych na sekundę), co jest absolutnym rekordem dla dzisiejszego GPU.

Każdy blok GCN ma 16 jednostek tekstur, co daje łączną liczbę 128 TMU na chip, czyli ponad 118 gigatekseli / s - i to kolejny rekord w momencie premiery i nie będzie ostatni. Ale liczba bloków ROP nie uległa zmianie, nadal są ich 32 w 8 powiększonych blokach RBE. Inną interesującą zmianą architektoniczną jest to, że teraz bloki ROP są „dołączane” nie do kanałów pamięci, jak to było wcześniej, ale do bloków GCN.

Chociaż teoretyczna prędkość zapisu bufora ramki niewiele się zmieniła, a maksymalne możliwe to te same 32 wartości kolorów i 128 wartości głębi na zegar, praktyczna szybkość wypełniania (fillrate) w rzeczywistych aplikacjach znacznie wzrosła ze względu na zwiększoną przepustowość pamięci . AMD zmierzyło Cayman przy zaledwie 23 pikselach na zegar, podczas gdy nowa Tahiti zbliżyła się do teoretycznych 32 pikseli na zegar.

Jest to zrozumiałe, ponieważ nowy układ wideo AMD ma 384-bitową magistralę pamięci - sześć 64-bitowych kanałów, podobnie jak obecne rozwiązanie topowego konkurenta. To właśnie ten 1,5-krotny wzrost przepustowości pamięci umożliwia zwiększenie rzeczywistej szybkości pobierania tekstur i zapisywania do bufora ramki. Przepustowość 264 GB/s powinna pomóc wycisnąć zbliżone do teoretycznych wartości 118 gigatekseli/s i 30 gigapikseli/s, a w części praktycznej to sprawdzimy.

W przypadku „okrojonego” procesora graficznego Radeon HD 7950, Tahiti zawiera 28 aktywnych jednostek obliczeniowych architektury GCN z 32 fizycznie dostępnych na chipie. W przypadku młodszego rozwiązania z serii Radeon HD 7970 zdecydowano się wyłączyć cztery z nich. Ponieważ każdy GCN ma 16 jednostek tekstur, całkowita TMU dla nowego modelu wynosi 112 TMU, co daje przepustowość prawie 90 gigatekseli/s.

Ale liczba ROP-ów i kontrolerów pamięci w HD 7950 nie zmieniła się, postanowili nie redukować ich i zachować te same 32 i 6 sztuk. Dlatego układ wideo Tahiti Pro ma tę samą 384-bitową magistralę pamięci, złożoną z sześciu 64-bitowych kanałów, co najlepsze rozwiązanie AMD. Najwyraźniej to funkcjonalne urządzenia komputerowe najbardziej cierpią z powodu małżeństwa podczas produkcji i postanowili nie wycinać wszystkiego innego.

Teselacja i przetwarzanie geometrii

Z architektonicznego punktu widzenia, od czasów Kajmanów w geometrycznych blokach Tahiti nie zmieniło się nic szczególnego. Nadal wykorzystuje dwa bloki do przetwarzania (ustawiania wierzchołków i teselacji) danych geometrycznych i rasteryzacji, a schemat jest bardzo podobny do tego, który widzieliśmy wcześniej, z tym wyjątkiem, że tesselatory są już nazywane 9. generacją:

Pomimo schematycznych podobieństw, najnowsza generacja tych bloków jest zdolna do znacznie lepszej teselacji i przetwarzania geometrii, ponieważ bloki zostały poddane znacznym modyfikacjom. Chociaż szczytowa wydajność wzrosła tylko do prawie dwóch miliardów wierzchołków i prymitywów na sekundę (925 MHz i dwa wierzchołki na zegar), prawdziwy występ rosło więcej. Udało się to osiągnąć dzięki zwiększeniu rozmiaru pamięci podręcznych, poprawie buforowania danych geometrycznych i ponownemu wykorzystaniu danych wierzchołków.

W rezultacie wydajność teselacji jest poprawiona we wszystkich proporcjach podziału trójkąta nawet czterokrotnie w porównaniu z Radeonem HD 6970 poprzedniej generacji. Ale cztery razy nie osiąga się we wszystkich przypadkach, nawet na schemacie z samego AMD:

Wykres przedstawia porównanie wydajności teselacji Radeona HD 7970 w porównaniu do HD 6970 przy współczynnikach podziału od 1 do 32. Jak widać, różnica wydajności wynosi od 1,7 do 4 razy. Ale to nagie syntetyki. Aby zbliżyć się do rzeczywistości, podamy więcej danych na temat prędkości teselacji już w aplikacjach do gier:

Jak widać, syntetyczne liczby AMD są dobrze wspierane przez te z gier – wydajność w rzeczywistych aplikacjach z „ciężką” teselacją znacznie wzrosła. To bardzo dobry wynik, który na pewno sprawdzimy w części praktycznej, na przykładzie syntetyków i aplikacji gamingowych.

Obliczenia niegraficzne

Z punktu widzenia heterogenicznych i niegraficznych zadań obliczeniowych pojawiły się dwa asynchroniczne silniki obliczeniowe (Asynchronous Compute Engines - ACE). Przeznaczone są do planowania i rozdzielania pracy pomiędzy jednostki wykonawcze w celu wydajnej wielozadaniowości i pracy w połączeniu z graficznym procesorem poleceń (Command Processor).

Radeon HD 7900 ma dwa niezależne silniki obliczeniowe i jeden silnik graficzny. W sumie daje to trzy programowalne bloki i trzy strumienie instrukcji, całkowicie oddzielone od siebie. A oprócz wydawania poleceń asynchronicznie dla szybkie przełączanie W kontekście nowego procesora graficznego zastosowano również dwa dwukierunkowe kontrolery bezpośredniego dostępu do pamięci (DMA) wprowadzone w Cayman. Te dwa kontrolery są wymagane, aby w pełni wykorzystać nową magistralę PCI Express 3.0.

Jak wiemy, z punktu widzenia poważnych obliczeń ważna jest nie tylko szybkość wykonywania operacji zmiennoprzecinkowych z pojedynczą precyzją, ale także z podwójną precyzją (zmiennoprzecinkowa podwójnej precyzji). A nowa architektura AMD całkiem nieźle sobie z tym radzi. Obecnie zakłada się, że istnieją dwie wersje jednostek obliczeniowych GCN o różnych szybkościach wykonywania instrukcji FP64. W przypadku starszego procesora graficznego szybkość wykonania wynosi 1/4 szybkości FP32, a dla młodszych chipów szybkość wykonania wynosi 1/16, co wystarcza do zachowania kompatybilności, ale nie komplikuje zbytnio niedrogich rozwiązań. W rezultacie Radeon HD 7970 jest w stanie wykonać 947 miliardów operacji podwójnej precyzji na sekundę (hej, ledwo osiągnęli teraflop!) - to kolejne najwyższe osiągnięcie nowego układu AMD.

Co więcej, nie są to te same gigaflopy, co w przypadku poprzednich architektur, ale bardziej „grube”. W końcu wydajność nowego GPU w złożonych zadaniach obliczeniowych powinna poważnie wzrosnąć. Po pierwsze, poprawiono podsystem pamięci i buforowania. Po drugie, każda jednostka obliczeniowa GCN ma swój własny harmonogram, co powinno poprawić wykonanie kodu rozgałęziającego i ogólną wydajność. I po trzecie, zwracamy uwagę na wykonanie skalarne, które nie wymaga od kompilatora skomplikowanych optymalizacji, w wyniku czego jednostki obliczeniowe będą znacznie rzadziej bezczynne. W rezultacie w dowolnych zadaniach nowy chip będzie łatwiej wykazywał wysoką wydajność i ładowanie ALU.

Wśród innych innowacji związanych z możliwościami obliczeniowymi zwracamy uwagę na pełne wsparcie ECC dla DRAM i SRAM. Od strony oprogramowania ważne jest, że Tahiti jest pierwszym GPU z pełną obsługą nowych wersji API: OpenCL 1.2, DirectCompute 11.1 i C++ AMP oraz ich możliwościami. Na przykład OpenCL 1.2 pozwala połączyć możliwości kilku urządzeń obliczeniowych w jedno, a AMD udostępniło już wsparcie dla tego w postaci AMD APP SDK 2.6 i sterownika Catalyst 11.12.

Wydajność i wydajność architektoniczna

Po zapoznaniu się ze wszystkimi nowinkami architektonicznymi na przykładzie topowego chipa serii Southern Island, czas porozmawiać o skuteczności wszystkich tych zmian. Oczywiste jest, że wydajność nowych chipów jest znacznie wyższa niż poprzednich, wręcz przeciwnie. Pytanie brzmi o ile szybciej. W różnych zadaniach liczby uzyskuje się od 40-50% (minimum!) do pięciokrotnej różnicy. Ulepszenia w architekturze umożliwiają przekroczenie teoretycznej 1,4-krotnej różnicy w głupich gigaflopsach. Spójrzmy na to na przykładach:

Diagram porównuje nowe topowe rozwiązanie i poprzednie rozwiązanie jednoukładowe: Radeon HD 7970 i HD 6970, co jest całkiem uczciwe. Wybrano różne testy wydajności: SmallptGPU i LuxMark to ray tracing w OpenCL, SHA256 to bezpieczny algorytm mieszający, a AES256 to symetryczny algorytm szyfrowania. Cóż, Mandelbrot jest dobrze znanym problemem obliczanym za pomocą obliczeń podwójnej precyzji.

Pionowa linia przerywana na wykresie wskazuje teoretyczną różnicę wydajności, ale dane dotyczące szybkości pokazują, że w trzech na pięć zadań szybkość nowego GPU była znacznie wyższa. Wynika to ze wszystkich zmian mających na celu zwiększenie wydajności: odejście od VLIW, obecność harmonogramu w każdej jednostce obliczeniowej, ulepszone buforowanie itp.

Zmiany w jakości renderowania

Właściwie tę część można było pominąć, ponieważ ostatnio nie ma specjalnych roszczeń do jakości obrazu i nie może być - z różnych powodów. Na przykład jakość pełnoekranowego wygładzania dla kart graficznych różni producenci bardzo blisko, zwłaszcza biorąc pod uwagę szeroką dystrybucję programowych metod antyaliasingu wykorzystujących filtry przetwarzania końcowego, które są wykonywane na wszystkich GPU w dokładnie taki sam sposób.

To samo dotyczy filtrowania tekstur – teraz jego jakość jest taka, że ​​bardzo trudno jest odróżnić rozwiązania AMD od NVIDIA, nawet jeśli robi się porównanie piksel po pikselu. Radeon HD 6900 - poprzednia generacja firmy - nieco bardziej poprawił filtrowanie anizotropowe, a teraz nawet „mikroskop” nie pomoże znaleźć tam żadnych istotnych wad. Jedyną uwagą jest to, że w ruchu karty graficzne Radeon były nieco gorsze od GeForce z powodu bardziej zauważalnych specyficznych artefaktów, takich jak „szum” lub „piasek”.

Wraz z wydaniem nowej generacji chipów wideo, wagi tekseli w filtrze tekstur zostały ponownie zmienione, zmodyfikowane w taki sposób, aby zredukować takie artefakty, czasami widoczne na Radeonie HD 6900 w obecności tekstur określonego typu (na przykład „wysoka częstotliwość”, z ostrymi przejściami od ciemności do światła). Zmiana jakości jest tak trudna do wykazania na przykładach, że AMD nie zapewnia zdjęć porównawczych HD 7900 i HD 6900, ale po prostu porównuje jakość algorytmu „sprzętowego” z algorytmem czysto programowym działającym na procesorach strumieniowych GPU, a zatem jest idealny :

Na tak małym zrzucie różnica w jakości nie jest widoczna, ale AMD zapewnia, że ​​wszystkie wprowadzone zmiany nie przyniosły spadku wydajności i nie pogorszyły jakości obrazu w żadnym z aspektów – nadal nie zależy to od kąta i jakość filtrowania jest bliska ideału. W jednym z przyszłych praktycznych materiałów na pewno to sprawdzimy.

Częściowo rezydentne tekstury

Ideą Partially Resident Textures (PRT) jest wykorzystanie możliwości sprzętowych prezentowanego GPU – pamięć wirtualna. Z pewnością wielu użytkowników widziało już grę RAGE firmy id Software, która wykorzystuje technologię wirtualnego teksturowania, tzw. megateksturowanie ("MegaTexture"), która zapewnia możliwość wykorzystania ogromnych ilości danych tekstur i zamiany (przesyłania strumieniowego) ich do pamięci wideo.

Wykorzystując wirtualną pamięć wideo bardzo łatwo jest uzyskać efektywną obsługę sprzętową takich algorytmów, które pozwalają na wykorzystanie w aplikacji do 32 terabajtów tekstur, co umożliwia tworzenie unikalnych lokalizacji w grach bez powtarzania fragmentów tekstur, a całkowita nieobecność problemy z ładowaniem danych tekstur. To prawda, ilustracyjny przykład AMD jest zbyt dziwny, z którego nic nie jest szczególnie jasne:

PRT pozwala na uzyskanie wysokiej jakości obrazu i pomaga zwiększyć efektywność wykorzystania pamięci wideo. Podobne algorytmy są już używane w silniku id Software i oczekuje się, że pojawią się w wielu silnikach nowej generacji. Gry przyszłości muszą pracować z ogromnymi ilościami danych, a zaletą nowego procesora graficznego jest to, że lokalna pamięć graficzna w algorytmach PRT działa jak sprzętowa pamięć podręczna, a tekstury są do niej ładowane w razie potrzeby. GPU z rodziny Southern Islands obsługują „megatekstury” do 32 terabajtów (rozdzielczość do 16384×16384) i, co najważniejsze, sprzętowe filtrowanie tekstur, które nie jest dostępne we wcześniejszych układach wideo.

Tekstury wirtualne są podzielone na kawałki po 64 kilobajty (kilobajty, nie teksele) i ten rozmiar kawałka jest stały. I tylko te, które są potrzebne podczas renderowania bieżącej klatki, są ładowane do lokalnej pamięci karty graficznej. Technologia działa niezależnie od formatu tekstury, tylko rozmiary kawałków w tekselach będą się różnić. Na przykład, dla zwykłej nieskompresowanej tekstury z 32 bitami na kolor, rozmiar fragmentu będzie wynosił 128x128 tekseli, a dla skompresowanej tekstury DXT3 będzie to 256x256 tekseli.

Technologia obejmuje również użycie mip-poziomów tekstur (mniejsze kopie używane w filtrowaniu tekstur). Podczas renderowania i filtrowania należy uzyskiwać do nich dostęp wielokrotnie. Rozważ działanie algorytmu na przykładzie.

Ta figura przedstawia cztery różne elementy z różnych poziomów mip wymaganych do renderowania. Gdy program cieniujący żąda od nich danych, niektóre fragmenty znajdują się już w pamięci lokalnej i dane te są natychmiast przesyłane do modułu cieniującego w celu dalszych obliczeń. Ale na stole brakuje niektórych elementów, a aplikacja musi zdecydować, co dalej zrobić w przypadku takiego chybienia. Na przykład, możesz zażądać danych z niższej rozdzielczości mip-level, wtedy obraz będzie rozmyty, ale przynajmniej będzie wyglądał jak prawdziwy i zostanie narysowany bez opóźnień. A do czasu wyrenderowania następnej klatki można ją już załadować do pamięci podręcznej - lokalnej pamięci wideo. Ci, którzy grali w RAGE, zrozumieją nas.

Jest to potężny algorytm, który pozwala na użycie ogromnych tekstur, które są unikalne dla każdego z obiektów. Podobne algorytmy są od dawna używane w renderowaniu offline, z wyjątkiem konieczności obliczeń w czasie rzeczywistym. AMD stworzyło nawet demo przy użyciu techniki mapowania tekstur według twarzy opracowanej przez Walt Disney Animation Studios dla swoich filmów animowanych. Niestety demo nie jest jeszcze gotowe, a widzieliśmy tylko zrzuty ekranu w niskiej rozdzielczości.

Istotą tej techniki mapowania tekstur jest przypisanie określonego fragmentu tekstury do każdego wielokąta, bez konieczności stosowania transformacji UV (znalezienie zgodności między współrzędnymi powierzchni obiektu trójwymiarowego a współrzędnymi na teksturę wymiarową). Takie podejście rozwiązuje niektóre problemy związane z tworzeniem treści mozaikowych, czyniąc algorytm mapowania przemieszczeń bardzo prostym. A PRT w tej metodzie służy do wydajnego przechowywania i dostępu do danych tekstur.

Instrukcje dotyczące obsługi nośników

Ciekawą innowacją na Wyspach Południowych wydaje się być obsługa specjalistycznych instrukcji wykorzystywanych w przetwarzaniu obrazu, zarówno statycznego, jak i dynamicznego. Na przykład poprawiono powszechnie używaną instrukcję o nazwie „suma różnic bezwzględnych”, lepiej znaną jako SAD (Suma różnic bezwzględnych). Szybkość jego wykonania jest bardzo krytycznym dla wydajności wąskim gardłem w wielu algorytmach przetwarzania danych obrazu i wideo, takich jak wykrywanie ruchu, rozpoznawanie gestów, wyszukiwanie obrazu, widzenie komputerowe i wiele innych.

Ale w naszej recenzji starożytnej karty graficznej Radeon HD 5870 pisaliśmy już o obsłudze SAD. Teraz, oprócz zwykłego SAD (4 × 1), Wyspy Południowe mają nowa instrukcja- QSAD (quadruple SAD), który łączy SAD z operatorami zmiany w celu zwiększenia wydajności i efektywności energetycznej, a także instrukcję „maski” MQSAD, która ignoruje piksele tła i służy do izolowania obiektów poruszających się w kadrze od tła.

Nowe procesory graficzne mogą przetwarzać do 256 pikseli na jednostkę obliczeniową GCN na zegar, co w przypadku AMD Radeon HD 7970 oznacza, że ​​może przetwarzać do 7,6 biliona pikseli na sekundę w przypadku 8-bitowych liczb całkowitych. Chociaż jest to liczba teoretyczna, możliwości przetwarzania wizualnego nowych procesorów graficznych są dość imponujące – wiele zadań przetwarzania wideo można wykonać w czasie rzeczywistym.

PCI Express 3.0

Nie mogliśmy przejść obojętnie obok wsparcia trzeciej wersji PCI Express przez całą linię nowych rozwiązań graficznych z Wysp Południowych. To wsparcie było dość oczekiwane, ponieważ specyfikacje trzeciej wersji PCI Express zostały ostatecznie zatwierdzone jesienią 2010 roku, ale nadal nie było rozwiązań sprzętowych z jego obsługą, chociaż płyty główne już się pojawiają, karty wideo zostały wydane pod koniec 2011 roku i procesory centralne są odpowiednie.

Zaktualizowany interfejs ma szybkość transferu 8 gigatransakcji na sekundę zamiast 5 GT/s dla wersji 2.0, a jego przepustowość po raz kolejny podwoiła się (do 32 Gb/s) w porównaniu ze standardem PCI Express 2.0. Nowa magistrala wykorzystuje inny schemat kodowania danych przesyłanych przez magistralę, ale zachowana została kompatybilność z poprzednimi wersjami PCI Express.

Pierwsze płyty główne z Obsługa PCI Express 3.0 został wprowadzony latem 2011 roku, głównie w oparciu o chipset Intel Z68, a na rynku ogólnym pojawiły się dopiero jesienią tego samego roku. Tak więc karty graficzne przybyły na czas, a AMD ponownie wyprzedziło resztę pod względem szybkości wypuszczania nowych procesorów graficznych z obsługą najbardziej zaawansowanych technologii. Ale jest za wcześnie, aby oceniać, czy PCI-E 3.0 będzie miało jakiekolwiek praktyczne zastosowanie.

Technologia AMD PowerTune

Jedną z najciekawszych innowacji w Cayman była zaawansowana technologia zarządzania energią PowerTune. Elastyczne zarządzanie energią GPU było używane przez długi czas, ale przed Radeonem HD 6900 wszystkie te technologie były dość prymitywne i głównie metody programowe i zmieniały częstotliwość i napięcie krokowo, nie mogąc wyłączyć dużej części chipów wideo .

Nawet w rodzinie Radeon HD 5000 ogranicznik wydajności pojawił się po przekroczeniu pewnego poziomu zużycia, a w Radeonie HD 6900 system przeszedł na jakościowo inny poziom. Aby to zrobić, we wszystkich blokach, które monitorują parametry rozruchu, w chipie znalazły się specjalne czujniki. GPU stale mierzy obciążenie i zużycie energii i nie pozwala temu ostatniemu przekroczyć pewnego progu, automatycznie dostosowując częstotliwość i napięcie, aby parametry pozostały w określonym pakiecie termicznym.

W przeciwieństwie do wczesnych technologii zarządzania energią, PowerTune zapewnia bezpośrednią kontrolę nad zużyciem energii GPU, w przeciwieństwie do kontroli pośredniej poprzez zmianę częstotliwości i napięcia. Ta technologia pomaga ustawić wysokie częstotliwości GPU, uzyskać wysoką wydajność w grach i nie obawiać się, że zużycie może przekroczyć bezpieczne limity. W końcu większość gier i zwykłych aplikacji korzystających z obliczeń na GPU ma znacznie niższe wymagania dotyczące mocy i nie zbliża się do niebezpiecznych limitów zużycia energii, w przeciwieństwie do testów stabilności, takich jak Furmark i OCCT.

Nawet najcięższe gry nie wymagają maksymalnego zużycia energii, a jeśli ograniczysz zużycie według częstotliwości, testując karty wideo ekstremalnymi testami, to w przypadku gier 3D będzie sporo niewykorzystanych możliwości wydajności i mocy. W przypadku, gdy karta graficzna nie osiągnęła limitu bezpiecznego poziomu zużycia, GPU będzie działał z częstotliwością ustawioną fabrycznie, a w testach FurMark i OCCT częstotliwość GPU zmniejszy się, aby utrzymać się w granicach zużycia.

W ten sposób PowerTune pomaga ustawić wyższe częstotliwości fabryczne i dostroić system do najbardziej efektywnego wykorzystania zasobów GPU przy ustalonym maksymalnym poziomie zużycia. W pokazanym powyżej przykładzie HD 5870 nie korzysta z PowerTune i ze względu na ograniczenie częstotliwości GPU do wysokiego zużycia w testach wytrzymałościowych nie wykorzystuje w pełni swojego potencjału. Podczas gdy maksymalny TDP jest ustawiony dla Radeona HD 7970, a układ wideo resetuje częstotliwości tylko po jego przekroczeniu, uzyskując najwyższą możliwą wydajność w dowolnej aplikacji.

Widać to wyraźnie na poniższym schemacie. W przypadku aplikacji do gier TDP można osiągnąć poprzez zwiększenie częstotliwości GPU, a przy szczytowych obciążeniach testy wytrzymałościowe zmniejszają częstotliwość do bezpiecznego poziomu zużycia energii. Bez PowerTune musiałbyś wybrać - albo uzyskać prawdopodobieństwo awarii karty graficznej, gdy FurMark i OCCT działają przez długi czas, albo zmniejszyć potencjalną wydajność w grach. Nowa technologia rozwiązuje te problemy tak skutecznie, jak to tylko możliwe.

AMD PowerTune zapewnia szybką reakcję na zmieniające się warunki (mikrosekundy), ponieważ jest to technologia sprzętowa. Wyróżnia się również elastycznym dostrajaniem częstotliwości, a nie schodkowym, jak to miało miejsce w poprzednich chipach. Wszystkie pomiary są niezależne od sterownika, ale mogą być regulowane przez użytkownika za pomocą ustawień karty graficznej.

Różnica między PowerTune a wcześniej ogólnie przyjętym podejściem polega na tym, że w innych przypadkach stosuje się termiczne dławienie, które umieszcza GPU w trybie znacznie zmniejszonego zużycia, a PowerTune po prostu płynnie zmniejsza częstotliwość, doprowadzając zużycie GPU do ustawionego limitu. Skutkuje to wyższymi częstotliwościami zegara i wyższą wydajnością.

Technologia AMD ZeroCore

AMD nie ograniczyło się do wykorzystania technologii zarządzania energią znanej już z poprzednich rozwiązań. W pierwszych chipach z rodziny Southern Islands wprowadza technologię AMD ZeroCore, która pomaga osiągnąć jeszcze większą energooszczędność w trybie „głębokiego bezczynności” (lub „uśpienia”) z wyłączonym wyświetlaczem, który jest obsługiwany przez wszystkie systemy operacyjne .

W końcu prawie każdy system, nawet do gier, spędza większość czasu w trybie niskiego obciążenia na procesorze graficznym. W tym trybie karta graficzna nie powinna zużywać dużo energii. A co więcej, nie wspominając o trybie z wyłączonym monitorem - w tym przypadku wskazane jest całkowite wyłączenie GPU. To właśnie zrobiło AMD. Dzięki ZeroCore nowy procesor graficzny zużywa mniej niż 5% energii w trybie pełnym podczas głębokiego bezczynności, wyłączając większość bloków funkcjonalnych w tym trybie.

AMD przedstawia schematyczne porównanie z własnym Radeonem HD 5870, który nie wspierał tej technologii. ZeroCore to innowacja dostępna wyłącznie na Wyspach Południowych w rozwiązaniach stacjonarnych z mobilnych procesorów graficznych przeznaczonych do laptopów. Nawiasem mówiąc, zalety tej technologii wiążą się nie tylko ze zmniejszonym zużyciem. Ponadto w trybie długiego bezczynności, gdy wyświetlacz jest wyłączony, karta graficzna całkowicie wyłącza również wentylator chłodnicy karty graficznej!

Właśnie na to wielu użytkowników czekało od dawna. Najciekawsze jest to, że według naszych danych testy laboratoryjne rozwiązań takich jak PowerTune i ZeroCore miały miejsce kilka pokoleń temu. Niektóre próbki inżynieryjne kart graficznych z serii AMD, które już dawno zniknęły z rynku, działały dokładnie w ten sposób, całkowicie wyłączając chłodzenie w czasie bezczynności.

Jednak nie tylko użytkownicy korzystający z jednego procesora graficznego korzystają z redukcji szumów i zużycia energii dzięki nowym kartom graficznym AMD obsługującym ZeroCore. Podobne ulepszenia czekają szczęśliwych posiadaczy układów CrossFire opartych na dwóch, trzech, a nawet czterech GPU. Czy w końcu logiczne jest, że w trybie renderowania dwuwymiarowego interfejsu systemu operacyjnego wszystkie karty wideo, z wyjątkiem głównej, w ogóle nie powinny działać? Ale tak właśnie działają teraz!

W przypadku systemów CrossFire na kartach graficznych z obsługą ZeroCore w trybie 2D, wszystkie dodatkowe karty wideo są zanurzone w głębokim śnie przy minimalnym zużyciu energii i wyłączonej chłodnicy. Ten tryb działa zarówno dla kilku jednoukładowych kart graficznych, jak i dla rozwiązań dwuchipowych. Ponadto podstawowa karta graficzna CrossFire również przejdzie w ten tryb w przypadku długiego czasu bezczynności skonfigurowanego w systemie Windows. Wizualnie różnica w pracy wygląda tak:

Nawiasem mówiąc, technologia nie jest tak prosta, jak mogłoby się wydawać. Inżynierowie AMD musieli rozwiązać wiele problemów związanych z działaniem systemu operacyjnego w trybie bezczynności. Na przykład odkryli, że system Windows próbuje aktualizować informacje na ekranie, nawet gdy monitor jest wyłączony. Co oczywiście nie pozwala w ogóle wyłączyć GPU. Dlatego programiści firmy musieli obejść to obejście, ignorując wszystkie polecenia rysowania ekranu, gdy monitor był wyłączony w trybie uśpienia.

Technologia AMD Eyefinity 2.0

Oczywiście w nowej architekturze znalazło się miejsce na ulepszenia sprawdzonej technologii wyświetlania obrazu na wielu monitorach – AMD Eyefinity, teraz w wersji 2.0. Otrzymał nowe funkcje, wyższe rozdzielczości, obsługę większej liczby wyświetlaczy i zwiększoną elastyczność.

Ta technologia jest dość ciekawa, choć niezwykle mała liczba użytkowników znajdzie miejsce w pomieszczeniu i zbierze się na oczach rodziny, aby zainstalować więcej niż dwa monitory. Ale lepiej mieć możliwość, aby zawsze móc z niego korzystać, niż nie mieć go wcale. Co więcej, ceny monitorów o dużych przekątnych prawie nie spadają, ale rozwiązania ze średniej półki są coraz tańsze.

Rzeczywiście, teraz bardziej opłaca się kupić trzy monitory o przekątnej ekranu 24″ niż jeden 30-calowy. AMD podaje właśnie taki przykład, gdzie 30-calowy monitor 2560x1600 kosztuje ponad 1000 USD, podczas gdy trzy 24-calowe monitory FullHD można kupić za połowę tej ceny:

Ale to, jak wydać pieniądze i miejsce w pokoju, to sprawa osobista każdego użytkownika. Najważniejsze, że istnieje taka możliwość. Dodatkowo Eyefinity 2.0 obsługuje teraz wyjście obrazu w trybie stereo HD3D – coś, czego brakowało w poprzednich rozwiązaniach, które pod tym parametrem były gorsze od konkurencyjnych. Łącząc technologie AMD Eyefinity i HD3D, Radeon HD 7970 jest pierwszym jednoukładowym rozwiązaniem obsługującym trzy monitory w trybie stereo.

Renderowanie stereo w wysokiej rozdzielczości wymaga bardzo szybkiego interfejsu do przesyłania danych. A przy poprzednich wersjach wyjść HDMI możliwości były ograniczone do 24 Hz na oko, co wystarcza do oglądania filmów Blu-ray 3D, ale wyraźnie za mało dla graczy.

Do takich zadań zaczęto używać formatu pakowania ramek, kiedy ramki dla lewego i prawego oka są łączone w jedno, a AMD Radeon HD 7970 obsługuje format pakowania ramek HDMI 1.4a dla wyjścia stereo. Jest to pierwsza karta graficzna obsługująca 3 GHz HDMI z pakowaniem klatek, gdzie każde oko ma obraz FullHD przy 60 Hz (łącznie 120 Hz):

Kolejną ciekawą nowością wydaje nam się technologia wielokanałowego wyjścia audio Discrete Digital Multi-Point Audio (DDMA), która współpracuje z Eyefinity. Wszystkie poprzednie procesory graficzne mogą przesyłać przez HDMI i DisplayPort tylko jeden strumień audio. Oznacza to, że nawet jeśli trzy monitory znajdujące się w różnych pomieszczeniach są podłączone do komputera przez HDMI, to kanał dźwiękowy przesyłany jest tylko jeden. Ale AMD Radeon HD 7900 otrzymał wsparcie dla jednoczesnego wyjścia kilku niezależnych kanałów audio naraz, co może się przydać w niektórych konfiguracjach wielomonitorowych.

Ta sama funkcja będzie bardzo przydatna w aplikacjach wideokonferencyjnych z wyjściem kilku rozmówców na osobnych ekranach, a także w aplikacjach wielozadaniowych, takich jak granie na trzech monitorach z dźwiękiem z gry i oglądanie wiadomości na osobnym ekranie z niezależnym strumieniem audio. Wcześniej do tego wszystkiego trzeba było zastosować kilka osobnych systemów audio, ale teraz wszystko działa tak wygodnie, jak to możliwe.

Nie zapomniano również o wsparciu oprogramowania Eyefinity, prawie co miesiąc technologia jest aktualizowana - pojawiają się nowe możliwości. Tak więc w październiku pojawiła się obsługa rozdzielczości do 16384×16384 oraz nowe konfiguracje wielomonitorowe: pozioma i pionowa 5×1, a także oparta na sześciu monitorach w trybie 3×2.

Aktualizacja sterownika wideo AMD Catalyst w grudniu umożliwia współpracę Eyefinity i HD3D, a w lutym ogłoszona zostanie obsługa niestandardowych rozdzielczości, poprawki w rozmieszczaniu paska zadań i ulepszenia zarządzania ustawieniami.

Wyjście na sześć monitorów można uzyskać za pomocą dwóch portów DisplayPort 1.2 i dwóch koncentratorów MST (o których pisaliśmy wcześniej), podczas gdy trzy lub nawet cztery monitory wymagają tylko jednego portu i odpowiedniego koncentratora. Te koncentratory oferują elastyczne konfiguracje wyświetlania, obsługują do czterech urządzeń FullHD na złącze DisplayPort 1.2 i powinny być dostępne do lata 2012 roku.

Mówiąc o pozwoleniu. Wysoka rozdzielczość lub nawet bardzo wysoka - Ultra High Resolution. Obecne urządzenia o rozdzielczości 4000 pikseli po większej stronie wymagają połączenia kilkoma kablami jednocześnie: dwóch DP 1.1 lub czterech DVI. Monitory o tej rozdzielczości następnej generacji podłączymy tylko jednym kablem: DP 1.2 HBR2 lub HDMI 1.4a 3 GHz. A nowa karta graficzna AMD jest już gotowa na takie monitory, ponownie stała się pierwszą na świecie.

Kodowanie i dekodowanie wideo

To całkiem naturalne, że AMD Radeon HD 7970 zawiera ten sam blok UVD do dekodowania danych wideo, który pojawił się w poprzedniej generacji chipów wideo tej firmy. Po prostu nie wymaga żadnych modyfikacji, obsługuje wielostrumieniowy kodek MVC, dekodowanie MPEG-2/MPEG-4 (DivX), VC-1 i H.264, a także dekoduje dwa strumienie FullHD we wszystkich obsługiwanych formatach.

Rozwiązania AMD zapewniają maksymalna jakość dekodowanie strumienia wideo, wykorzystanie dziesiątek specjalnych algorytmów poprawy jakości i zapewnienie maksymalnych wyników w testach jakości, takich jak HQV. Wśród obsługiwanych funkcji wymieniamy: regulację kolorów i tonów, redukcję szumów, wyostrzanie, skalowanie wysokiej jakości, dynamiczny kontrast, zaawansowane usuwanie przeplotu i odwrócone telecine. Oto przykład wzmocnienia kontrastu w locie:

Ale dzięki dekodowaniu wszystkie chipy wideo były mniej więcej w porządku przez długi czas. Wszystkie nowe procesory graficzne zapewniają przyzwoitą jakość i wydajność podczas przeglądania danych wideo. Jednak kodowanie wideo na GPU jest wciąż w powijakach, a główne skargi użytkowników dotyczą niskiej jakości wynikowego skompresowanego obrazu.

Być może nowa seria Radeon HD 7000 może w tym pomóc, ponieważ wszystkie procesory graficzne z tej serii mają jednostkę kodowania wideo Video Codec Engine (VCE). Radeon HD 7970 był pierwszą kartą graficzną obsługującą sprzętowo akcelerowane kodowanie i kompresję wideo przy użyciu wyspecjalizowanego bloku (wcześniej w kodowaniu brały udział procesory strumieniowe).

Jakość i wydajność powinny być wyraźnie lepsze niż wcześniej, z obsługą kodowania 1080p przy 60 klatkach na sekundę, nawet szybciej niż w czasie rzeczywistym. Trudno powiedzieć coś o jakości bez testów, ale obiecujemy różne poziomy optymalizacje koderów dla danych wideo i gier, a także zmienna jakość kompresji (możliwość wyboru między jakością lub poprawą wydajności).

Póki co nie ma miejsca na wypróbowanie VCE - po prostu nie ma aplikacji z jego obsługą, ale AMD współpracuje z partnerami takimi jak ArcSoft, aby zapewnić wsparcie dla VCE w odpowiednich produkty oprogramowania. W przyszłości planujemy wydać bibliotekę oprogramowania przyspieszającą kodowanie wideo, która ułatwi programistom obsługę produktów AMD nowej generacji.

Kodowanie może odbywać się w dwóch trybach: pełnym i hybrydowym (z wykorzystaniem możliwości procesorów strumieniowych GPU). Tryb pełny jest przeznaczony do zastosowań wymagających maksymalnej efektywności energetycznej i stałego poziomu wydajności. Kodowanie w trybie pełnym w VCE jest szybsze niż w czasie rzeczywistym i zapewnia niskie opóźnienia. Ale jest też tryb hybrydowy:

W tym trybie bloki matematyczne GPU współpracują z VCE. Wszystkie wysoce równoległe stopnie, które na schemacie są zakreślone na żółto, mogą wykorzystywać moc jednostek obliczeniowych GCN, a dedykowana jednostka VCE jest zaangażowana w wydajne sprzętowe kodowanie entropii. Ten tryb dobrze nadaje się do kart graficznych o dużej mocy matematycznej, takich jak Radeon HD 7970. Nadal pojawiają się pytania o jakość tych dwóch trybów, ale wymaga to dokładnej analizy w osobnym materiale.

Stabilne wideo AMD

Oprócz kodowania i dekodowania danych wideo, jest jeszcze jedna aplikacja wykorzystująca moc nowej karty graficznej AMD - ulepszanie kiepskiej jakości filmów wideo z ręki bez użycia statywu i innych podobnych narzędzi stabilizacji obrazu. Technologia stabilizacji wideo nosi nazwę AMD Steady Video, a jej druga wersja została już wydana.

Algorytm stabilizatora programowego jest dość prosty: na podstawie strumienia wideo gromadzone są statystyki dotyczące ruchu kamery (przesunięcie, obrót, zoom) i ten ruch jest kompensowany w bieżącej klatce względem poprzednich - obraz jest przesunięty , obrócony i wyskalowany, aby obraz nie skakał zbytnio i był stabilny.

Tak proste, jak to jest w słowach, jest równie trudne do wdrożenia. Po prostu dlatego, że na ekranie są dwa miliony pikseli i do 30, a nawet 60 klatek na sekundę.Wyobraź sobie, ile obliczeń musisz wykonać, aby śledzić wszystkie możliwe przesunięcia klatek. O funkcji QSAD wykorzystywanej w przetwarzaniu wideo pisaliśmy już powyżej, a także jest ona wykorzystywana w Steady Video 2.0 do przyspieszenia algorytmu wykrywania ruchu. Tak więc GPU musi przetwarzać losowe przesunięcia z amplitudą do 32 pikseli w dowolnym kierunku, a to wymaga wydajności odpowiadającej ponad 500 miliardom operacji SAD na sekundę (dla 1920x1080 przy 60 FPS).

Dzięki obsłudze nowych instrukcji QSAD w Radeonie HD 7970 jego przewaga nad potężnymi procesorami w algorytmie wykrywania ruchu przekracza 10x! Oznacza to, że teraz będziemy nam dostarczać wysokiej jakości wideo, i to nie tylko podczas przetwarzania domowych filmów w edytorach wideo, ale także podczas oglądania filmów online innych osób, nakręconych przez nikt nie wie co i nikt nie wie jak.

Szczegóły: seria Radeon HD 7800

  • Nazwa kodowa chipa: „Pitcairn”
  • Technologia produkcji: 28 nm
  • 2,8 miliarda tranzystorów (nieco więcej niż Cayman, który jest podstawą serii Radeon HD 6900)
  • Zunifikowana architektura z szeregiem popularnych procesorów do przetwarzania strumieniowego wielu typów danych: wierzchołków, pikseli i innych.
  • Wsparcie sprzętowe dla DirectX 11.1, w tym model cieniowania Shader Model 5.0
  • 256-bitowa magistrala pamięci: cztery 64-bitowe kontrolery z obsługą pamięci GDDR5
  • Taktowanie rdzenia: do 1000 MHz (dla Radeona HD 7870)
  • 20 jednostek obliczeniowych GCN z 80 rdzeniami SIMD, co daje łącznie 1280 zmiennoprzecinkowych jednostek ALU (formaty Integer i Float, obsługa precyzji IEEE 754 FP32 i FP64)
  • 80 jednostek tekstur, z obsługą filtrowania trójliniowego i anizotropowego dla wszystkich formatów tekstur
  • 32 ROP z obsługą trybów antyaliasingu z możliwością programowanego próbkowania ponad 16 próbek na piksel, w tym w formacie bufora ramki FP16 lub FP32. Szczytowa wydajność do 32 próbek na zegar, a w trybie bezbarwnym (tylko Z) - 128 próbek na zegar

Dane techniczne karty graficznej Radeon HD 7870

  • Częstotliwość rdzenia: 1000 MHz
  • Liczba procesorów uniwersalnych: 1280
  • Liczba jednostek tekstury: 80, jednostek mieszania: 32
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 2 gigabajty
  • Teoretyczna maksymalna szybkość wypełniania: 32,0 gigapikseli na sekundę.
  • Teoretyczna częstotliwość próbkowania tekstur: 80,0 gigatekseli na sekundę.
  • Jedno złącze CrossFire
  • Magistrala PCI Express 3.0
  • Złącza: DVI Dual Link, HDMI 1.4, dwa Mini-DisplayPort 1.2
  • Pobór mocy: 3 do 175 W
  • Dwa 6-pinowe złącza zasilania
  • Konstrukcja z dwoma gniazdami
  • Sugerowana cena detaliczna w USA: 349 USD

Dane techniczne karty graficznej Radeon HD 7850

  • Częstotliwość rdzenia: 860 MHz
  • Liczba procesorów uniwersalnych: 1024
  • Liczba jednostek tekstury: 64, jednostki mieszania: 32
  • Efektywna częstotliwość pamięci: 4800 MHz (4×1200 MHz)
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 2 gigabajty
  • Przepustowość pamięci: 153,6 gigabajtów na sekundę
  • Teoretyczna maksymalna szybkość wypełniania: 27,5 gigapikseli na sekundę.
  • Teoretyczna częstotliwość próbkowania tekstury: 55,0 gigatekseli na sekundę.
  • Jedno złącze CrossFire
  • Magistrala PCI Express 3.0
  • Złącza: DVI Dual Link, HDMI 1.4, dwa Mini-DisplayPort 1.2
  • Pobór mocy: 3 do 130 W
  • Konstrukcja z dwoma gniazdami
  • Sugerowana cena detaliczna w USA: 249

I tym razem zasada nazewnictwa produktów firmy nie uległa zmianie i kontynuowano trendy z poprzednich serii. Średniobudżetowa seria kart graficznych oparta na architekturze GCN różni się od górnej i budżetowej linii drugiej cyfry w indeksie: zamiast 7 i 9 ustawiona jest liczba 8, co jest dość logiczne. Ponieważ AMD przyjęło psychologiczny próg 1000 MHz dla częstotliwości GPU, Radeon HD 7870 otrzymał do nazwy dodatek „GHz Edition”, wskazujący na przyjęcie tej częstotliwości.

Z nazwy jasno wynika, że ​​Radeon HD 7800 jest bardziej wydajny niż HD 7700, ale ma niższą prędkość w porównaniu ze starszymi modelami - HD 7900. Jeśli chodzi o porównanie z rozwiązaniami NVIDII, starszy HD 7870 wydany w czasie Wydanie konkuruje z kartą graficzną GeForce GTX 570, a młodsza ma na celu walkę z GTX 560 Ti, a nVIDIA nie wypuściła jeszcze nowych 28-nm chipów średniej klasy.

Oba modele kart graficznych AMD mają pamięć GDDR5 o tej samej ilości 2 gigabajtów. Oba używają 256-bitowej magistrali pamięci, więc można na nich umieścić 1, 2 lub 4 GB. 1 gigabajt to za mały, a 4 GB to na to za drogo segment cenowy. Można więc powiedzieć, że wybrano idealną ilość 2 GB pamięci wideo, która w zdecydowanej większości gier jest wystarczająca nawet w wysokich rozdzielczościach i nie jest zbyt kosztowna.

Pod innymi względami z punktu widzenia konsumenta modele HD 7850 i HD 7870 są jeszcze inne. Starszy Radeon HD 7870 ma wyższy pobór mocy, więc potrzebuje dwóch dodatkowych 6-pinowych złączy zasilania, a HD 7850 jest zadowolony tylko z jednego z nich. Obie płyty mają układ chłodzenia z dwoma gniazdami, ale większość producentów produkuje płyty z własną konstrukcją co najmniej chłodnicy, a nawet PCB.

Cechy architektoniczne rodziny Radeon HD 7800

Powyżej dokładnie opisaliśmy wszystkie cechy nowej architektury Graphics Core Next (GCN), więc powtórzymy tylko te najważniejsze. Wszystkie nowe procesory graficzne firmy oferują doskonałe funkcje i wydajność nie tylko w przetwarzaniu grafiki, ale także w obliczeniach innych niż graficzne, w tym w połączeniu różnych rodzajów obliczeń. Ponadto nowa architektura GCN oferuje poważne uproszczenie zadań optymalizacji kodu, uproszczenie rozwoju i wsparcia, a także stabilną i przewidywalną wydajność oraz ogólnie dość wysoką wydajność.

Podstawowym blokiem nowej architektury jest blok GCN, z którego składane są wszystkie procesory graficzne z serii Southern Islands. Rozważ schemat blokowy chipa Pitcairn:

Diagram pokazuje procesor graficzny Radeon HD 7870 ("uproszczony" HD 7850 różni się od niego kilkoma odłączonymi blokami), widzimy 20 jednostek obliczeniowych architektury GCN. W przypadku młodszego rozwiązania z serii Radeon HD 7800 cztery z nich zostały wyłączone, a liczba aktywnych bloków w nim wynosi 16. Odpowiada to odpowiednio 1280 i 1024 procesorom strumieniowym (podobnie jak w przypadku HD). 7700 rodziny, tyle że bloków jest dokładnie dwa razy więcej). Ponieważ każda jednostka GCN ma cztery jednostki tekstur, łączna liczba TMU dla starszego modelu wynosi 80 TMU, a dla młodszego - 64 TMU.

Ale liczba ROP-ów i kontrolerów pamięci w HD 7870 i HD 7850 jest również taka sama jak w rozwiązaniach z najmłodszej linii. Ilość klocków ROP pozostawiono dość dużą - 32 sztuki dla obu modeli. Magistrala pamięci dla płyt opartych na Pitcairn została skrócona do 256-bitów, jest złożona z czterech 64-bitowych kanałów. To nieźle jak na rozwiązanie tego poziomu, choć to półtora raza mniej niż w górnej linii, ponieważ tradycyjnie najpierw odcinana jest magistrala pamięci. Dobrze, że zastosowanie szybkiej pamięci GDDR5 dało stosunkowo dużą przepustowość 153 GB/s.

Podobnie jak pozostałe układy architektury GCN, Pitcairn zawiera blok tesselatora 9. generacji, z licznymi optymalizacjami buforowania i buforowania, co może znacznie poprawić wydajność przetwarzania geometrii. Oto porównanie nowej płyty AMD z rozwiązaniem poprzedniej generacji w problemie syntetycznym, według którego możemy założyć nawet czterokrotny wzrost szybkości teselacji:

W ten sam sposób obsługiwanych jest również wiele technologii AMD, które zostały wprowadzone i ulepszone w nowych układach wideo Radeon HD 7000. Oto ich niepełna lista: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, jakość filtrowania tekstur ulepszenia itp. Wszystko to opisano bardziej szczegółowo powyżej. Aby dodać do listy, Radeon HD 7800 w pełni obsługuje zarówno ulepszony algorytm antyaliasingu MLAA 2.0, jak i supersampling anti-aliasing (SSAA).

Jeśli chodzi o porównanie wydajności w grach, Radeon HD 7870 jest znacznie szybszy od swojego bezpośredniego konkurenta GeForce GTX 570, zwłaszcza w obliczu 1,25 GB pamięci VRAM (w porównaniu do 2 GB dla omawianych rozwiązań), obserwowanego w nowoczesne gry w wysokich rozdzielczościach renderowania. Młodszego Radeona HD 7850 można porównać z GeForce GTX 560 Ti, a tutaj nie może się już pochwalić ilością pamięci. Jednak według pomiarów AMD ich nowe rozwiązanie jest wciąż szybsze niż konkurencja w większości gier.

Szczegóły: Seria Radeon HD 7700

  • Nazwa kodowa chipa: „Wyspy Zielonego Przylądka”
  • Technologia produkcji: 28 nm
  • 1,5 miliarda tranzystorów (mniej niż Barts, który jest podstawą serii Radeon HD 6800)
  • Zunifikowana architektura z szeregiem popularnych procesorów do przetwarzania strumieniowego wielu typów danych: wierzchołków, pikseli i innych.
  • Wsparcie sprzętowe dla DirectX 11.1, w tym model cieniowania Shader Model 5.0
  • Taktowanie rdzenia: do 1000 MHz (dla Radeona HD 7770)
  • 10 jednostek obliczeniowych GCN z 40 rdzeniami SIMD, łącznie 640 jednostek zmiennoprzecinkowych ALU (formaty Integer i Float, obsługa precyzji IEEE 754 FP32 i FP64)
  • 40 jednostek tekstur z obsługą filtrowania trójliniowego i anizotropowego dla wszystkich formatów tekstur
  • Zintegrowana obsługa do sześciu monitorów, w tym HDMI 1.4a i DisplayPort 1.2

Dane techniczne karty graficznej Radeon HD 7770

  • Częstotliwość rdzenia: 1000 MHz
  • Liczba procesorów uniwersalnych: 640
  • Liczba jednostek tekstury: 40, jednostek mieszania: 16
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 1 gigabajt
  • Teoretyczna częstotliwość próbkowania tekstur: 40,0 gigatekseli na sekundę.
  • Jedno złącze CrossFire
  • Magistrala PCI Express 3.0
  • Złącza: DVI Dual Link, HDMI 1.4, dwa Mini-DisplayPort 1.2
  • Pobór mocy: 3 do 80 W
  • Jedno 6-pinowe złącze zasilania
  • Konstrukcja z dwoma gniazdami
  • Sugerowana cena detaliczna w USA: 159 USD

Dane techniczne karty graficznej Radeon HD 7750

  • Częstotliwość rdzenia: 800 MHz
  • Liczba procesorów uniwersalnych: 512
  • Liczba jednostek tekstury: 32, jednostki mieszania: 16
  • Efektywna częstotliwość pamięci: 4500 MHz (4×1125 MHz)
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 1 gigabajt
  • Przepustowość pamięci: 72 gigabajty na sekundę
  • Teoretyczna maksymalna szybkość wypełniania: 12,8 gigapikseli na sekundę.
  • Teoretyczna częstotliwość próbkowania tekstur: 25,6 gigatekseli na sekundę
  • Magistrala PCI Express 3.0
  • Złącza: DVI Dual Link, HDMI 1.4, jeden DisplayPort 1.2
  • Pobór mocy: 3 do 55 W
  • Nie wymaga dodatkowej mocy
  • Konstrukcja z jednym gniazdem
  • Sugerowana cena detaliczna w USA: 109 USD

Tania seria kart graficznych oparta na architekturze GCN różni się od górnej i środkowej linii drugiej cyfry indeksu: dziewiąte miejsce zajęła liczba 7, jak to było wcześniej. Radeon HD 7770 to bardziej produktywne rozwiązanie, ale jest też młodszy model - HD 7750. Starsza płyta nie miała w momencie premiery bezpośrednich konkurentów na rynku, plasując się gdzieś pomiędzy GeForce GTX 560 a GTX 550 Ti. , a młodszy ma na celu walkę z GTX 550 Ti. W przypadku HD 7770 ogłoszono później konkurenta w postaci GeForce GTX 560 SE (wszystkie rozwiązania NVIDIA oparte są na starszych procesorach graficznych).

Oba rozważane modele kart graficznych AMD mają pamięć GDDR5 o tej samej ilości 1 gigabajta. Dzięki zastosowaniu 128-bitowej magistrali pamięci można by na nie umieścić 2 GB pamięci, ale taka ilość pamięci GDDR5 będzie kosztować za dużo jak na ich segment cenowy. Dlatego do tej pory wypuszczano modele z taką objętością, chociaż opcje z 2 GB pamięci wideo mogą zostać wydane w przyszłości. W międzyczasie postanowiliśmy pozostawić ten tom dla HD 7800.

Pod względem innych cech konsumenckich modele HD 7750 i HD 7770 są zupełnie inne. O ile starszy Radeon HD 7770 ma dwuslotową konstrukcję układu chłodzenia, a jego cooler jest przykryty plastikową obudową jak w starszych rozwiązaniach, to młodszy HD 7750 wygląda zauważalnie prostszy, zajmując jedno gniazdo i mając prosty cooler. Jednak większość producentów nadal produkuje płyty według własnych projektów. Pobór mocy nowych modeli w tym przedziale cenowym jest również inny, starszy ma jedno 6-pinowe złącze zasilania pomocniczego, a młodszy zasilany jest przez PCI Express.

Cechy architektoniczne Radeon HD 7700

Podstawowym blokiem nowej architektury jest blok GCN, z którego składane są wszystkie GPU z tej serii. Każdy z dostępnych bloków GCN jest zdolny do samodzielnego planowania i dystrybucji instrukcji, a jedna jednostka obliczeniowa może wykonać do 32 niezależnych strumieni instrukcji. Spójrzmy na schemat blokowy chipa Zielonego Przylądka:

Diagram pokazuje procesor graficzny Radeon HD 7770 (okrojony HD 7750 ma kilka odłączonych jednostek), widzimy 10 jednostek obliczeniowych architektury GCN. W przypadku młodszego rozwiązania z serii Radeon HD 7700 zdecydowano się wyłączyć dwa z nich, a liczba bloków wyniosła 8. Odpowiada to procesorom strumieniowym 640 i 512. A ponieważ każda jednostka GCN ma w swoim składzie 4 jednostki tekstur, ostateczna liczba TMU dla starszego modelu wynosi 40 TMU, a dla młodszego - 32 TMU.

Liczba ROP-ów i kontrolerów pamięci w HD 7770 i HD 7750 jest taka sama, więc postanowiliśmy nie ograniczać zbytnio ROP-ów, pozostawiając ich po 16 sztuk. Ale magistrala pamięci w Republice Zielonego Przylądka została zmniejszona do 128-bitowej, która jest złożona z dwóch 64-bitowych kanałów. Ogólnie jest to trzy razy mniej niż w topowych seriach i widzieliśmy kolejne potwierdzenie, że magistrala pamięci jest tradycyjnie redukowana przede wszystkim w niedrogich układach. Choć zastosowanie szybkiej pamięci GDDR5 pozwoliło na pozostawienie stosunkowo wysokiej (jak na tak niedrogie rozwiązania) przepustowości 72 GB/s.

Pozostaje nam zauważyć dość dużą ilość pamięci podręcznej L2 - aż 512 kilobajtów (w porównaniu do 768 KB dla chipa z najwyższej półki - najwyraźniej pamięć podręczna L2 nie zajmuje zbyt dużo miejsca na chipie), jako ulepszenia wydajności geometrycznej. Podobnie jak topowy chip, Republika Zielonego Przylądka posiada tesselator 9. generacji z wieloma optymalizacjami buforowania i buforowania, aby zapewnić znaczną poprawę wydajności przetwarzania geometrii w porównaniu z serią Radeon HD 6000.

Generalnie nie będziemy powtarzać wszystkich informacji o technologiach AMD, które zostały zaimplementowane i ulepszone w nowych chipach wideo Radeon HD 7000 (tutaj częściowa lista: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, ulepszenia jakości filtrowania tekstur itd. .p.), wszystko to jest opisane bardziej szczegółowo powyżej. Seria HD 7700 obsługuje wszystkie wymienione tam funkcje, w tym AMD Eyefinity 2.0 z sześcioma monitorami i renderowaniem stereo, a także ulepszoną jednostkę dekodowania i kodowania wideo.

Ale co z najważniejszą rzeczą - wydajnością w grach? Pierwsze szacunki szybkości renderowania zawsze można dokonać na podstawie prezentacji producenta. AMD uważa, że ​​Radeon HD 7770 plasuje się gdzieś pomiędzy, odpowiednio, GeForce GTX 560 i GeForce GTX 550 Ti i porównuje go pod względem materiałów z drugim modelem konkurenta.

Ale nie porównują Radeona HD 7750 z niczym, po prostu zauważając, że większość nowoczesnych gier można odtwarzać na tym modelu przy maksymalnych ustawieniach w rozdzielczości FullHD. Nie jest to jednak zaskakujące, ponieważ w ostatnich latach praktycznie nie było wyłączności na PC, a gry wieloplatformowe są znacznie mniej wymagające. Dlatego płyty z serii Radeon HD 7700 są idealne dla niewymagających użytkowników.

Szczegóły: Model Radeon HD 7790

  • Nazwa kodowa chipa: „Bonaire”
  • Technologia produkcji: 28 nm
  • 2,08 miliarda tranzystorów (więcej niż Republika Zielonego Przylądka w Radeonie HD 7700, ale mniej niż Pitcairn w Radeonie HD 7800)
  • Zunifikowana architektura z szeregiem popularnych procesorów do przetwarzania strumieniowego wielu typów danych: wierzchołków, pikseli i innych.
  • Wsparcie sprzętowe dla DirectX 11.1, w tym model cieniowania Shader Model 5.0
  • 128-bitowa magistrala pamięci: dwa 64-bitowe kontrolery z obsługą pamięci GDDR5
  • Częstotliwość rdzenia: 1000 MHz
  • 14 jednostek obliczeniowych GCN z 56 rdzeniami SIMD z łącznie 896 jednostkami ALU zmiennoprzecinkowych (formaty Integer i Float, obsługa precyzji IEEE 754 FP32 i FP64)
  • 56 jednostek tekstur, z obsługą filtrowania trójliniowego i anizotropowego dla wszystkich formatów tekstur
  • 16 ROP z obsługą trybów antyaliasingu z możliwością programowanego próbkowania ponad 16 próbek na piksel, w tym z buforem ramki FP16 lub FP32. Szczytowa wydajność do 16 próbek na zegar, a w trybie bezbarwnym (tylko Z) - 64 próbki na zegar

Dane techniczne karty graficznej Radeon HD 7790

  • Częstotliwość rdzenia: 1000 MHz
  • Liczba procesorów uniwersalnych: 896
  • Liczba jednostek tekstury: 56, jednostki mieszania: 16
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 1 gigabajt
  • Przepustowość pamięci: 96 gigabajtów na sekundę
  • Teoretyczna maksymalna szybkość wypełniania: 16,0 gigapikseli na sekundę.
  • Teoretyczna częstotliwość próbkowania tekstur: 56,0 gigatekseli na sekundę.
  • Jedno złącze CrossFire
  • Magistrala PCI Express 3.0
  • Złącza: DVI Dual Link, HDMI 1.4, dwa Mini-DisplayPort 1.2
  • Pobór mocy: 3 do 85 W
  • Jedno 6-pinowe złącze zasilania
  • Konstrukcja z dwoma gniazdami
  • Sugerowana cena detaliczna w USA: 149 USD

Niedrogi model karty graficznej oparty na nowym chipie o średnim budżecie różni się od poprzedniego topowego modelu podrodziny HD 7700 trzecią cyfrą w indeksie: zamiast 7 umieszczają liczbę 9, co wskazuje na wzrost wydajności. Jednocześnie indeks Radeon HD 7790 wyraźnie wskazuje, że jest to mniej wydajna karta graficzna w porównaniu do linii o jeden stopień wyższej - HD 7800.

Jednak tutaj też nie wszystko jest takie proste – z pewnością będzie mógł się spierać z młodszym HD 7850. Ale zalecana cena Radeona HD 7790 wynosi 149 USD, czyli mniej więcej pośrodku ceny HD 7770 i HD 7850. Jeśli chodzi o rozwiązania konkurenta z tego samego segmentu cenowego, wydanie HD 7790 było wyraźnie zamierzał mieć coś do walki z NVIDIA GeForce GTX 650 Ti, oparty na układzie GK106, plasuje się pomiędzy HD 7770 a HD 7850 pod względem ceny i szybkości. Jednak NVIDIA natychmiast zareagowała na wypuszczenie nowej płyty przez AMD, wypuszczając podkręconą wersję GeForce GTX 650 Ti Boost, która charakteryzuje się większą wydajnością.

Ten model karty graficznej AMD ma pamięć GDDR5 o pojemności zaledwie 1 gigabajta. GPU ma 128-bitową magistralę pamięci i teoretycznie można by dostarczyć 2 GB, ale taka ilość szybkiej pamięci GDDR5 jest nadal zbyt droga jak na ten segment cenowy, a AMD wypuściło model z mniejszą pamięcią, choć może nie być wystarczy dla niektórych nowoczesnych gier nawet przy niskich ustawieniach i rozdzielczościach. Możliwe są jednak również karty wideo od partnerów z 2 GB pamięci wideo.

Podobnie jak modele stojące obok niego w linii, Radeon HD 7790 ma dwuslotową konstrukcję układu chłodzenia, która jest pokryta plastikową obudową. Chociaż większość producentów wciąż wypuszcza płyty z własnym, chłodniejszym projektem, więc referencyjna nie jest tak ważna. Co ciekawe, zużycie energii przez nowy model nie wzrosło znacząco w porównaniu z HD 7770, ale należało się spodziewać poprawy wydajności energetycznej. Nawiasem mówiąc, dlatego nowość ma również tylko jedno 6-pinowe złącze zasilania pomocniczego.

cechy architektoniczne

Nowa karta graficzna Bonaire, na której bazuje wydany Radeon HD 7790, należy do tej samej architektury Graphics Core Next (GCN), którą znamy od półtora roku, ale AMD nazywa ją GCN 1.1, co sugeruje drobne zmiany. W rzeczywistości chip jest architektonicznie prawie taki sam jak poprzednie, chociaż rzeczywiście są pewne drobne zmiany. Na przykład nowa architektura wprowadziła instrukcje przydatne dla architektury heterogenicznej (Heterogenous System Architecture - HSA), obsługę większej liczby jednoczesnych wątków, a także nową wersję technologii AMD PowerTune, o której powiemy później. Ale wszystkich tych zmian nie można nazwać znaczącymi, ponieważ w podstawowych blokach i poprawie ich wydajności nie ma nic nowego.

Dlatego możemy śmiało odwołać się do tego, w którym dokładnie opisano wszystkie cechy nowej architektury Graphics Core Next (GCN), a tutaj powtórzymy tylko najważniejsze cechy i cechy konkretnego produktu. Wszystkie najnowsze procesory graficzne AMD oferują doskonałe funkcje i wydajność zarówno w przetwarzaniu graficznym, jak i innym, w tym w połączeniu tych dwóch. Nowa architektura GCN zapewnia również znaczne uproszczenie zadań związanych z optymalizacją i tworzeniem oprogramowania, przy jednoczesnym zachowaniu wysokiej wydajności.

Jak wiadomo, podstawowym blokiem architektury jest blok GCN, z którego składane są wszystkie GPU z serii Southern Islands. Jednostka obliczeniowa GCN jest podzielona na podsekcje, z których każda działa na własnym strumieniu instrukcji. Bloki GCN mają dedykowaną lokalną pamięć danych 64 KB do wymiany danych lub rozszerzenia stosu rejestrów lokalnych. Ponadto blok ma pamięć podręczną pierwszego poziomu z możliwością odczytu i zapisu oraz pełnoprawny potok tekstur z blokami próbkowania i filtrowania. Każda z dostępnych jednostek GCN jest w stanie samodzielnie planować i dystrybuować polecenia, a jedna jednostka obliczeniowa może wykonywać kilka niezależnych strumieni instrukcji. Spójrzmy na schemat blokowy nowego chipa:

Schemat Bonaire potwierdza cel nowego rozwiązania, jakim jest oferowanie wydajności między Wyspy Zielonego Przylądka, który ma 10 jednostek obliczeniowych GCN, a Pitcairn, który ma 20 jednostek GCN. Te dwa procesory graficzne, wydane w 2012 roku, są prawie o połowę mniejsze od siebie, więc pomiędzy nimi istniała dość duża luka w wydajności, którą teraz wypełnił Bonaire.

Schemat przedstawia procesor graficzny w postaci Radeona HD 7790, który jest kompletnym rozwiązaniem bez wycinania jakichkolwiek bloków. Układ zawiera 14 jednostek obliczeniowych architektury GCN, co odpowiada 896 procesorom strumieniowym. Ponieważ każdy GCN ma 4 jednostki tekstur, całkowita liczba TMU dla nowego modelu wynosi 56 TMU. Oznacza to, że Bonaire jest dokładnie 1,4 razy szybszy niż chip z Zielonego Przylądka pod względem szybkości obliczeń matematycznych i pobierania tekstur, pod warunkiem, że częstotliwość jest równa.

Ale liczba jednostek ROP i kontrolerów pamięci w Bonaire i Radeonie HD 7790 jest podobna do tej, którą widzieliśmy w Republice Zielonego Przylądka i Radeonie HD 7770 - postanowiono pozostawić 16 jednostek ROP, a magistrala pamięci nowego układu jest 128-bitowa , złożony z dwóch kanałów 64-bitowych. Niewielka liczba bloków ROP może być „piętą achillesową” rozwiązania, gdyż zastosowanie szybkiej pamięci GDDR5 umożliwiło zapewnienie stosunkowo dużej przepustowości 96 GB/s, ale na wydajność ROP nic nie da się zrobić.

Ale w nowym GPU poprawiono wydajność geometryczną i szybkość teselacji. Tak, Republika Zielonego Przylądka również ma tesselator 9. generacji, ale Bonaire podwoił też liczbę bloków geometrycznych, rasteryzatorów i procesorów poleceń (oznaczonych na schemacie jako ACE) - teraz są ich dwa. To ulepszenie daje Bonaire możliwość przetwarzania do dwóch prymitywów geometrycznych na zegar – podobnie jak mocniejsze Pitcairn i Tahiti.

Jak pamiętasz, to właśnie w Radeonie HD 7770 AMD po raz pierwszy przyjął ważny psychologiczny próg częstotliwości taktowania GPU, równy 1 GHz. HD 7790 ma więc dokładnie taką samą częstotliwość odniesienia 1 GHz, więc wzrost wydajności w porównaniu do HD 7770 będzie uzasadniony wyłącznie zmianami architektonicznymi i wzrostem liczby jednostek wykonawczych.

Ale częstotliwość pamięci wideo nowości jest znacznie wyższa. Jeśli HD 7770 miał stosunkowo niską częstotliwość pamięci 4,5 GHz, to HD 7790 jest wyposażony w szybką pamięć GDDR5 działającą z częstotliwością 6 GHz, która zapewnia o jedną trzecią większą przepustowość. 33% wzrost przepustowości pamięci wideo w porównaniu z podrodziną Radeon HD 7700 zaowocował wyraźnym wzrostem wydajności w grach. AMD przedstawia ten wykres, porównując liczbę klatek na sekundę HD 7790 z pamięcią działającą z częstotliwością 4,5 i 6,0 GHz:

Maksymalne przyspieszenie wynikające ze wzrostu przepustowości pamięci zostało osiągnięte w grach takich jak StarCraft II i Crysis 2. A średnio 33% wzrost przepustowości pamięci daje około 10% wzrost średniej liczby klatek na sekundę w zestawie nowoczesnych gier. Niezły wskaźnik, pokazujący, że przepustowość pamięci jest w naszych czasach dość ważna, choć nie jest to jedyny nacisk na wydajność. Chociaż jest całkiem możliwe, że przy większej liczbie ROP prędkość Bonaire byłaby jeszcze wyższa...

Oczywiste jest, że średnie zużycie energii nieznacznie wzrosło w porównaniu do HD 7770. Jeśli dla starego modelu wartość ta wynosi 80 W, to dla HD 7790 jest to 85 W - to bardzo niska cena za teoretyczny wzrost mocy o 33-40%! Udoskonalenia architektoniczne (PowerTune), zaprojektowanie nowego GPU na podstawie doświadczeń poprzednich, a także ciągłe doskonalenie procesu technicznego w TSMC – wszystko to doprowadziło do niewielkiego wzrostu zużycia przy znacznej poprawie charakterystyki szybkości.

Jeśli chodzi o powierzchnię chipa i liczbę tranzystorów w Bonaire, to nowy chip jest wyraźnie większy niż Republika Zielonego Przylądka, ale dodanie jednostek obliczeniowych, teksturowych i geometrycznych nie mogło pozostać niezauważone. Zgodnie z tymi parametrami Bonaire znajduje się również mniej więcej pośrodku między Wyspami Zielonego Przylądka a Pitcairn. Bonaire zawiera 2,08 miliarda tranzystorów w chipie 160 mm 2 , dla Republiki Zielonego Przylądka liczby te wynoszą odpowiednio 1,5 miliarda i 123 mm 2 , a dla Pitcairn - 2,8 miliarda tranzystorów i 212 mm 2 powierzchni chipów.

Oczywiście nowy chip obsługuje wszystkie technologie AMD, które zostały wprowadzone i ulepszone w nowej rodzinie Radeon HD 7000 (ich niepełna lista: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, ulepszenia jakości filtrowania tekstur itp.), a wszystko to szczegółowo opisano w artykule AMD Radeon HD 7970: Nowy lider na jednym procesorze. Model HD 7790 obsługuje wszystkie wymienione tam funkcje, w tym AMD Eyefinity 2.0 z sześcioma monitorami i renderowaniem stereo, a także ma ulepszoną jednostkę dekodowania i kodowania wideo.

Ulepszona technologia PowerTune

W 2010 roku AMD wprowadziło technologię PowerTune w swoim chipie Cayman (seria AMD Radeon HD 6900). Ten procesor graficzny był pierwszym, w którym zastosowano dynamiczne zarządzanie energią o nazwie PowerTune. Pozwoliło to na zwiększenie maksymalnych częstotliwości taktowania dla typowych aplikacji, jednocześnie unikając zbyt dużego zużycia energii w specjalistycznych testach stabilności, takich jak FurMark. Następnie technologia została zastosowana w dwuchipowym modelu AMD Radeon HD 6990, który z oczywistych względów potrzebował jej jeszcze bardziej.

Technologia otrzymała dużą aktualizację w połowie 2012 roku, kiedy do AMD PowerTune dodano automatyczne zwiększanie częstotliwości - Boost. W AMD Radeon HD 7970 GHz Edition algorytm ten pozwolił na jeszcze większą poprawę wydajności w porównaniu ze zwykłą wersją karty graficznej. Algorytm działania PowerTune w kartach graficznych bez automatycznego podkręcania wykorzystuje trzy stany: bezczynny (idle), tryb lekkiego obciążenia (low-3D) i pełna prędkość. W HD 7970 GHz dodano do nich tryb podkręcania Boost. PowerTune służy do utrzymania wymaganego zużycia poprzez przełączanie w tryb niższego obciążenia, gdy jest to konieczne. W takim przypadku technologia znacznie zmniejsza wartości częstotliwości zegara. W praktyce takie skoki są rzadkością – ze względu na dużą przerwę między dwoma aktywnymi trybami.

Zmniejszenie taktowania GPU zmniejsza zużycie energii, ale więcej Efektywne zarządzanie napięcie musi zostać zmniejszone. To jest dokładnie to, co robi Radeon HD 7790. Nowy układ graficzny Bonaire ma osiem stanów z różnymi ustawieniami częstotliwości i napięcia, co pozwala na wyższe prędkości zegara niż wcześniej, jednocześnie zapewniając, że GPU zawsze działa z optymalnym napięciem i częstotliwością. Przełączanie między stanami jest oparte na obciążeniu GPU oraz aktualnym poborze mocy GPU.

W nowym algorytmie PowerTune nie musi gwałtownie obniżać częstotliwości po przekroczeniu poziomu zużycia, a wraz z częstotliwością spada również napięcie. Przejścia stanów muszą być jak najszybsze, aby nie przekroczyć limitu zużycia nawet na krótki czas, dlatego Bonaire przełącza stany PowerTune co 10 ms, czyli co sekundę stan chipa zmienia się 100 razy.

Z takimi ciągła zmiana częstotliwości, aplikacje innych firm, takie jak MSI Afterburner i GPU-Z, nie pokażą chwilowych częstotliwości taktowania, ale uśrednią w czasie – tak zwaną „efektywną” częstotliwość. Kolejną interesującą innowacją jest to, że AMD otwiera nowe ustawienia PowerTune dla aplikacje stron trzecich. Partnerzy mogą również ustawić własne ustawienia PowerTune, aby pomóc w tworzeniu fabrycznie przetaktowanych kart graficznych i zapewnić więcej funkcji poza wartościami referencyjnymi AMD. Prawda, różne ustawienia PowerTune może prowadzić do tego, że karty graficzne tego samego modelu różnych producentów będą miały nie tylko różne częstotliwości zegara, ale także algorytm ich zmiany w czasie, co utrudnia porównywanie w tych samych warunkach.

Sprzedaż kart graficznych modelu Radeon HD 7790 rozpoczęła się na rynku już na początku kwietnia 2013 roku. Firma AMD wraz ze swoimi partnerami zorganizowała premierę obu płyt głównych z częstotliwościami referencyjnymi oraz fabrycznymi rozwiązaniami podkręconymi. A teraz obaj producenci wprowadzają na rynek nowe karty graficzne w podobny sposób, z różnymi opcjami szybko dostępnymi od swoich partnerów. W rzeczywistości partnerzy wydali prawie więcej podkręconych wersji HD 7790 niż konwencjonalne, a układy graficzne w nich działają z częstotliwościami około 1075 MHz.

Szczegóły: Model Radeon HD 7990

  • Kryptonim „Malta”
  • Technologia produkcji: 28 nm
  • 2 chipy z 4,3 miliarda tranzystorów każdy
  • Zunifikowana architektura z szeregiem popularnych procesorów do przetwarzania strumieniowego wielu typów danych: wierzchołków, pikseli i innych.
  • Wsparcie sprzętowe dla DirectX 11.1, w tym model cieniowania Shader Model 5.0
  • Podwójna 384-bitowa magistrala pamięci: dwa razy sześć 64-bitowych kontrolerów z obsługą pamięci GDDR5
  • Częstotliwość GPU: 1000 MHz
  • Dwa razy 32 jednostki obliczeniowe GCN, w tym 128 rdzeni SIMD, składające się w sumie z 4096 zmiennoprzecinkowych jednostek ALU (formaty całkowite i zmiennoprzecinkowe, obsługa precyzji FP32 i FP64 w standardzie IEEE 754)
  • 2x128 jednostek tekstur, z obsługą filtrowania trójliniowego i anizotropowego dla wszystkich formatów tekstur
  • 2x32 ROP z obsługą trybów antyaliasingu z możliwością programowanego próbkowania ponad 16 próbek na piksel, w tym w formacie bufora ramki FP16 lub FP32. Szczytowa wydajność do 64 próbek na zegar, a w trybie bezbarwnym (tylko Z) - 256 próbek na zegar
  • Zintegrowana obsługa do sześciu monitorów przez HDMI 1.4a i DisplayPort 1.2

Specyfikacja karty graficznej Radeon HD 7990

  • Częstotliwość rdzenia: 1000 MHz
  • Liczba procesorów uniwersalnych: 4096
  • Liczba jednostek tekstury: 2x128, jednostki mieszania: 2x32
  • Efektywna częstotliwość pamięci: 6000 MHz (4×1500 MHz)
  • Typ pamięci: GDDR5
  • Pojemność pamięci: 2x3 gigabajty
  • Przepustowość pamięci: 2x288 gigabajtów na sekundę
  • Teoretyczna maksymalna szybkość wypełniania: 64 gigapiksele na sekundę.
  • Teoretyczna częstotliwość próbkowania tekstur: 256 gigatekseli na sekundę.
  • Jedno złącze CrossFire
  • Magistrala PCI Express 3.0
  • Złącza: DVI Dual Link, cztery Mini-DisplayPort 1,2
  • Pobór mocy do 375 W
  • Dwa 8-pinowe złącza zasilania pomocniczego
  • Konstrukcja z dwoma gniazdami
  • Zalecana cena dla Rosji to 32 999 rubli. (dla USA - 999 USD).

Już w drugiej generacji kart graficznych AMD zasada nazewnictwa modeli dwuprocesorowych pozostaje niezmieniona. Najlepsze rozwiązanie oparte na dwóch najmocniejszych układach wideo różni się od odpowiedniej klasy modelu poprzedniej generacji pierwszą cyfrą w indeksie: zamiast 6 otrzymało numer 7, wskazujący na nową serię. Zapowiadana karta graficzna różni się od rozwiązania jednoukładowego trzecią cyfrą, wskazującą maksymalną wydajność w ramach generacji.

Jeśli chodzi o porównanie z konkurencją, to dla ogłoszonego dzisiaj modelu Radeon HD 7990 głównym rywalem jest Karta graficzna GeForce GTX 690, wydany prawie rok temu, i to właśnie te dwuukładowe rozwiązania będą musiały ze sobą walczyć. Co prawda nVIDIA ma też jeszcze jedno potężne rozwiązanie, ale już oparte na pojedynczym GPU - GeForce GTX Titan, którego również można uznać za konkurenta omawianej płyty AMD.

Nowa dwuprocesorowa karta graficzna Radeon jest wyposażona w pamięć GDDR5 o pojemności 3 gigabajtów na GPU, co jest zasługą 384-bitowej magistrali pamięci układów Tahiti. Taka głośność jest całkiem uzasadniona jak na produkt o tak wysokim poziomie, ponieważ w niektórych nowoczesnych aplikacjach do gier z maksymalnymi ustawieniami, włączonym antyaliasingiem i wysokimi rozdzielczościami mniejsza ilość pamięci (2 gigabajty na chip lub mniej) może już nie być wystarczająco. A tym bardziej dotyczy to renderowania w trybie stereo lub na wielu monitorach w trybie Eyefinity.

Oczywiste jest, że tak potężna dwuukładowa karta graficzna ma ogromny system chłodzenia z dwoma gniazdami, który różni się od tradycyjnych chłodnic kart AMD. Posiada masywny radiator ukryty pod osłoną z trzema dużymi wentylatorami pracującymi ze stosunkowo niską prędkością. Pobór mocy karty dual-GPU jest dość wysoki z oczywistych powodów i ma ona dwa 8-pinowe złącza zasilania, ale przynajmniej nie jest to trzy, jak miało to miejsce w przypadku niereferencyjnych próbek opartych na dwóch chipach Tahiti.

Architektura

Ponieważ karta graficzna o nazwie kodowej „Malta” jest oparta na dwóch procesorach graficznych „Tahiti” z rodziny Southern Islands, możesz po prostu się do niej odnieść, która dokładnie opisuje wszystkie cechy obecnej architektury Graphics Core Next (GCN). W materiałach bazowych powtarzamy tylko najważniejsze cechy i cechy konkretnych produktów.

Podstawowym blokiem architektury jest blok GCN, z którego składane są wszystkie GPU z serii. Jednostka obliczeniowa podzielona jest na podsekcje, z których każda działa na własnym strumieniu poleceń, posiada dedykowaną lokalną pamięć na dane, pamięć podręczną pierwszego poziomu z możliwością odczytu i zapisu oraz pełnoprawny potok tekstur z jednostki do pobierania próbek i filtrowania. Każdy z bloków GCN może samodzielnie planować i dystrybuować polecenia, a jeden blok obliczeniowy może wykonywać kilka niezależnych strumieni poleceń. Radeon HD 7990 wykorzystuje dwa znane nam już chipy Tahiti:

Schemat procesora graficznego (w Radeonie HD 7990 są dwa) pokazuje 32 jednostki obliczeniowe architektury GCN i wszystkie są aktywne. Wcześniej zakładano, że w przypadku rozwiązania dwuchipowego część z nich będzie musiała zostać wyłączona, a nawet obniżona częstotliwość, aby wprowadzić pobór mocy 375 W, ale inżynierom AMD udało się z powodzeniem rozwiązać to trudne zadanie. Być może została wydana specjalna nowa wersja Tahiti z niższym zużyciem energii lub chipy przechodzą bardzo rygorystyczną selekcję.

Ponieważ każda jednostka GCN ma 16 jednostek tekstur, liczba TMU wynosi 128 jednostek na chip, co daje całkowitą wydajność 256 gigatekseli na sekundę, co jest bardzo dobrym wynikiem dla konkurenta GeForce GTX 690. Liczba jednostek ROP i kontrolerów pamięci w HD 7990 również nie zmienił się w porównaniu do swojego jednoukładowego odpowiednika, zostały odpowiednio 32 i 6 sztuk na GPU. Radeon HD 7990 ma podwójną 384-bitową magistralę pamięci złożoną z dwunastu 64-bitowych kanałów, co daje łączną przepustowość pamięci 576 GB/s, kolejny rekord.

Pod każdym innym względem nowa płyta obsługuje wszystkie nowoczesne technologie AMD, które zostały wprowadzone i ulepszone w nowych układach wideo Radeon HD 7000: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, ulepszona jakość filtrowania tekstur itp. Wszystko to szczegółowo opisano powyżej w opisie Radeona HD 7970 i po prostu nie ma sensu tego powtarzać.

Układ chłodzenia i zużycie energii

W przypadku tak poważnych płyt dwuchipowych szczególnie ważny staje się wysoce wydajny system chłodzenia. O ile w przypadku rozwiązań partnerów opartych na dwóch Tahiti zastosowano rozwiązania trzyslotowe, a w przypadku ASUS ARES II nawet chłodzenie wodne, to w tym przypadku trzeba było poradzić sobie z mniejszym wysiłkiem, więc zaprojektowano chłodnicę, która ma bardzo masywny radiator i trzy wentylatory o ulepszonych właściwościach akustycznych.

Hałas systemu chłodzenia i temperatura procesorów graficznych to jedne z najważniejszych cech konsumenckich każdej karty graficznej, w tym topowego rozwiązania przeznaczonego dla entuzjastów. Zbyt głośny lub nieefektywny system chłodzenia będzie postrzegany przez kupujących jako mniej opłacalny zakup, podczas gdy inne rzeczy (w przybliżeniu) nie zmienią się. Dlatego AMD potraktowało ten problem bardzo poważnie w przypadku Radeona HD 7990 w porównaniu z innymi topowymi rozwiązaniami na rynku. Rozważ właściwości akustyczne nowego systemu:

Diagram pokazuje poziom hałasu z trzech różnych kart graficznych: Radeona HD 7990 i dwóch konkurentów: dwuprocesorowego GeForce GTX 690 i jednoukładowego GTX Titan firmy NVIDIA. Ponadto hałas mierzono w różnych warunkach - w trybie jałowym (System Idle) oraz przy maksymalnym obciążeniu za pomocą Furmarka. Według danych AMD nawet jednoukładowy Titan nie dorównuje swojemu nowemu produktowi pod względem niższego poziomu hałasu, nie wspominając dwuukładowy GTX 690, czyli najgłośniejszy w tym porównaniu.

Ale czy nie osiągnięto tak imponującej wydajności akustycznej ze szkodą dla temperatury GPU? Poniższy wykres pokazuje temperatury GPU mierzone na Radeonie HD 7990 AMD i tych samych dwóch konkurentach. Tym razem AMD podczas testów w Furmark korzystało tylko z trybu wysokiego obciążenia.

I znowu, „sprytna” oś współrzędnych jest używana z początkiem nie z zerowa wartość. Rzeczywista różnica między 80 a 82 stopniami dla Radeona HD 7990 i GTX Titan będzie praktycznie niezauważalna, choć 87 stopni dla GTX 690 wyraźnie odstaje na gorszym poziomie. Ponownie zauważamy, że wszystkie te testy zostały przeprowadzone przez zainteresowaną stronę i podlegają niezależnej weryfikacji.

Pod względem zużycia energii rozwiązanie dwuchipowe nie jest niczym nowym, ale wsparcie dla wcześniej zapowiedzianej technologii ZeroCore Power też jest tutaj. Ta technologia pomaga uzyskać znacznie niższe zużycie energii w trybie „głębokiego bezczynności” (lub „uśpienia”) przy wyłączonym urządzeniu wyświetlającym. W tym trybie bezczynny procesor graficzny jest prawie całkowicie wyłączony i zużywa mniej niż 5% mocy trybu pełnego, wyłączając większość bloków funkcjonalnych. A w przypadku płyty dwuprocesorowej jeszcze ważniejsze jest to, że w systemie CrossFire, podczas rysowania dwuwymiarowego interfejsu systemu operacyjnego, wszystkie GPU, z wyjątkiem głównego, w ogóle nie działają. Oznacza to, że w przypadku Radeona HD 7990 jeden z chipów w trybie 2D zostanie zanurzony w głębokim śnie przy minimalnym zużyciu energii, a drugi może „zasnąć” w trybie głębokiego bezczynności komputera.