집 수리하다 장치 amd radeon hd 7800 시리즈에 대한 설명입니다. 비디오 카드 제품군 AMD Radeon 참조 정보. 소개. 추정가

장치 amd radeon hd 7800 시리즈에 대한 설명입니다. 비디오 카드 제품군 AMD Radeon 참조 정보. 소개. 추정가

2/5페이지

"남쪽 제도"

먼저 AMD의 최신 제품 라벨링에 대해 간략히 알아보겠습니다. 제조사는 성능에 따라 3단계로 나눴다. 코드 이름 "Cape Verde"는 Radeon HD 7700을 나타냅니다. "Pitcairn"이라는 이름은 오늘의 참가자를 숨깁니다. 라데온 테스트 HD 7870 및 HD 7850. 고성능 제품을 "Tahiti" 또는 Radeon HD 7900이라고 합니다. 이는 아래에서 보다 명확하게 표시됩니다.

보급형 = Cape Verde = Radeon HD 7700 시리즈;
주류 = Pitcairn = Radeon HD 7800 시리즈;
고성능 제품 = Tahiti = Radeon HD 7900 시리즈.

즉, 현재 AMD는 28nm 그래픽 칩으로 모든 시장 부문을 커버했습니다. Tahiti 칩을 기반으로 하는 듀얼 코어 비디오 카드의 출시만 예상됩니다. 가명 라데온 HD 7990.

시리즈 특징 AMD 라데온 HD 7800

Radeon HD 7800 그래픽 프로세서(Pitcairn)에는 약 28억 개의 트랜지스터와 Graphic Core Next 마이크로아키텍처가 있습니다. 위에서 언급했듯이 Radeon HD 7850 칩(Pitcairn Pro)에는 16개의 컴퓨팅 장치가 있으며 최대 TDP는 130와트입니다. Radeon HD 7870(Pitcairn XT)의 경우 이 수치는 각각 20과 175입니다.

아래 슬라이드는 Radeon HD 7850 및 HD 7870 비디오 카드의 주요 사양을 보여줍니다.

2GB의 GDDR5 메모리는 이미 대부분의 중급 및 고급 모델의 표준이 되고 있습니다. 256비트 덕분입니다. 버스 및 1200MHz(4800MHz 유효)의 높은 클록 주파수에서 대역폭은 154GB/s입니다. 이것은 고해상도와 화질이 있는 게임의 성능에 긍정적인 영향을 미칩니다.

PCI 익스프레스 3 인터페이스

2011년 하반기에 거의 모든 마더보드 제조업체는 3세대 PCI Express 인터페이스가 있는 마더보드 모델을 발표했습니다. Radeon HD 7000 시리즈가 출시되면서 이 인터페이스가 있는 비디오 카드도 등장했습니다. PCI Express 3는 이전 세대 PCI Express의 대역폭(32Gb/s)의 두 배입니다. PCIe 2에 비해 레인당 처리량이 500Mb/s에서 1Gb/s로 두 배 증가했습니다.

당연히 새로운 PCIe 3를 활용하려면 비디오 카드와 마더보드이 인터페이스는 물론 프로세서의 지원도 지원합니다(Ivy Bridge 제품군의 모든 모델이 PCIe 3을 지원하지는 않음).

아이피니티 2.0

AMD는 여러 모니터에 이미지를 표시하도록 설계된 Eyefinity 기술로 한 걸음 더 나아갔습니다. HD 7000 시리즈의 높은 처리 능력과 Eyefinity 2.0 지원 덕분에 이제 총 해상도 16000 x 16000의 여러 모니터에 이미지를 표시할 수 있습니다. 이를 통해 해상도로 5개의 디스플레이에 이미지를 표시할 수 있습니다. 가로 방향으로 설정된 2560x1600의 크기입니다. 이러한 해상도로 작업하기 위해 레코드 3GB GDDR5(HD 7970 및 HD 7950)가 제품군의 이전 모델에 설치됩니다.

AMD Catalyst 드라이버는 2월부터 사용자 지정 해상도를 지원합니다. 즉, Eyefinity의 디스플레이 구성에 따라 필요한 해상도를 설정할 수 있습니다. Catalyst 12.2부터 시작 메뉴를 예전처럼 맨 왼쪽이 아닌 편리한 디스플레이로 설정하는 옵션이 있습니다. 또한 Eyefinity 2는 스테레오 HD3D 출력을 지원합니다. 3D 모드에서 작동하는 3개의 모니터 조합을 지원합니다.

테셀레이션 개선

AMD의 Radeon HD 7000 제품군 그래픽 카드는 9세대 테셀레이터를 특징으로 하며 오늘날 게임에서 기하학 처리에서 상당한 성능 향상을 보였습니다. GCN 코어에는 여전히 두 개의 그래픽 엔진이 포함되어 있지만 이전에 테셀레이션 및 래스터화를 위한 블록이 포함되어 있었다면 이제는 형상 및 픽셀을 처리하도록 설계된 임의의 수의 파이프라인으로 구성됩니다.

AMD Radeon HD 7800 그래픽 카드는 HDMI 1.4a 인터페이스를 지원하여 120Hz(각 눈당 60Hz)의 사진을 출력할 수 있어 3D 이미지를 표시할 수 있습니다. 이전 버전의 HDMI에서는 이것이 불가능했습니다. 12월부터 AMD는 HD3D와 Eyefinity가 드라이버에서 함께 작동할 수 있도록 지원했습니다.

다이렉트X 11.1

Radeon 7000 제품군의 비디오 카드는 곧 출시될 DirectX 11.1을 지원합니다. DX 11.1이 Windows 8과 함께 출시될 것이기 때문에 이것이 실제로 무엇을 줄 것인지 말하기에는 너무 이릅니다. 새 API의 주요 이점은 다음과 같습니다.

독립적인 래스터화;
그래픽 컴퓨팅과 비디오 처리의 유연한 결합
기본 스테레오 3D 지원.

AMD 통합 비디오 디코더

하드웨어를 나타냅니다. GPU비디오 스트림 디코딩을 담당하는 AMD. Radeon 7000 시리즈에서 UVF는 일부 개선되었습니다. 일반적으로 UVD는 H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV 프로필 D, MVC(Multi-View Codec), 비디오 코덱 엔진에 대한 지원과 같이 이전 제품의 모든 기능을 유지했습니다. ( VCE), AMD 스테디 비디오 2.0. 듀얼 스트림 HD+HD 형식에 대한 지원이 추가되었습니다.

사이트에 등록할 때 문제가 있습니까?여기를 클릭하십시오! 우리 사이트의 매우 흥미로운 섹션인 방문자 프로젝트를 지나치지 마십시오. 거기에서 항상 최신 뉴스, 농담, 일기예보(ADSL 신문), 방송 및 ADSL-TV 채널의 TV 프로그램, 첨단 기술 세계의 가장 흥미로운 최신 뉴스, 가장 독창적이고 놀라운 사진을 찾을 수 있습니다. 인터넷에서 최근 몇 년 동안 잡지의 큰 아카이브 , 사진의 식욕을 돋우는 요리법 , 유익한 정보 . 섹션은 매일 업데이트됩니다. 필수 프로그램 섹션에서 일상적으로 사용할 수 있는 최고의 무료 프로그램을 항상 최신 버전으로 제공합니다. 일상 업무에 필요한 거의 모든 것이 있습니다. 더 편리하고 기능적인 무료 버전을 위해 불법 복제 버전을 점차적으로 버리십시오. 여전히 채팅을 사용하지 않는 경우 채팅에 익숙해지는 것이 좋습니다. 그곳에서 많은 새로운 친구들을 찾을 수 있을 것입니다. 또한 프로젝트 관리자에게 연락하는 가장 빠르고 효율적인 방법입니다. 바이러스 백신 업데이트 섹션은 계속 작동합니다. Dr Web 및 NOD에 대한 무료 업데이트는 항상 최신 상태입니다. 읽을 시간이 없었습니까? 티커의 전체 내용은 이 링크에서 확인할 수 있습니다.

AMD Radeon HD 7870 비디오 카드 리뷰 플래그십에 대한 저렴한 대안

가장 최근에 AMD의 새로운 7,000번째 비디오 카드 라인인 Radeon HD 7970 및 Radeon HD 7950의 최상위 비디오 카드에 대해 말씀드렸습니다. 하지만 아시다시피, 탑만으로는 성공할 수 없습니다. 따라서 더 저렴하지만 여전히 생산적인 라인인 AMD Radeon 7800 시리즈에 대해 이야기할 때입니다.

소개. 추정가

AMD Radeon HD 7870 비디오 카드는 350달러부터 시작하는 가격으로 매장에서 판매되어야 합니다(우리의 경우 중앙 은행 환율에 따라 루블로 변환해야 함). "동생"인 AMD Radeon HD 7850의 권장 가격은 250달러입니다. 러시아에서는 가격이 항상 약간 높을 것임을 이해해야합니다 (price.ru에 따르면, 약 견적 요청: AMD Radeon HD 7870 0903 3 7870 이상 견적 요청: AMD Radeon HD 7850 0903 3 7850). 따라서 이 그래픽 카드 중 하나를 구입한다고 가정할 때 매번 약 $50-$80 더 지출할 것으로 예상됩니다. 그러나 러시아 시장의 마크 업을 고려하지 않더라도 각 비디오 카드의 비용은 매우 높으며 그 정도의 돈으로 구매자는 매우 높은 성능을 기대할 것입니다. 이 카드 중 하나를 구입하여 얻을 수 있는 것을 알아보겠습니다.

아키텍처 7800 시리즈

7800 하위 라인은 Pitcairn이라는 새로운 GPU 코드명을 기반으로 합니다.

이 GPU는 가격 대비 성능이 매우 매력적입니다. 대부분의 7900 라인 비디오 카드 구매자의 경우 성능이 과도하며 모든 사람이 초과 지불을 원하는 것은 아닙니다. 더 많은 돈그들이 차이를 보지 못한다면. 결과적으로 HD 7700 비디오 카드는 인기 있는 1920x1080 해상도의 최대 설정에서 편안한 게임을 하기에는 너무 약할 수 있습니다.

이것은 AMD Radeon HD 5850 그래픽 카드의 역사와 약간 비슷합니다.

이거 기억나? 단순히 BIOS를 플래싱하는 것만으로는 HD 5870으로 전환할 수 없음에도 불구하고 최적의 매개변수로 인해 구매자의 사랑을 받아 적절한 가격을 유지하면서 최대 설정에서 최신 게임을 실행할 수 있었습니다. 현재 세대의 HD 7800 비디오 카드가 이 틈새를 충분히 채울 수 있습니다.

새로운 GPU는 20개의 GCN(Graphic Core Next) 컴퓨팅 유닛을 탑재합니다. 최고급 Radeon HD 7970 비디오 카드가 장착된 Tahiti GPU에는 32개가 있었으며 각 컴퓨팅 장치에는 4개의 벡터 장치가 있고 각 벡터 장치에는 차례로 16개의 스칼라가 있습니다.

따라서 새 GPU의 총 컴퓨팅 모듈 수는 1280개입니다. ROP(래스터화 단위)의 수는 변경되지 않았으며 32와 동일하게 유지됩니다. GPU 클록 주파수는 1000MHz입니다. 비디오 메모리의 양은 2048MB GDDR5입니다. 클록 주파수 1200(4800 유효) MHz. 메모리 버스 256비트. 이러한 모든 특성은 하위 시리즈의 이전 비디오 카드인 HD 7870에 유효합니다.

Radeon HD 7850의 남동생은 약간만 다듬어진 동일한 GPU를 갖추고 있습니다. 컴퓨팅 장치가 절단되고 그 수는 16개로 줄었습니다. 따라서 주니어 비디오 카드에는 1024개의 컴퓨팅 모듈만 탑재되어 있습니다. Tahiti GPU에 있는 숫자의 정확히 절반입니다. 따라서 텍스처 처리 장치도 더 적고 64개가 남아 있습니다. GPU의 클럭 주파수는 860MHz입니다. 다른 특성은 변경되지 않았습니다(Radeon HD 7870에 비해).

따라서 위에서 언급했듯이 Pitcairn GPU는 GCN(Graphics Core Next) 아키텍처를 기반으로 합니다. 이것은 그가 Tahiti(7900 시리즈)로부터 모든 솔루션을 물려받았다는 것을 의미합니다. 새로운 GPU는 28nm 공정을 기반으로 합니다. 비디오 카드에는 PCI-E 3.0(Gen3)이 장착되어 있습니다. 에너지 절약 기술 AMD PowerTune 및 AMD ZeroCore Power도 사라지지 않았습니다. AMD Eyefinity 2.0 기술을 통해 최대 전체 해상도 16384x16384로 여러 디스플레이를 연결할 수 있습니다. 3D 지원은 AMD HD3D 기술에 의해 제공되고 구현됩니다. AMD는 또한 GPU를 사용하여 전체 시스템의 성능을 향상시키는 기술을 계속 개발하고 있습니다. 이 경우 비디오 카드의 하드웨어에 의해 비디오 인코딩을 가속화하여 중앙 프로세서를 크게 돕고 데이터 처리에 필요한 시간을 줄이는 VCE(Video Codec Engine) 기술을 사용할 것을 제안합니다.

위의 슬라이드는 Pitcairn GPU가 형들로부터 모든 장점을 완전히 물려받았음을 확인합니다. 또한 7700 라인도 기능이 부족하지 않지만 다음 기사에서 이에 대해 자세히 설명합니다.

AMD의 슬라이드로 판단하면, 새로운 비디오 카드는 적당한 취향을 가지고 있습니다. 구형 HD 7870은 부하에서 175와트를 소비하지 않습니다. 더 어린 HD 7850 카드의 TDP는 130와트입니다. 유휴 모드에서 디스플레이가 꺼지면 그래픽 카드는 3와트 미만을 소비합니다.

슬라이드의 그래프는 설득력 있어 보입니다. AMD는 거의 2배의 성능 향상을 약속합니다. 그러나 이것은 그다지 놀라운 일이 아닙니다. CrossFireX 모드는 항상 잘 확장되었습니다. 여기서 드라이버가 큰 역할을 합니다. 적어도 여기에서는 모든 것이 정상적이어서 기쁩니다. 이것에 대해 우리는 비디오 카드의 구조에 대한 연구를 시작합니다.

AMD 라데온 HD 7870

평소와 같이 외관 검사부터 시작한 다음 냉각 시스템 분해 및 연구로 넘어갑니다. 인쇄 회로 기판그리고 그것에 대한 요소.

비디오 카드의 모양은 절대적으로 전통적이며 알아볼 수 있습니다. 짐작하셨겠지만 실험실에서 참조 엔지니어링 샘플을 받았습니다. 보드의 길이는 245mm입니다. 지금까지 냉각 시스템에 대해 말할 수 있는 것은 단 한 가지뿐입니다. 터빈을 사용하여 케이스에서 뜨거운 공기를 불어냅니다. BIOS 칩 간의 스위치가 사라진 것을 볼 수도 있습니다. 사실 앞을 내다보면 두 번째 BIOS 칩도 사라졌다고 말씀드리고 싶습니다. 이제부터 비디오 카드를 깜박일 때 다시 시작하지 않을 위험이 있습니다. 대부분은 이것이 마이너스라고 생각할 것입니다. 그러나 얼마나 자주 비디오 카드를 플래시합니까? 특히 코어가 동시에 잠금 해제되지 않은 경우? 글쎄요, 자주는 아닌 것 같아요. 그리고 대부분의 사용자에게는 이러한 기능이 없으면 제품 비용이 감소하기 때문에 이것은 플러스입니다.

CrossFireX 커넥터는 하나만 볼 수도 있습니다. 이것은 우리가 2개의 비디오 카드만 직렬로 결합할 수 있음을 의미합니다. 상황은 위에서 논의한 칩 및 BIOS 스위치와 유사합니다. 얼마나 많은 사용자가 3개 이상의 비디오 카드를 번들로 제공합니까? 그런 사람들은 특히 최고급 비디오 어댑터를 사용하지 않는 사람들 사이에서 절대적인 소수라고 생각합니다. 동시에, 그것의 부재는 제품의 최종 비용을 다시 줄입니다.

뒷면에는 눈에 띄는 것이 없으며 계속 진행합니다.

케이스에서 뜨거운 공기를 불어내기 위한 그릴 아래에는 일반적인 장소에 DVI 1개, HDMI 1개, miniDP 2개 등 4개의 비디오 출력이 있습니다.

비디오 카드에는 2개의 추가 전원 커넥터가 장착되어 있습니다. 이렇게 하면 GPU에 적용되는 전압을 높여 오버클러킹에 도움이 될 수 있습니다. 이러한 경우 에너지 소비가 크게 증가합니다.

더 나은 열 전달을 위해 방열판과 GPU 사이의 접촉 위치와 인접 영역은 구리로 만들어졌습니다. 3개의 구리 히트 파이프가 방열을 돕습니다.

누군가가 참조 HD 6870의 보드가 어떻게 생겼는지 기억한다면 그들은 이미 어딘가에서 본 느낌으로 나를 이해할 것입니다. 실제로 레퍼런스 HD 6970에는 요소 배열이 매우 유사한 보드가 사용되었습니다.

PCB 중앙에는 기판에 대해 45도 회전된 Pitcairn XT GPU 자체가 있습니다.

GPU 주변에는 T2C라고 표시된 8개의 하이닉스 비디오 메모리 칩이 있습니다. 이는 이 칩이 최대 5000MHz의 주파수에서 작동할 수 있음을 의미합니다.

전원 하위 시스템의 핵심은 CHIL CHL 8225G 칩입니다. GPU 전원 하위 시스템은 5단계입니다. 전원 위상의 위치에 주의하십시오. 비디오 메모리 전원 하위 시스템당 위상이 하나씩 있습니다. 인쇄 회로 기판은 신중하고 깔끔하게 보이며 마지막 순간에 "무릎에" 했다는 느낌이 없습니다.

여기에서 Radeon HD 7870 보드에 대한 소개를 마치고 Radeon HD 7850에 대한 연구로 넘어갑니다.

라데온 HD 7850

이것이 Radeon HD 7850 비디오 카드의 남동생임을 상기시켜 드리겠습니다.

외부에서 비디오 카드는 형과 다르지 않습니다.

그리고 여기에는 유일한 추가 전원 커넥터를 제외하고는 차이점이 없습니다. HD 7850은 130와트만 소비하고 HD 7870은 175와트를 소비하므로 단일 6핀 커넥터로 충분합니다. 가장 중요한 것은 이것이 카드의 오버클럭 가능성에 대한 흔적을 남기지 않는다는 것입니다.

또한 HD 7850과 차이가 없습니다. 우리는 1개의 DVI, 1개의 HDMI 및 2개의 miniDP를 마음대로 사용할 수 있습니다.

냉각 시스템은 Radeon HD 7870의 것과 다르지 않습니다. GPU와 냉각 시스템 사이의 접촉 지점에 구리 베이스가 제공되고 효율적인 열 분산을 위해 3개의 구리 히트 파이프가 제공됩니다.

예상대로 두 비디오 카드의 인쇄 회로 기판도 완전히 동일합니다. 납땜 요소의 차이는 관찰되지 않습니다. 유일한 차이점은 GPU 전원 하위 시스템의 "절단" 단계입니다. 공칭 값에서 안정적인 작동을 위해서는 이 정도면 충분하지만 GPU가 오버클러킹에서 어떻게 표시되고 얼마나 안정적일지는 또 다른 문제입니다.

그리고 여기에 HD 7850 - AMDPitcairnPRO GPU의 핵심이 있습니다. 중국에서 제조되었으며 1024개의 컴퓨팅 모듈을 탑재하고 있습니다. 회상: 비디오 카드 Radeon HD 6850에는 960개의 컴퓨팅 모듈이 있습니다. 새로운 아키텍처를 고려하지 않고 숫자만 보면 격차가 그렇게 크지 않습니다.

이 카드의 인쇄 회로 기판에는 총 용량이 2GB인 8개의 비디오 메모리 칩이 납땜되어 있습니다. 한 칩의 밀도는 각각 256MB입니다. 표시는 변경되지 않았으며 5000MHz의 공칭 주파수에 해당하는 "T2C"를 읽습니다. 이 바가 오버클럭에서 극복되었으면 하는 바램입니다.

Radeon HD 7800 시리즈의 대체 버전

항상 그렇듯이 대부분의 제조업체는 기준 냉각 시스템에서 벗어나 고유한 시스템을 제공하기를 원할 것입니다. 정확히 무엇인지 봅시다.

ASUS HD 7870 및 HD 7850

잘 알려진 DirectCU II 냉각 시스템을 사용하여 ASUS에서 제조한 비디오 카드는 외관상 거의 차이가 없지만 이것이 중요한 것은 아닙니다. 가장 중요한 것은 제조업체가 참조 버전에 비해 최대 20% 향상된 성능을 약속한다는 것입니다.

Club3D HD 7870 및 HD 7850

Club3D는 재고에서 멀리 가지 않기로 결정했습니다. Radeon HD 7870은 레퍼런스와 별반 다를 바 없어 보입니다. 남동생은 분명히 하나의 히트 파이프와 팬이 있는 GPU용 히트싱크를 개인적으로 얻었습니다. 동시에 나머지 요소의 냉각에 문제가 없다면 모든 것이 정상입니다.

기가바이트 HD 7870 및 HD 7850

Gigabyte는 7800 시리즈에 자체 냉각 시스템을 장착하고 클럭 속도를 높이기로 결정했습니다. 비디오 카드 HD 7850은 2개의 팬이 있는 냉각 시스템으로 만족하는 반면 Radeon HD 7870은 3개의 팬이 있는 냉각 시스템을 갖추고 있습니다. 외부 적으로는 케이스 외부의 뜨거운 공기 제거와 관련된 잘 알려진 문제를 제외하고는 불평 할 것이 없습니다.

HIS HD 7870 및 HD 7850

HIS는 신제품에 독자적인 IceQ X 냉각 시스템을 탑재했으며, 이러한 CO는 항상 우수한 효율성으로 유명했습니다. 더 젊은 비디오 카드에는 두 개의 히트 파이프만 있고 구형 비디오 카드에는 4개 모두가 있습니다.

MSI HD 7870 및 HD 7850

TwinFrozr III 냉각 시스템은 매우 효율적인 것으로 간주되지만 항상 가격표를 인상합니다. 다음으로 높은 성능의 그래픽 카드를 사용하는 것이 더 쉬운 경우가 종종 있습니다. 그러나 아무도 고효율 및 낮은 소음 수준의 이점을 취소하지 않았습니다.

PowerColor HD 7870 및 HD 7850

PowerColor는 두 가지 버전의 Radeon HD 7870과 하나의 Radeon HD 7850을 출시했습니다. 가장 어린 HD 7850은 겉보기에는 표준 냉각 시스템으로 만족할 것입니다. HD 7850은 전력 소비가 매우 낮고 그에 따라 열 방출이 적기 때문에 이것은 무섭지 않습니다. HD 7870의 경우 기준 버전과 PCS + 냉각 시스템이 있는 버전의 두 가지 버전이 준비되어 있습니다.

사파이어 HD 7870 및 HD 7850

Sapphire에서 제조한 비디오 카드에는 독점 FleX와 매우 유사한 냉각 시스템이 장착됩니다. 우리는 이미 유사한 비디오 카드를 테스트했으며 훨씬 더 뜨거운 온도에서도 온도가 합리적인 한도 내에서 유지되었기 때문에 이러한 CO의 효과를 의심할 이유가 없습니다.

XFXHD 7870

XFX는 현재 구형 비디오 카드인 Radeon HD 7870만 선보이고 있으며 2개의 팬이 장착될 예정입니다. 우리는 이미 이 제조업체의 7900 시리즈 비디오 카드에서 유사한 디자인을 보았습니다.

사양표



공정 기술, nm
스트림 프로세서, PC
ROP(래스터화 장치), PC
GPU 주파수, MHz
비디오 메모리 주파수, MHz
비디오 메모리 크기, MB
비디오 메모리 버스, 비트
지원되는 DirectX 버전
비용, 문지름*	견적 요청: HD 7870 0903 3	견적 요청: 7850 0903 3	견적 요청: 6970 0903 3	견적 요청: 7950 0903 3

*모스크바 가격 www.price.ru

오버클럭 및 온도

가장 어린 비디오 카드인 Radeon HD 7850부터 시작하겠습니다.

공칭 클럭 속도는 GPU의 경우 860MHz이고 비디오 메모리의 경우 1200(4800 유효) MHz입니다. 참조의 냉각 시스템은 자신감을 불러일으키므로 성공적인 오버클럭킹을 안전하게 신뢰할 수 있습니다.

전압을 높이지 않고 비디오 카드는 GPU의 경우 1025MHz, 비디오 메모리의 경우 1375(5500)MHz로 오버클럭되었습니다. 좋은 결과입니다. 팬 속도는 40%였습니다. 값이 높을수록 스탠드 옆 작업이 불가능했습니다. 그래도 7천 시리즈의 비디오 카드는 진공 청소기로도 비교할 수 없고 더 조용합니다. 물론 액면 그대로 모든 것이 정상이며 비디오 카드는 유휴 상태에서 들리지 않습니다. 그러나 그것을 분산시키고 수동으로 속도를 풀면 그뿐입니다. 불을 끄십시오.

구형 HD 7870 비디오 카드의 공칭 주파수는 비디오 프로세서의 경우 1000MHz이고 비디오 메모리의 경우 1200(4800)MHz입니다.

더 어린 비디오 카드의 경우와 마찬가지로 쿨러 속도를 40%까지 올려 온도를 낮추는 데 도움이 되었습니다. 비디오 프로세서는 1120MHz의 주파수에서 안정적으로 작동할 수 있었습니다. 그러나 비디오 메모리는 매우 화가 납니다. 불행히도 그녀는 더 높은 주파수에서 안정적으로 작동하지 못했습니다. 아마도 이것은 특별한 경우이고 우리는 운이 없었습니다. 아마도 비디오 메모리 칩 중 하나가 최상의 상태가 아니었을 것입니다.

두 신제품의 작동 온도는 실질적으로 명목상 서로 다르지 않습니다. 이전 비디오 카드 HD 7870은 예상대로 부하가 걸리면 몇 도 정도 손실됩니다. 이는 정상입니다. 오버클럭 중에는 냉각 속도가 최대 40% 증가하여 온도가 낮아집니다. 동시에 HD 7950은 훨씬 더 뜨거운 비디오 카드로 판명되었습니다. 그러나 방열면에서 HD 6970과 경쟁할 수 있는 사람은 없으며 이전 세대의 비디오 카드에 걸맞게 모든 테스트 참가자 중 가장 핫한 비디오 어댑터입니다.

경쟁사

성능을 비교하기 위해 AMD Radeon HD 7950 및 AMD Radeon HD 6970의 두 가지 비디오 카드를 사용했습니다.

AMD 라데온 HD 7950

오늘날 AMD에서 두 번째로 강력한 비디오 카드는 단일 칩 카드에 반대합니다. 우리는 이미 이 비디오 카드에 대해 이야기했습니다. 새 항목이 배경에 대해 어떻게 작동할지 궁금합니다. HD 7950 비디오 카드 측면에서 메모리 양은 3GB이고 스트림 프로세서 수는 1792개입니다.

AMD 라데온 HD 6970

이 비디오 카드는 이전 세대의 TOP입니다. 그것은 현대 게임에 충분한 고성능을 가지고 있습니다. 물론 2560 x 1600의 해상도에서는 특별한 것이 없지만 이러한 모드에서는 더 강력한 비디오 카드도 구부러집니다. 비디오 메모리의 양은 2048MB입니다. 스트림 프로세서의 수는 1536개로 880MHz의 주파수에서 작동합니다.

시험대

프로세서 - 인텔 코어 i7 3960X
마더보드 - ASUS P9X79 Deluxe
RAM – 커세어 XMS3 1600MHz 9CL 4x4GB
하드 드라이브 - Intel SSD 160GB
전원 공급 장치 - Corsair HX850W

시험 결과 AMD Radeon HD 78xx 테스트 결과 Dirt 3

새로운 라인은 좋은 성능을 보여줍니다. 대부분의 경우 오버클럭된 Radeon HD 7850은 기본 Radeon HD 7870과 매우 유사합니다. 후자는 오버클럭에서 대부분의 경우 공칭 Radeon HD 7950과 성공적으로 경쟁합니다. 모든 것이 자연스럽습니다. HD 6970의 성능은 애플리케이션마다 크게 다릅니다. 어떤 곳에서는 HD 7870을 능가하고 어떤 곳에서는 HD 7850에 지고 있습니다. 일반적으로 새로운 라인의 성능은 매우 만족스럽습니다.

결론

AMD Radeon HD 7800 시리즈는 매우 성공적이었습니다. 더 낮은 비용으로 오버클럭킹의 Radeon HD 7870은 종종 더 오래된 상위 라인인 HD 7950의 비디오 카드를 따라잡습니다. 이것은 더 적은 비용으로 더 많은 성능을 얻고자 하는 사람들에게 비용을 절약할 것입니다.

나는 새로운 비디오 카드의 온도 체계가 정말 마음에 들었다. 그들은 정말 춥습니다. 기본 주파수에서 부하가 걸리면 HD 7870은 최대 68도, HD 7850은 최대 66도까지 가열됩니다. 이것은 그러한 성능에 대한 매우 좋은 결과입니다. 모든 결과를 HD 6970 비디오 카드와 비교하기 시작하면 매우 눈에 띄게 됩니다.

쿨러 RPM을 최소 50% 이상으로 설정하면 비디오 카드의 소음이 정말 마음에 들지 않았습니다. 회전 속도를 50% 이상으로 설정하면 누가 컴퓨터 근처에서 작업할 수 있을지 상상조차 되지 않습니다.

가격이 마침내 결정되는 즉시 새로운 품목은 훌륭한 투자가 될 것입니다. 이 과정은 보통 1~2개월이 걸립니다. 가장 중요한 것은 가격/성능 매개변수가 더 높은 가격으로 이동하지 않았다는 것입니다.

매년 최신 게임은 그래픽 처리를 위해 점점 더 강력한 비디오 카드를 필요로 합니다. 게이머를 위한 예산 솔루션 중 하나는 AMD Radeon HD 7800 시리즈입니다. 이 시리즈의 기술적 특성과 게임의 기능 및 성능을 고려하십시오.

AMD Radeon HD 7800 시리즈의 특성을 표 형식으로 고려하십시오.

공정 기술	28nm
GPU	핏케언
GPU	주파수(모델의 경우 최소 최대)	800-1000MHz
램	유형	GDDR5
	용량	2GB
	빈도	800-1200MHz
	대역폭	153.6GB/초
인터페이스	기억 용량	256비트
인터페이스	타이어 종류	PCI 익스프레스 3.0
건축물	GCN
	블록당 스트림 프로세서	64에서 80으로
	블록 수	16에서 20
	총 스트림 프로세서	1024-1280
	지오메트리 처리용 코어	2개
	비동기 컴퓨팅을 위한 코어	2개
커넥터	HDMI 디스플레이 포트 1.2
지원되는 기술 및 소프트웨어	다이렉트X 11	예
	오픈지엘 4.2	예
	아이피니티(모니터 연결)	최대 6개
	제로 코어 파워	수면 모드
	촉매	브랜드 드라이버및 설정
	앱 가속	비디오 재생 품질 향상
	AMDHD3D	3D 그래픽 처리
	파워 튠	동적 전원 설정

2012년 3월에 생산된 라인입니다. 이를 기반으로 다음 모델이 출시되었습니다.

HD7850;
HD7870;
HD7890.

이 범위는 현재 더 이상 생산되지 않습니다. 판매 시작 당시 매장 평균 가격은 249달러와 349달러였다.

검토

AMD에서는 새로운 공정 기술이 출시된 후 일반 생산 시리즈를 하위 그룹으로 나누기로 결정했습니다. 따라서 28nm 공정 기술을 기반으로 4개의 라인이 형성되었으며 이는 표에 나와 있습니다.

"Pitcairn" GPU가 있는 HD 7800은 Graphic Core Next 마이크로아키텍처를 사용합니다. 이 시리즈는 2012년 3월에 출시되었으며 현재 절판되었습니다.

한때 Pitcairn의 비디오 카드는 꽤 인기가 있었고 가격/품질의 탁월한 조합을 보여주었습니다. 2018 년 현재 시리즈는 인기가 없으며 새로운 상태의 장치를 찾기가 매우 어렵습니다. 그래픽 코어가 이미 구식이라는 사실에도 불구하고 강력한 프로세서가 장착된 어셈블리에서 PC는 다양한 게임중간 및 높음 설정에서.

AMD Radeon HD 7800 시리즈에서 실행되는 게임

비디오 카드는 2012년에 출시되었지만 여전히 현대 장난감에 사용할 수 있습니다. AMD Radeon HD 7800 시리즈 게임에서 테스트는 다음 하드웨어로 이루어졌습니다.

프로세서: Core I5 6500 3.2GHz.
RAM: 16GB DDR4 2133 듀얼.
하드 드라이브: 히타치 1TB.
마더보드: Asus H170M-Plus.
해상도: 1920x1080px.

결과는 다음과 같습니다.

게임 이름	그래픽 품질
어쌔신 크리드 신디케이트	높이	31
워썬더	시네마(울트라)	55-65
퀀텀 브레이크	평균	30-42
어쌔신 크리드 유니티	평균	30
그림자 전사 2	높은	35-45
죽어가는 빛	높은	40-50
폴아웃 4	극단론자	38-43
GTA 5	평균 이상	45-50
운명	높은	40
의 상승 무덤침입자	높은	30-40
전쟁	높은	90-100
Witcher 3: 블러드 앤 와인	높은	25-35
탱크의 세계	높은	60-80

전반적인 성능은 프로세서와 그래픽 카드의 올바른 조합에 크게 좌우됩니다. Ryzen 또는 Core I5와 같은 현재 세대의 강력한 프로세서를 사용하면 오래된 비디오 카드를 사용하더라도 대부분의 최신 게임에서 높은 FPS를 표시할 수 있습니다.

게임의 기술적 특성과 테스트를 분석한 후 다음과 같은 결론에 도달했습니다. 2018년에는 강력한 게임을 구입하는 것이 좋습니다. 최신 모델을 선택하는 것이 좋습니다.

성능은 편안한 숙제를 하고 CS:GO, World Of Tanks와 같은 멀티플레이어 게임을 실행하기에 충분합니다.

비디오 카드를 오버클럭하는 방법

최대 성능을 달성하려면 AMD Radeon HD 7800을 오버클럭할 수 있습니다. 이렇게 하려면 드라이버를 설치하고 구성해야 합니다.

주요 변경 사항은 "게임" 섹션에서 이루어져야 합니다. 최신 드라이버를 사용하는 경우 각 비디오 게임에 대해 프로필을 개별적으로 구성할 수 있습니다.

프레임 속도 제어 설정에 대한 원하는 프로필로 이동합니다. 기본적으로 비디오 카드는 최대 FPS를 짜내고 모든 리소스를 소비합니다.

편안한 슈팅 게임의 경우 초당 60프레임이면 충분합니다. CS:GO, WarFace, WarThunder의 경우 제한을 70FPS로 설정하면 충분합니다.

OverDrive 설정을 사용하면 GPU 및 메모리의 주파수, 팬의 효율성 및 전력 소비 수준과 같은 작동 매개변수를 조정할 수 있습니다. 이러한 설정은 각 PC 빌드에 대해 개별적으로 구성해야 합니다.

AMD Radeon HD 7800 시리즈용 드라이버 다운로드

Radeon HD 7800 시리즈용 드라이버를 다운로드하려면 독점 자동 검색 프로그램을 사용하십시오. 제조업체의 공식 웹 사이트에서 다운로드할 수 있습니다. 여기에서 Windows 7, Windows 10 등 OS의 각 버전에 대한 드라이버를 찾을 수도 있습니다.

사양이 다른 7800 시리즈. Graphic Core Next 마이크로아키텍처에 구축된 이 칩은 28억 개의 트랜지스터에 해당하는 공간을 차지합니다. Radeon의 대부분의 카드와 마찬가지로 여기에는 최대 6개의 모니터를 동시에 연결할 수 있는 Eyefinity 기술이 있습니다. 그들은 서로 독립적으로 작동하거나 하나의 대형 모니터를 구성할 수 있습니다. 그것은 모두 어떤 설정이 노출되는지에 달려 있습니다.

라데온 7850

이 AMD 7800 시리즈 그래픽 카드의 프로세서 주파수는 800MHz입니다. 고성능 및 대역폭(초당 153기가비트)은 256비트의 버스 크기를 제공합니다. 컴퓨팅 시스템은 1.76테라플롭에 해당하는 데이터를 처리합니다. 컴퓨팅 단위는 16개, 텍스처 단위는 64개입니다. 컴퓨팅 프로세스에는 두 개의 코어가 있습니다.

메모리 형식은 GDDR5 표시에 해당하며 DirectX 버전 11에 대한 지원은 운영 체제 응용 프로그램과의 상호 작용 속도를 높이는 데 도움이 됩니다. 카드의 성능을 더 잘 최적화하려면 드라이버 업데이트를 따라야 합니다. 드라이버 업데이트만 GPU의 모든 기능을 완전히 잠금 해제하고 액세스를 제공할 수 있기 때문입니다. 필요한 설정. 시스템에서 비디오 카드를 지정하는 기본 드라이버는 카드와 함께 제공되며, 업데이트된 버전 AMD 웹사이트에서 볼 수 있습니다.

이 AMD Radeon HD 7800 시리즈 그래픽 프로세서에는 최대 4096 x 2160 픽셀에 도달할 수 있는 동시에 60 프레임에서 고품질의 부드러운 이미지를 즐길 수 있는 최신 기술이 내장되어 있습니다. 모든 최신 요구 사항을 충족하여 고품질 사운드를 제공하는 오디오 스트림에도 동일하게 적용됩니다.

라데온 7870

이 AMD Radeon HD 7800 시리즈 그래픽 카드는 특성 면에서 이전 카드의 강력한 후속 제품입니다. 그녀는 그래픽 프로세서로 작업할 수 있는 전체 기가헤르츠를 가지고 있습니다. 컴퓨팅 작업의 성능은 이전 버전인 2.56테라플롭보다 훨씬 높습니다. 20개의 컴퓨팅 유닛과 80개의 텍스처 유닛이 있습니다.

7800 시리즈의 플래그십인 만큼 여러 면에서 동급을 능가한다. 테셀레이션 기술에 대한 지원은 오랫동안 이 제조업체의 비디오 카드에 도입되었지만 이 버전에서는 한계에 도달했습니다. 이제 현실감과 디테일이 돋보이는 3차원 이미지를 즐길 수 있습니다. 그리고 향상된 앤티 앨리어싱은 부드럽고 쾌적한 사진을 얻는 데 도움이됩니다.

다른 매개변수에서 이 AMD Radeon HD 7800 시리즈 대표는 특성면에서 이전 비디오 카드와 완전히 동일합니다. 두 카드 모두 비디오와 게임 모두에서 3D 기술을 지원할 수 있습니다. 성능을 높이기 위해 여러 카드를 연결할 수도 있지만 이 매개변수는 마더보드의 기능에 따라 달라질 수도 있습니다.

칩 코드명: "Tahiti"
43억 개의 트랜지스터(Cayman보다 60% 이상, Cypress보다 정확히 두 배)
384비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 6개
코어 클럭: 최대 925MHz(Radeon HD 7970용)
총 2048개의 부동 소수점 ALU(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀도 지원)를 위한 128개의 SIMD 코어가 있는 32개의 GCN 계산 장치
모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 128개의 텍스처 유닛
FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티 앨리어싱 모드를 지원하는 32개의 ROP. 클럭당 최대 32개 샘플 및 무색 모드(Z 전용)에서 최대 성능 - 클럭당 128개 샘플
HDMI 1.4a 및 DisplayPort 1.2를 포함한 6개의 모니터에 대한 통합 지원

Radeon HD 7970 그래픽 사양

코어 클럭: 925MHz
범용 프로세서 수: 2048
텍스처 유닛 수: 128, 블렌딩 유닛: 32
유효 메모리 주파수: 5500MHz(4×1375MHz)
메모리 유형: GDDR5
메모리 용량: 3GB
메모리 대역폭: 초당 264GB
이론적 인 최대 속도채우기: 초당 29.6기가픽셀
이론적 텍스처 샘플링 속도: 초당 118.4기가텍셀
2개의 CrossFire 커넥터
PCI 익스프레스 3.0 버스
소비 전력: 3~250W
8핀 1개 및 6핀 전원 커넥터 1개
듀얼 슬롯 디자인
미국 권장소비자가격: $549

Radeon HD 7950 그래픽 사양

코어 주파수: 800MHz
범용 프로세서 수: 1792
텍스처 유닛 수: 112, 블렌딩 유닛: 32
유효 메모리 주파수: 5000MHz(4×1250MHz)
메모리 유형: GDDR5
메모리 용량: 3GB
메모리 대역폭: 초당 240GB
이론상 최대 채우기 속도: 초당 25.6기가픽셀.
이론적 텍스처 샘플링 속도: 초당 89.6기가텍셀
2개의 CrossFire 커넥터
PCI 익스프레스 3.0 버스
커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
소비 전력: 3~200W
듀얼 슬롯 디자인
미국 MSRP: $449

새로운 칩의 높은 복잡성은 이전 최고급 그래픽 프로세서의 트랜지스터 수의 절반 이상인 43억 개의 트랜지스터로 주목을 받습니다. 이러한 복잡한 결정을 만드는 능력은 현대의 28나노미터 공정 기술을 사용하여 가능했으며 새로운 칩은 더 작은 크기카이만. 그리고 성능에 영향을 미치는 실용적인 특성(ALU, TMU, 메모리 버스의 수)이 눈에 띄게 개선되었습니다. ROP의 수만 증가하지 않았으며 GDDR5 비디오 메모리의 주파수는 동일한 수준을 유지했습니다.

회사의 비디오 카드 이름 지정 원칙은 동일하게 유지되었습니다. Radeon HD 7970은 회사에서 가장 생산적인 단일 칩 솔루션입니다. 얼마 후 더 젊은 모델 HD 7950이 출시되어 조금 늦게 발표되었습니다. 처음에 HD 7970은 시장에 경쟁자가 없었고 AMD 라인의 특정 비디오 카드를 대체하지 않고 오히려 아래로 옮겼습니다. 경쟁사와 비교하면 NVIDIA는 훨씬 늦게 28nm 솔루션을 출시했습니다.

새로운 AMD 비디오 카드에는 동일한 GDDR5 메모리가 설치되어 있지만 이전 세대의 2GB가 아닌 3GB로 용량이 커졌습니다. 이것은 메모리 버스가 256비트에서 384비트로 확장되었기 때문에 발생했습니다. 이제 새 보드에 1.5GB 또는 3GB를 넣을 수 있습니다. 당연히 마케팅의 관점에서 볼 때 더 작은 볼륨을 설치하는 것은 명백한 단점이 될 것이므로 3GB를 넣는 것으로 결정했지만 오늘은 조금 과합니다. 위만 고해상도예, MSAA 16x의 경우 1.5-2GB로는 충분하지 않습니다. 그러나 AMD에는 Eyefinity도 있으며 3개 이상의 모니터에서 게임을 하는 경우 화면 버퍼가 매우 많은 양을 차지합니다.

이제 Radeon HD 7970을 살펴보겠습니다. 상위 가격대의 새로운 비디오 카드에는 전체 길이를 따라 모든 최신 AMD 마더보드에 친숙한 플라스틱 케이스로 덮인 2슬롯 냉각 시스템이 있습니다. 카드. 이 케이스의 디자인만 조금 바뀌었지만, 후방 끝여전히 인쇄회로기판을 넘어선다. 그러나 핀이 있는 바의 디자인이 변경되었습니다. 비디오 카드의 냉각을 개선하기 위해 두 개의 슬롯 중 하나(바의 절반)는 방열을 위한 환기 구멍으로만 채워졌습니다.

그러나 사용자는 보드에 바로 납땜되는 DVI 커넥터의 수가 줄어들어서는 안 됩니다. 편의를 위해 패키지에 특수 HDMI-DVI 어댑터가 포함되어 있어 DVI 커넥터가 있는 두 대의 모니터를 연결할 수 있습니다. 참고로 소비전력은 새 카드 Radeon HD 6970보다 낮지 않기 때문에 8핀 전원 커넥터 1개와 6핀 전원 커넥터 1개 세트를 설치해야 했습니다.

그러나 새로운 Radeon HD 7970에서는 냉각 시스템이 개선되었습니다. 새로운 세대의 증발기 챔버와 더 큰 새로운 냉각기가 사용되어 블레이드 모양이 수정되고 성능이 향상되었습니다(더 큰 공기 흐름 제공). 그 결과 소음을 줄이면서 냉각기 효율이 증가합니다.

Radeon HD 6900 설명에서 설명한 Dual BIOS 펌웨어 스위치는 보드에서 사라지지 않았습니다. 사용자와 AMD 모두 이 편리한 솔루션을 매우 좋아했기 때문에 AMD는 이를 통해 계속해서 최고 수준의 솔루션을 완성하기로 결정했습니다.

우리는 인사만 할 수 있어요 이 결정, 플래싱 중 예기치 않은 문제(예: 프로세스의 전원 끄기)와 관련된 다양한 경우에 실제로 도움이 되며 BIOS 이미지로 두려움 없이 다양한 실험을 수행할 수 있습니다. 당연히 AMD는 새로운 그래픽 카드의 탁월한 오버클러킹 기능을 계속해서 암시합니다.

보시다시피 1GHz 이상의 주파수로 오버클러킹하는 것은 실제로 비디오 카드가 고장나더라도 보증이 적용되지 않는다는 작은 비문(스크린샷에 포함되지 않음)을 고려하지 않으면 약속됩니다. 설정 비디오 드라이버에서 주파수를 높이는 실험의 결과입니다.

아키텍처 기능 Radeon HD 7970

남군도에서 아키텍처 수정의 관련성을 평가하려면 먼저 AMD 관점에서 지난 몇 년 동안의 GPU 개발을 고려하십시오. 2002년 이전에 그래픽 칩은 순수하게 그래픽 컴퓨팅이 가능한 특정 하드웨어였습니다. 그 당시의 비디오 칩은 기능이 제한적이었고 텍스처만 적용 및 필터링하고 기하학을 처리하고 원시 래스터화에 참여할 수 있었기 때문에 범용 컴퓨팅 작업에는 전혀 적합하지 않았습니다.

다음 몇 년 동안 기본 프로그래밍 기능이 GPU에 추가되었지만 그래픽 작업에만 집중되었습니다. 부동 소수점 기능이 있는 제한된 기능의 셰이더 프로그램인 DirectX 8 및 9가 지원되는 시기였습니다. 당시 비디오 칩에는 정점 및 픽셀 처리를 위한 특수 ALU와 픽셀, 텍스처 및 기타 데이터용 전용 캐시가 있었습니다. 보편성은 아직 가깝지 않았습니다.

그리고 2007년에야 AMD는 CAL, Brook, ATI Stream과 같은 특수 도구를 사용하여 GPU를 프로그래밍하는 기능뿐만 아니라 통합 셰이더 아키텍처 DirectX 10을 얻었습니다. 당시 GPU에는 이미 고급 캐싱과 로컬 및 글로벌 공유 데이터 지원 기능이 있었습니다. 구조적으로 칩은 VLIW5 및 VLIW4 블록을 기반으로 했으며 일부 기본 비그래픽 컴퓨팅에 충분히 유연하지만 여전히 그래픽 알고리즘에 중점을 둡니다.

이제 범용 컴퓨팅에 더욱 적합한 새로운 아키텍처가 필요합니다. 그래픽 코어 넥스트(GCN). AMD에게 이것은 새로운 아키텍처 시대이기 때문에 이름이 선택되었습니다. 새로운 GPU는 뛰어난 그래픽 처리 기능과 성능을 제공하지만 아키텍처 변경은 주로 비그래픽 컴퓨팅에서 위치를 개선하여 복잡한 범용 작업에서 성능과 효율성을 향상시키기 위한 것입니다. 새로운 GPU 디자인은 멀티태스킹 환경에서 그래픽과 범용이 혼합된 이른바 이기종 컴퓨팅을 위해 설계되었습니다. GCN 아키텍처는 더욱 유연해졌으며 다양한 작업의 에너지 효율적인 실행에 더욱 적합해야 합니다.

새 아키텍처의 기본 블록은 GCN 블록입니다. Southern Islands 시리즈의 모든 새로운 GPU가 기반으로 하는 것은 이 "벽돌"에 있습니다. AMD 그래픽 칩의 아키텍처는 처음으로 non-VLIW 설계를 사용하고 벡터 및 스칼라 블록을 사용하며 가장 중요한 변경 사항 중 하나는 각 GCN 컴퓨팅 블록마다 고유한 스케줄러가 있고 다양한 프로그램의 명령을 실행할 수 있다는 것입니다. (핵심).

새로운 컴퓨팅 아키텍처는 멀티태스킹 환경에서 컴퓨팅 장치의 고효율 로딩을 위해 설계되었습니다. GCN 계산 단위는 4개의 하위 섹션으로 나뉘며 각 하위 섹션은 클록 주기마다 자체 명령 스트림에서 작동합니다. 스레드는 흐름 제어 또는 포인터 작업을 위해 GCN에 있는 스칼라 블록을 사용할 수도 있습니다. 벡터와 스칼라 블록의 조합은 매우 간단한 프로그래밍 모델을 제공합니다. 예를 들어, 함수 포인터와 스택 포인터는 프로그래밍하기 훨씬 쉽고 컴파일러의 작업은 이제 실행 단위가 스칼라이기 때문에 크게 단순화되었습니다.

각 GCN 블록에는 데이터 교환 또는 레지스터용 로컬 스택 확장을 위한 전용 64KB 로컬 데이터 저장소가 있습니다. 또한 블록에는 읽기 및 쓰기 기능이 있는 1단계 캐시 메모리와 본격적인 텍스처 파이프라인(샘플링 및 필터링 블록)이 모두 포함됩니다. 따라서 새로운 컴퓨팅 장치는 이전 아키텍처에서 블록 간에 작업을 분배하는 역할을 했던 중앙 스케줄러 없이 독립적으로 작동할 수 있습니다. 이제 각 GCN 장치는 자체적으로 명령을 스케줄링하고 배포할 수 있으며, 하나의 컴퓨팅 장치는 최대 32개의 서로 다른 명령 스트림을 실행할 수 있습니다.

이전 AMD GPU 아키텍처는 VLIW4 및 VLIW5 아키텍처 모델을 사용했으며 그래픽 작업에는 충분하지만 범용 컴퓨팅에는 충분히 효율적이지 않습니다. 이러한 조건에서 작업으로 모든 실행 단위를 로드하기가 매우 어렵기 때문입니다. 새로운 GCN 아키텍처는 유사하게 많은 수의 실행 단위를 제공하지만 레지스터와 명령어의 제한과 종속성을 제거하는 스칼라 실행을 제공합니다. VLIW 아키텍처에서 스칼라 실행으로의 전환은 코드 최적화 작업을 눈에 띄게 단순화합니다.

이전 VLIW4 아키텍처에서 명령어를 실행할 때 컴파일러는 레지스터 충돌을 처리하고 코드 컴파일 단계에서 실행 단위로 복잡한 명령어 배포 등을 수행해야 합니다. 동시에 고성능을 달성하기 위해 사소한 최적화가 종종 대부분의 그래픽 작업에 적합하고 다른 계산에는 훨씬 덜 유연합니다. 새로운 아키텍처는 개발 및 지원의 상당한 단순화, 저수준 코드의 단순화된 생성, 분석 및 오류 포착, 안정적이고 예측 가능한 성능을 제공합니다.

메모리 캐싱 하위 시스템

대역폭, 메모리 및 캐시는 결코 충분하지 않으며 항상 이를 증가시킬 필요와 방법이 있습니다. AMD의 새로운 GPU는 완전한 2레벨 읽기/쓰기 캐시를 사용합니다. 각 컴퓨팅 장치에는 16킬로바이트의 첫 번째 레벨 캐시가 있고 두 번째 레벨 캐시의 총 볼륨은 768킬로바이트입니다(총 칩은 512KB L1 및 768KB L2를 얻음). 이는 이전 칩보다 50% 더 많습니다. , L2 캐시에 전혀 쓸 수 있는 기능이 없습니다.

성능과 관련하여 각 GCN 컴퓨팅 장치는 한 사이클에서 L1 캐시 또는 전역 메모리에서/로 64바이트의 데이터를 수신하거나 쓸 수 있으며, 이는 명령 스트림 간에 데이터를 교환하는 역할을 합니다. 동일한 양의 데이터로 L2 캐시 메모리의 각 섹션을 송수신할 수 있습니다. 그 결과 회사의 최고급 GPU는 L1이 2테라바이트/초, L2가 700GB/초를 달성해 이전 최고 AMD 솔루션보다 50% 더 높은 수준이다.

타히티 GPU

새로운 Southern Islands 시리즈의 낮은 수준의 아키텍처 변경 사항을 살펴보았으므로 이제 두 가지 모델을 포함하는 라인의 가장 강력한 솔루션인 Radeon HD 7900의 세부 사항으로 넘어갈 차례입니다. 우선, Radeon HD 5870이 기반으로 하는 칩의 두 배인 43억 개 이상의 트랜지스터가 포함되어 있기 때문에 새 GPU의 엄청난 복잡성에 주목합시다! 당연히 이러한 강력한 칩은 새로운 28nm 공정 기술 덕분에 가능해졌습니다. 그래서 그는 안에 무엇을 가지고 있습니까?

기하학적 블록의 수는 Cayman과 비교하여 변경되지 않았지만 여전히 2개가 있지만 작업 효율성이 크게 향상되었습니다. 잠시 후에 더 자세히 설명하겠습니다. 그래픽 프로세서 다이어그램에서 Radeon HD 7970에서 사용 가능한 32개의 GCN 아키텍처 컴퓨팅 장치를 볼 수 있으며 주니어 솔루션의 경우 일부는 비활성화됩니다. 솔루션의 최대 컴퓨팅 성능을 고려하면 오늘날 GPU의 절대 기록인 거의 3.8테라플롭(초당 부동 소수점 연산 수)입니다.

각 GCN 블록에는 16개의 텍스처 유닛이 있어 칩당 총 128 TMU 또는 118 기가텍셀/초 이상을 제공합니다. 이는 출시 당시의 또 다른 기록이며 마지막이 아닙니다. 그러나 ROP 블록의 수는 변경되지 않았으며 8개의 확대된 RBE 블록에 여전히 32개가 있습니다. 또 다른 흥미로운 아키텍처 변경 사항은 이제 ROP 블록이 이전과 같이 메모리 채널이 아니라 GCN 블록에 "연결"된다는 것입니다.

이론적인 프레임버퍼 쓰기 속도는 크게 변하지 않고 클럭당 최대 32개의 색상 값과 128개의 깊이 값이 동일하지만 메모리 대역폭 증가로 인해 실제 응용 프로그램의 실제 채우기 속도(필레이트)가 크게 증가했습니다. . AMD는 Cayman을 클럭당 23픽셀로 측정한 반면, 새로운 Tahiti는 이론상 클록당 32픽셀에 접근했습니다.

이는 새로운 AMD 비디오 칩이 현재 최고급 경쟁업체의 솔루션과 마찬가지로 64비트 채널인 384비트 메모리 버스를 가지고 있기 때문에 이해할 수 있습니다. 실제 텍스처 가져오기 및 프레임 버퍼 쓰기 속도를 높일 수 있는 것은 메모리 대역폭이 1.5배 증가했기 때문입니다. 264GB/s의 대역폭은 118gigaxels/sec 및 30gigapixels/sec의 이론적 수치에 가깝게 짜내는 데 도움이 되며 실제 부분에서는 이를 확인할 것입니다.

"제거된" Radeon HD 7950 그래픽 프로세서의 경우, Tahiti는 칩에서 물리적으로 사용 가능한 32개 중 28개의 GCN 아키텍처 활성 컴퓨팅 장치를 포함합니다. Radeon HD 7970 시리즈의 주니어 솔루션의 경우 그 중 4개를 비활성화하기로 결정했습니다. 각 GCN에는 16개의 텍스처 단위가 있으므로 새 모델의 총 TMU 수치는 112 TMU이며 거의 90기가텍셀/초의 처리량을 제공합니다.

그러나 HD 7950의 ROP와 메모리 컨트롤러의 수는 변경되지 않았으며, 이를 줄이지 않고 각각 동일한 32개와 6개를 유지하기로 결정했습니다. 따라서 Tahiti Pro 비디오 칩에는 최고의 AMD 솔루션과 동일한 384비트 메모리 버스가 있으며 64비트 채널 6개로 조립됩니다. 아무래도 제작 과정에서 결혼 생활에서 가장 큰 피해를 입는 것은 컴퓨팅 기능 기기들인 것 같고, 나머지는 다 자르지 않기로 했다.

테셀레이션 및 기하학 처리

건축학적 관점에서, 케이맨 이후로 타히티의 기하학적 블록에서 특별한 것은 아무것도 변경되지 않았습니다. 기하학적 데이터 및 래스터화의 처리(정점 및 테셀레이션 설정)에 여전히 두 개의 블록을 사용하며, 테셀레이터가 이미 9세대라고 불리는 것을 제외하고는 이전에 본 것과 매우 유사합니다.

도식적 유사성에도 불구하고 이러한 블록의 최신 세대는 블록이 크게 수정되었기 때문에 테셀레이션 및 지오메트리 처리 성능이 크게 향상될 수 있습니다. 최고 성능은 초당 거의 20억 개의 정점 및 기본 요소(925MHz 및 클록당 2개의 정점)로 증가했지만, 실제 성능더 성장했습니다. 이것은 캐시 크기를 늘리고 기하 데이터의 버퍼링을 개선하며 정점 데이터를 재사용함으로써 달성되었습니다.

그 결과 모든 삼각형 분할 비율에서 테셀레이션 성능이 이전 세대 Radeon HD 6970보다 최대 4배 향상되었습니다. 그러나 AMD 자체의 다이어그램에서도 모든 경우에 4배는 달성되지 않습니다.

이 차트는 분할 비율 1~32에서 Radeon HD 7970과 HD 6970의 테셀레이션 성능을 비교한 것입니다. 그리고 보시다시피 성능 차이는 1.7~4배입니다. 그러나 이것은 알몸 합성입니다. 그리고 현실에 더 가까워지기 위해 게임 애플리케이션에서 이미 테셀레이션 속도에 대한 더 많은 데이터를 제공할 것입니다.

보시다시피 AMD의 합성 숫자는 게임 숫자에서 잘 지원됩니다. "무거운" 테셀레이션이 있는 실제 응용 프로그램의 성능이 크게 향상되었습니다. 이것은 합성 및 게임 응용 프로그램의 예를 사용하여 실제 부분에서 확실히 확인할 매우 좋은 결과입니다.

비그래픽 계산

이기종 및 비그래픽 컴퓨팅 작업의 관점에서 두 가지 비동기 컴퓨팅 엔진(Asynchronous Compute Engines - ACE)이 등장했습니다. 효율적인 멀티태스킹 및 그래픽 명령 프로세서(Command Processor)와 함께 작업을 수행하기 위해 실행 단위 간에 작업을 예약하고 분산하도록 설계되었습니다.

Radeon HD 7900에는 2개의 독립적인 컴퓨팅 엔진과 1개의 그래픽 엔진이 있습니다. 전체적으로 이것은 서로 완전히 분리된 세 개의 프로그래밍 가능한 블록과 세 개의 명령 스트림을 제공합니다. 명령을 비동기적으로 실행하는 것 외에도 빠른 스위칭컨텍스트에서 새로운 GPU는 또한 Cayman에 도입된 2개의 양방향 DMA(직접 메모리 액세스) 컨트롤러를 갖추고 있습니다. 이 두 컨트롤러는 새로운 PCI Express 3.0 버스를 최대한 활용하는 데 필요합니다.

아시다시피 진지한 계산의 관점에서 보면 단정밀도로 부동 소수점 연산을 수행하는 속도뿐만 아니라 배정밀도(배정밀도 부동 소수점)도 중요합니다. 그리고 AMD의 새로운 아키텍처는 그 일을 꽤 잘합니다. 현재 FP64 명령어에 대해 실행 속도가 다른 두 가지 버전의 GCN 컴퓨팅 장치가 있다고 가정합니다. 구형 GPU의 경우 실행 속도가 FP32 속도의 1/4이고, 젊은 칩의 경우 실행 속도가 1/16으로 호환성을 유지하기에 충분하지만 저렴한 솔루션을 너무 복잡하게 만들지는 않습니다. 결과적으로 Radeon HD 7970은 초당 9,470억 개의 배정밀도 연산을 수행할 수 있습니다.

게다가 이들은 이전 아키텍처의 경우와 같은 기가플롭이 아니라 더 "뚱뚱한" 아키텍처입니다. 결국 복잡한 컴퓨팅 작업에서 새 GPU의 효율성은 심각하게 증가해야 합니다. 첫째, 메모리 및 캐싱 하위 시스템이 개선되었습니다. 둘째, 각 GCN 계산 단위에는 자체 스케줄러가 있어 분기 코드 실행과 전반적인 효율성을 향상시켜야 합니다. 셋째, 컴파일러의 복잡한 최적화가 필요하지 않은 스칼라 실행에 주목합니다. 그 결과 컴퓨팅 장치가 유휴 상태가 되는 빈도가 훨씬 줄어듭니다. 그리고 결과적으로 어떤 작업에서도 새로운 칩이 고성능과 ALU 로딩을 보여주기가 더 쉬울 것입니다.

컴퓨팅 기능과 관련된 다른 혁신 중에서 DRAM 및 SRAM용 ECC를 완벽하게 지원합니다. 소프트웨어 측면에서 Tahiti는 OpenCL 1.2, DirectCompute 11.1, C++ AMP 및 해당 기능과 같은 새로운 API 버전을 완벽하게 지원하는 최초의 GPU라는 것이 중요합니다. 예를 들어, OpenCL 1.2를 사용하면 여러 컴퓨팅 장치의 기능을 하나로 결합할 수 있으며 AMD는 이미 AMD APP SDK 2.6 및 Catalyst 11.12 드라이버의 형태로 이에 대한 지원을 출시했습니다.

아키텍처 성능 및 효율성

Southern Island 시리즈의 최상위 칩 예제에 대한 모든 아키텍처 혁신을 검토한 후 이러한 모든 변경의 효과에 대해 이야기할 시간입니다. 새로운 칩의 성능이 이전 칩의 성능보다 훨씬 높은 것은 분명하지만 그 반대는 매우 놀랍습니다. 문제는 얼마나 더 빠를 것인가이다. 다양한 작업에서 수치는 40-50%(최소!)에서 5배 차이까지 얻습니다. 아키텍처의 개선으로 덤 기가플롭의 이론적인 1.4배 차이를 초과할 수 있습니다. 예를 들어 살펴보겠습니다.

다이어그램은 새로운 최고 솔루션과 이전 단일 칩 솔루션인 Radeon HD 7970 및 HD 6970을 비교하며 이는 상당히 공정합니다. 다양한 성능 테스트가 선택됩니다. SmallptGPU 및 LuxMark는 OpenCL의 레이 트레이싱, SHA256은 보안 해싱 알고리즘, AES256은 대칭 암호화 알고리즘입니다. 만델브로트는 배정밀도 계산으로 계산된 잘 알려진 문제입니다.

그래프의 수직 파선은 이론적인 성능 차이를 나타내지만 속도 데이터에 따르면 5개 작업 중 3개 작업에서 새 GPU의 속도가 훨씬 더 빨랐습니다. 이는 효율성 향상을 목표로 한 모든 변경 사항(VLIW에서 벗어나기, 각 컴퓨팅 장치에 스케줄러 존재, 캐싱 개선 등) 때문입니다.

렌더링 품질의 변화

사실, 이 부분은 최근에 이미지 품질에 대한 특별한 주장이 없고 여러 가지 이유로 그럴 수 없기 때문에 건너뛸 수 있었습니다. 예를 들어 비디오 카드의 전체 화면 앤티앨리어싱 품질 다른 제조업체특히 모든 GPU에서 정확히 동일한 방식으로 수행되는 사후 처리 필터를 사용하는 소프트웨어 앤티 앨리어싱 방법의 광범위한 분포를 고려하면 매우 가깝습니다.

텍스처 필터링에도 동일하게 적용됩니다. 이제 품질이 픽셀 단위로 비교하더라도 AMD와 NVIDIA 솔루션을 구별하기가 매우 어렵습니다. 회사의 이전 세대인 Radeon HD 6900은 이방성 필터링을 조금 더 개선했으며 이제는 "현미경"도 심각한 결함을 찾는 데 도움이 되지 않습니다. 유일한 참고 사항은 작동 중인 Radeon 비디오 카드가 "노이즈" 또는 "모래"와 같은 더 눈에 띄는 특정 아티팩트로 인해 GeForce보다 약간 열등하다는 것입니다.

차세대 비디오 칩이 출시되면서 텍스처 필터의 텍셀 가중치가 다시 한 번 수정되었으며 특정 유형의 텍스처가 있는 경우 Radeon HD 6900에서 때때로 볼 수 있는 이러한 아티팩트를 줄이는 방식으로 수정되었습니다. (예를 들어 어두운 곳에서 밝은 곳으로의 급격한 전환이 있는 "고주파"). AMD는 HD 7900 대 HD 6900 비교 사진을 제공하지 않고 단순히 GPU 스트림 프로세서에서 실행되는 순수한 소프트웨어 알고리즘과 "하드웨어" 알고리즘의 품질을 비교하므로 품질의 변화를 보여주기가 매우 어렵습니다. :

이러한 작은 스크린샷에서는 품질의 차이가 보이지 않지만 AMD는 모든 변경 사항으로 인해 성능 저하가 발생하지 않았으며 어떤 측면에서든 이미지 품질이 악화되지 않았음을 확신합니다. 필터링 품질이 이상적입니다. 미래의 실용적인 재료 중 하나에서 우리는 이것을 확실히 확인할 것입니다.

부분적으로 상주하는 텍스처

부분 상주 텍스처(PRT)의 아이디어는 제시된 GPU의 하드웨어 기능을 사용하는 것입니다. 가상 메모리. 많은 사용자가 이미 가상 텍스처링 기술을 사용하는 id Software의 RAGE 게임을 보았을 것입니다. 이 게임은 엄청난 양의 텍스처 데이터를 사용하고 비디오 메모리로 스왑(스트리밍)할 수 있는 기능을 제공하는 소위 메가 텍스처링("MegaTexture")입니다.

가상 비디오 메모리를 사용하면 응용 프로그램에서 최대 32테라바이트의 텍스처를 사용할 수 있는 이러한 알고리즘에 대한 효과적인 하드웨어 지원을 얻는 것이 매우 쉽습니다. 총 결석텍스처 데이터를 로드하는 데 문제가 있습니다. 사실, AMD의 예시는 너무 이상해서 특별히 명확한 것은 없습니다.

PRT를 사용하면 고화질을 얻을 수 있고 비디오 메모리 사용의 효율성을 높일 수 있습니다. 유사한 알고리즘이 이미 id Software 엔진에서 사용되고 있으며 많은 차세대 엔진에 나타날 것으로 예상됩니다. 미래의 게임은 엄청난 양의 데이터를 처리해야 하며 새로운 GPU의 장점은 PRT 알고리즘의 로컬 그래픽 메모리가 하드웨어 캐시 메모리처럼 작동하고 필요할 때 텍스처가 메모리에 로드된다는 점입니다. Southern Islands 제품군의 GPU는 최대 32테라바이트(최대 16384×16384 해상도)의 "메가 텍스처"와 가장 중요한 하드웨어 텍스처 필터링을 지원합니다. 이는 이전 비디오 칩에서는 사용할 수 없었습니다.

가상 텍스처는 64킬로바이트(텍셀이 아닌 킬로바이트)의 조각으로 나뉘며 이 조각 크기는 고정되어 있습니다. 그리고 현재 프레임을 렌더링할 때 필요한 것만 비디오 카드의 로컬 메모리에 로드합니다. 이 기술은 텍스처 형식에 관계없이 작동하며 텍셀의 조각 크기만 다릅니다. 예를 들어 색상당 32비트의 일반 비압축 텍스처의 경우 청크 크기는 128x128 텍셀이고 DXT3 압축 텍스처의 경우 256x256 텍셀입니다.

이 기술에는 밉 수준의 텍스처(텍스처 필터링에 사용되는 더 작은 복사본)의 사용도 포함됩니다. 렌더링 및 필터링 시 여러 번 액세스해야 합니다. 예제에서 알고리즘의 작동을 고려하십시오.

이 그림은 렌더링에 필요한 서로 다른 밉 레벨의 4가지 다른 부분을 강조 표시합니다. 셰이더 프로그램이 데이터를 요청할 때 일부 조각은 이미 로컬 메모리에 있으며 이 데이터는 추가 계산을 위해 즉시 셰이더로 전송됩니다. 그러나 일부 항목이 테이블에서 누락되었으며 애플리케이션은 이러한 누락에 대해 다음에 수행할 작업을 결정해야 합니다. 예를 들어 더 낮은 해상도의 밉 레벨에서 데이터를 요청할 수 있습니다. 그러면 이미지가 흐릿하지만 최소한 진실처럼 보이고 지체 없이 그려질 것입니다. 그리고 다음 프레임이 렌더링될 때 이미 캐시(로컬 비디오 메모리)에 로드될 수 있습니다. RAGE를 해본 사람들은 우리를 이해할 것입니다.

이것은 각 개체에 고유한 거대한 텍스처를 사용할 수 있게 해주는 강력한 알고리즘입니다. 실시간 계산의 필요성을 제외하고 유사한 알고리즘이 오프라인 렌더링에 오랫동안 사용되었습니다. AMD는 애니메이션 영화를 위해 Walt Disney Animation Studios에서 개발한 Per-Face Texture Mapping 기술을 사용하여 데모도 만들었습니다. 불행히도 데모는 아직 준비되지 않았으며 저해상도 스크린샷만 보았습니다.

이 텍스처 매핑 기술의 핵심은 UV 변환을 사용할 필요 없이 각 다각형에 특정 텍스처 조각을 할당하는 것입니다. 차원 질감). 이 접근 방식은 변위 매핑 알고리즘을 매우 간단하게 만들어 테셀레이션된 콘텐츠 생성과 관련된 몇 가지 문제를 해결합니다. 그리고 이 방법의 PRT는 텍스처 데이터에 대한 효율적인 저장 및 액세스를 위해 사용됩니다.

미디어 취급 지침

Southern Islands의 흥미로운 혁신은 정적 및 동적 이미지 처리에 사용되는 특수 명령을 지원하는 것 같습니다. 예를 들어 SAD(Sum of Absolute Differences)로 더 잘 알려진 "절대 차이 합계"라는 널리 사용되는 명령어가 개선되었습니다. 실행 속도는 동작 감지, 제스처 인식, 이미지 검색, 컴퓨터 비전 등과 같은 많은 이미지 및 비디오 데이터 처리 알고리즘에서 성능에 매우 중요한 병목 현상입니다.

그러나 고대 비디오 카드 Radeon HD 5870에 대한 리뷰에서 우리는 이미 SAD 지원에 대해 썼습니다. 이제 일반적인 SAD(4 × 1)에 추가하여 남섬은 새로운 지시- 성능과 에너지 효율성을 높이기 위해 SAD와 시프트 연산자를 결합하는 QSAD(4중 SAD)와 배경 픽셀을 무시하고 배경에서 프레임에서 움직이는 개체를 분리하는 데 사용되는 "마스크" 명령 MQSAD.

새로운 GPU는 클록당 GCN 계산 단위당 최대 256픽셀을 처리할 수 있으며, 이는 AMD Radeon HD 7970의 경우 8비트 정수 색상 값의 경우 초당 최대 7조 6천억 픽셀을 처리할 수 있음을 의미합니다. 이것은 이론적인 수치이지만 새로운 GPU의 시각적 처리 능력은 상당히 인상적입니다. 많은 비디오 처리 작업을 실시간으로 수행할 수 있습니다.

PCI 익스프레스 3.0

우리는 Southern Islands의 새로운 그래픽 솔루션의 전체 라인에 의해 PCI Express의 세 번째 버전의 지원을 지나칠 수 없었습니다. PCI Express의 세 번째 버전 사양이 2010년 가을에 마침내 승인되었기 때문에 이러한 지원은 충분히 예상되었지만 지원하는 하드웨어 솔루션은 아직 없었습니다. 마더보드 2011년 말에 비디오 카드가 출시되었으며 중앙 프로세서해당하는 것이 있습니다.

업데이트된 인터페이스는 버전 2.0의 경우 5GT/s가 아닌 초당 8기가트랜잭션의 전송 속도를 가지며 대역폭은 PCI Express 2.0 표준에 비해 다시 한 번 두 배(최대 32Gb/s) 증가했습니다. 새 버스는 버스를 통해 전송되는 데이터에 대해 다른 코딩 체계를 사용하지만 PCI Express의 이전 버전과의 호환성은 유지되었습니다.

최초의 마더보드 PCI 지원 Express 3.0은 주로 Intel Z68 칩셋을 기반으로 2011년 여름에 출시되었으며 같은 해 가을에야 일반 시장에 출시되었습니다. 따라서 비디오 카드가 제 시간에 도착했고 AMD는 가장 진보된 기술을 지원하는 새로운 그래픽 프로세서 출시 속도 면에서 다시 한 번 앞서게 되었습니다. 그러나 PCI-E 3.0이 실용화될 것인지 판단하기에는 아직 이르다.

AMD 파워튠 기술

Cayman에서 가장 흥미로운 혁신 중 하나는 PowerTune 고급 전원 관리 기술이었습니다. 유연한 GPU 전원 관리는 오래전부터 사용되어 왔지만, Radeon HD 6900 이전에는 이러한 모든 기술이 다소 원시적이고 대부분 소프트웨어적인 방식이었고 주파수와 전압을 단계적으로 변경하여 비디오 칩의 많은 부분을 끌 수 없었습니다. .

Radeon HD 5000 제품군에서도 특정 소비량 수준을 초과하면 성능 제한이 나타났고, Radeon HD 6900에서는 시스템이 질적으로 다른 수준으로 이동했습니다. 이를 위해 부팅 매개 변수를 모니터링하는 모든 블록의 칩에 특수 센서가 포함되었습니다. GPU는 부하와 전력 소비를 지속적으로 측정하고 후자가 특정 임계값을 초과하지 않도록 하여 매개변수가 지정된 열 패키지 내에 유지되도록 주파수와 전압을 자동으로 조정합니다.

초기 전원 관리 기술과 달리 PowerTune은 주파수와 전압을 변경하여 간접적으로 제어하는 것과 달리 GPU 전력 소비를 직접 제어합니다. 이 기술은 높은 GPU 주파수를 설정하고 게임에서 고성능을 얻으며 소비가 안전한 한계를 넘을 수 있음을 두려워하지 않도록 도와줍니다. 결국 GPU 컴퓨팅을 사용하는 대부분의 게임 및 일반 응용 프로그램은 Furmark 및 OCCT와 같은 안정성 테스트와 달리 전력 요구 사항이 현저히 낮고 위험한 전력 소비 제한에 접근하지 않습니다.

아무리 무거운 게임이라도 최대 소비 전력을 요구하지 않으며, 주파수별로 소비를 제한하고 극한의 테스트로 비디오 카드를 테스트하면 3D 게임의 경우 사용하지 않는 성능과 전력 기회가 상당히 많을 것입니다. 비디오 카드가 안전 소비 수준의 한계에 도달하지 않은 경우 GPU는 공장에서 설정된 주파수로 실행되며 FurMark 및 OCCT 테스트에서는 GPU 주파수가 감소하여 소비 한계 내에서 유지됩니다.

이러한 방식으로 PowerTune은 더 높은 공장 주파수를 설정하고 설정된 최대 소비 수준에서 GPU 리소스를 가장 효율적으로 사용하도록 시스템을 조정하는 데 도움이 됩니다. 위의 예에서 HD 5870은 PowerTune을 사용하지 않으며 내구성 테스트에서 높은 소비의 GPU 주파수 제한으로 인해 최대 잠재력을 사용하지 않습니다. Radeon HD 7970에 대해 최대 TDP가 설정되어 있고 비디오 칩은 주파수를 초과할 때만 주파수를 재설정하여 모든 애플리케이션에서 가능한 최고의 성능을 얻습니다.

이것은 다음 다이어그램에 명확하게 표시되어 있습니다. 게임 애플리케이션의 경우 GPU의 주파수를 높여 TDP를 달성할 수 있으며 최대 부하의 경우 내구성 테스트를 통해 주파수를 안전한 수준의 전력 소비로 줄입니다. PowerTune이 없으면 FurMark와 OCCT가 오랫동안 실행될 때 비디오 카드 오류의 가능성을 얻거나 게임의 잠재적인 성능을 줄이려면 선택해야 합니다. 신기술은 이러한 문제를 가능한 한 효율적으로 해결합니다.

AMD PowerTune은 하드웨어 기술인 만큼 변화하는 조건(마이크로초)에 빠르게 응답하는 것이 특징입니다. 또한 유연한 주파수 튜닝으로 구별되며 이전 칩에서와 같이 계단이 없습니다. 모든 측정은 드라이버와 독립적이지만 비디오 카드 설정을 사용하여 사용자가 조정할 수 있습니다.

PowerTune과 이전에 일반적으로 받아 들여진 접근 방식의 차이점은 다른 경우에는 GPU를 상당히 감소된 소비 모드로 전환하는 열 조절이 사용되며 PowerTune은 단순히 주파수를 부드럽게 줄여 GPU 소비를 설정된 제한기로 가져오는 것입니다. 그 결과 클럭 속도와 성능이 향상됩니다.

AMD 제로코어 기술

AMD는 이전 솔루션에서 이미 알려진 전원 관리 기술을 사용하는 데 그치지 않았습니다. Southern Islands 제품군의 첫 번째 칩에는 AMD ZeroCore 기술이 도입되어 모든 운영 체제에서 지원되는 비활성화된 디스플레이 장치로 "깊은 유휴"(또는 "절전") 모드에서 훨씬 더 큰 에너지 효율성을 달성하는 데 도움이 됩니다. .

결국 거의 모든 시스템, 심지어 게임 시스템도 그래픽 프로세서의 저부하 모드에서 대부분의 시간을 보냅니다. 그리고 이 모드에서 비디오 카드는 많은 전력을 소모하지 않아야 합니다. 더욱이 모니터가 꺼져 있는 모드는 말할 것도 없고, 이 경우 GPU를 완전히 끄는 것이 좋습니다. 그것이 AMD가 한 일입니다. ZeroCore 덕분에 새 GPU는 최대 유휴 상태일 때 전체 모드에서 전력의 5% 미만을 소비하여 이 모드에서 대부분의 기능 블록을 비활성화합니다.

AMD는 이 기술을 지원하지 않는 자체 Radeon HD 5870과의 개략적인 비교를 제공합니다. ZeroCore는 노트북용으로 설계된 모바일 GPU의 데스크탑 솔루션에 대한 남섬 독점 혁신입니다. 그건 그렇고,이 기술의 장점은 소비 감소와 관련이 있습니다. 또한 장시간 유휴 모드에서 디스플레이가 꺼지면 비디오 카드도 비디오 카드 쿨러의 팬을 완전히 끕니다!

이것이 바로 많은 사용자들이 오랫동안 기다려온 것입니다. 가장 흥미로운 점은 우리 데이터에 따르면 PowerTune 및 ZeroCore와 같은 솔루션에 대한 실험실 테스트가 몇 세대 전에 비디오 카드에 수행되었다는 것입니다. 시장을 떠난 지 오래 된 AMD 시리즈의 비디오 카드 엔지니어링 샘플 중 일부는 정확히 이와 같이 작동하여 유휴 시간에 쿨러를 완전히 끕니다.

그러나 AMD의 새로운 ZeroCore 지원 그래픽 카드로 소음 감소 및 전력 소비의 이점을 얻는 것은 단일 GPU 사용자만이 아닙니다. 2개, 3개, 심지어 4개의 GPU를 기반으로 하는 CrossFire 시스템의 행복한 소유자도 유사한 개선 사항을 기다리고 있습니다. 결국 운영 체제의 2 차원 인터페이스를 렌더링하는 모드에서 기본 카드를 제외한 모든 비디오 카드가 전혀 작동하지 않아야한다는 것이 논리적입니까? 그러나 그것이 그들이 지금 일하는 방식입니다!

2D 모드에서 ZeroCore를 지원하는 비디오 카드의 CrossFire 시스템의 경우, 모든 보조 비디오 카드는 최소의 전력 소비와 비활성화된 쿨러로 깊은 절전 모드에 들어갑니다. 이 모드는 여러 개의 단일 칩 비디오 카드와 2칩 솔루션 모두에서 작동합니다. 또한 기본 CrossFire 그래픽 카드는 Windows에 구성된 긴 유휴 시간의 경우에도 이 모드로 들어갑니다. 시각적으로 작업의 차이는 다음과 같습니다.

그건 그렇고, 기술은 보이는 것처럼 간단하지 않습니다. AMD 엔지니어는 유휴 모드에서 운영 체제의 작동과 관련된 많은 문제를 해결해야 했습니다. 예를 들어, 그들은 모니터가 꺼져 있어도 Windows가 화면의 정보를 업데이트하려고 시도한다는 것을 발견했습니다. 물론 GPU를 전혀 비활성화할 수는 없습니다. 따라서 회사 프로그래머는 절전 모드에서 모니터가 꺼져 있을 때 모든 화면 그리기 명령을 무시하고 해결 방법을 취해야 했습니다.

AMD 아이피니티 2.0 기술

당연히 새 아키텍처에는 여러 모니터에 이미지를 표시하기 위한 입증된 기술인 AMD Eyefinity(현재 버전 2.0)를 개선할 수 있는 위치가 있었습니다. 새로운 기능, 더 높은 해상도, 더 많은 디스플레이 지원 및 향상된 유연성을 제공합니다.

이 기술은 매우 흥미롭지만 극소수의 사용자가 방에 공간을 확보하고 가족 앞에서 두 대 이상의 모니터를 설치하기 위해 용기를 냅니다. 하지만 아예 없는 것보다 항상 사용할 수 있는 기회가 있는 것이 좋습니다. 또한 대각 모니터의 가격은 거의 떨어지지 않지만 중급 솔루션은 지속적으로 저렴해지고 있습니다.

사실, 이제는 30인치 모니터 1대보다 대각선이 24인치인 모니터 3대를 사는 것이 더 유리합니다. AMD는 30인치 2560x1600 모니터의 가격이 1,000달러가 넘는 반면 24인치 FullHD 모니터 3대는 그 절반 가격으로 구입할 수 있는 예를 보여줍니다.

그러나 방에서 돈과 공간을 사용하는 방법은 각 사용자의 개인적인 문제입니다. 중요한 것은 그러한 기회가 있다는 것입니다. 또한 Eyefinity 2.0은 이제 HD3D 스테레오 모드에서 이미지 출력을 지원합니다. 이는 이 매개변수에서 경쟁 제품보다 열등했던 이전 솔루션에는 없었습니다. AMD Eyefinity와 HD3D 기술을 결합한 Radeon HD 7970은 스테레오 모드에서 3개의 모니터를 지원하는 최초의 단일 칩 솔루션입니다.

고해상도 스테레오 렌더링에는 매우 빠른 데이터 전송 인터페이스가 필요합니다. 그리고 이전 버전의 HDMI 출력에서는 가능성이 눈당 24Hz로 제한되어 Blu-ray 3D 영화를 감상하기에 충분했지만 게이머에게는 분명히 충분하지 않았습니다.

이러한 작업을 위해 좌안과 우안용 프레임을 하나로 합치는 프레임 패킹 형식을 사용하기 시작했으며, AMD Radeon HD 7970은 스테레오 출력용 HDMI 1.4a 프레임 패킹 형식을 지원합니다. 이것은 프레임 패킹이 있는 3GHz HDMI를 지원하는 최초의 비디오 카드로, 각 눈에는 60Hz(총 120Hz)의 FullHD 영상이 있습니다.

또 다른 흥미로운 참신함은 Eyefinity와 함께 작동하는 DDMA(Discrete Digital Multi-Point Audio) 다중 채널 오디오 출력 기술인 것 같습니다. 이전의 모든 GPU는 HDMI 및 DisplayPort를 통해 하나의 오디오 스트림만 출력할 수 있습니다. 즉, 다른 방에 있는 3개의 모니터가 HDMI를 통해 PC에 연결되어도 사운드 채널하나만 전송됩니다. 그러나 AMD Radeon HD 7900은 한 번에 여러 독립 오디오 채널의 동시 출력을 지원하므로 일부 다중 모니터 구성에서 유용할 수 있습니다.

동일한 기능은 별도의 화면에 여러 대담자가 출력되는 화상 회의 응용 프로그램뿐만 아니라 게임 오디오가 있는 3개의 모니터에서 재생하고 독립 오디오 스트림으로 별도의 화면에서 뉴스를 보는 것과 같은 멀티태스킹 응용 프로그램에 매우 유용합니다. 이전에는 이 모든 것을 위해 여러 개의 개별 오디오 시스템을 사용해야 했지만 이제는 모든 것이 가능한 한 편리하게 작동합니다.

Eyefinity의 소프트웨어 지원도 잊혀지지 않으며 거의 매달 기술이 업데이트됩니다. 새로운 기회가 나타납니다. 따라서 10월에 최대 16384 × 16384의 해상도와 수평 및 수직 5 × 1, 3 × 2 모드의 6개 모니터를 기반으로 하는 새로운 다중 모니터 구성에 대한 지원이 나타났습니다.

12월의 AMD Catalyst 비디오 드라이버 업데이트는 Eyefinity와 HD3D가 함께 작동하도록 하며 2월에는 사용자 지정 해상도, 작업 표시줄 배치 조정 및 향상된 사전 설정 관리에 대한 지원을 약속합니다.

6개의 모니터에 대한 출력은 2개의 DisplayPort 1.2 포트와 2개의 MST 허브(이전에 썼음)를 사용하여 달성할 수 있지만 3개 또는 4개의 모니터에는 하나의 포트와 해당 허브만 필요합니다. 이 허브는 유연한 디스플레이 구성을 제공하고 DisplayPort 1.2 커넥터당 최대 4개의 FullHD 장치를 지원하며 2012년 여름까지 제공될 예정입니다.

허가를 말하는 것입니다. 고해상도 또는 초고해상도 - 초고해상도. 더 큰 측면에서 4000픽셀의 해상도를 가진 현재 장치는 한 번에 여러 케이블(DP 1.1 2개 또는 DVI 4개)을 사용하여 연결해야 합니다. 이 차세대 해상도의 모니터는 단 하나의 케이블(DP 1.2 HBR2 또는 HDMI 1.4a 3GHz)을 사용하여 연결됩니다. 그리고 AMD의 새로운 비디오 카드는 이미 그러한 모니터를 위한 준비가 되어 있으며, 다시 세계 최초가 되었습니다.

비디오 인코딩 및 디코딩

AMD Radeon HD 7970에는 이전 세대의 회사 비디오 칩에 등장한 비디오 데이터 디코딩을 위한 동일한 UVD 블록이 포함되어 있는 것이 당연합니다. MVC 멀티 스트림 코덱, MPEG-2/MPEG-4(DivX), VC-1 및 H.264 디코딩을 지원하고 지원되는 모든 형식의 FullHD 스트림 2개를 디코딩하는 등 수정이 필요하지 않습니다.

AMD 솔루션 제공 최대 품질비디오 스트림 디코딩, 수십 가지 특수 품질 개선 알고리즘을 사용하고 HQV와 같은 품질 테스트에서 최대 결과를 제공합니다. 지원되는 기능 중에는 색상 및 톤 조정, 노이즈 감소, 선명하게 하기, 고품질 스케일링, 동적 대비, 고급 디인터레이싱 및 역 텔레시네가 있습니다. 다음은 즉석 대비 향상의 예입니다.

그러나 디코딩과 함께 모든 비디오 칩은 오랫동안 순서가 있었습니다. 모든 새로운 GPU는 비디오 데이터를 볼 때 적절한 품질과 성능을 제공합니다. 그러나 GPU의 비디오 인코딩은 아직 초기 단계이며 사용자의 주요 불만은 결과 압축 이미지의 품질이 낮다는 것입니다.

아마도 새로운 Radeon HD 7000 시리즈는 시리즈의 모든 그래픽 프로세서에 VCE(비디오 코덱 엔진) 비디오 인코딩 장치가 있기 때문에 이를 도울 수 있습니다. Radeon HD 7970은 하드웨어 가속 인코딩 및 특수 블록(이전에는 스트림 프로세서가 인코딩에 참여)을 사용하여 비디오 압축을 지원하는 최초의 그래픽 카드였습니다.

실시간보다 훨씬 빠른 60fps 인코딩에서 1080p를 지원하므로 품질과 성능이 이전보다 확실히 향상되어야 합니다. 테스트 없이 품질을 말하기는 어렵지만 우리는 약속합니다. 다른 수준비디오 및 게임을 위한 인코더 최적화 및 가변 압축 품질(품질 또는 성능 향상 중에서 선택하는 기능).

지금까지 VCE를 시도할 수 있는 곳이 없습니다. 단순히 이를 지원하는 응용 프로그램이 없지만 AMD는 관련 VCE에 대한 지원을 제공하기 위해 ArcSoft와 같은 파트너와 협력하고 있습니다. 소프트웨어 제품. 향후에는 개발자가 차세대 AMD 제품을 보다 쉽게 지원할 수 있도록 비디오 인코딩을 가속화하기 위한 소프트웨어 라이브러리를 출시할 계획입니다.

인코딩은 전체 및 하이브리드(GPU 스트림 프로세서의 기능 사용)의 두 가지 모드로 수행할 수 있습니다. 전체 모드는 최대 에너지 효율성과 일관된 수준의 성능이 필요한 애플리케이션을 위해 설계되었습니다. VCE의 전체 모드 인코딩은 실시간보다 빠르고 짧은 대기 시간을 제공합니다. 그러나 하이브리드 모드도 있습니다.

이 모드에서 GPU 수학 블록은 VCE와 함께 작동합니다. 다이어그램에서 노란색 원으로 표시된 모든 고도로 병렬화 가능한 단계는 GCN 계산 장치의 성능을 사용할 수 있으며 전용 VCE 장치는 효율적인 하드웨어 엔트로피 코딩에 참여합니다. 이 모드는 Radeon HD 7970과 같이 수학적 능력이 뛰어난 비디오 카드에 매우 적합합니다. 이 두 모드의 품질에 대한 질문이 있지만 별도의 자료에서 철저한 분석이 필요합니다.

AMD 스테디 비디오

비디오 데이터를 인코딩 및 디코딩하는 것 외에도 삼각대 및 기타 유사한 이미지 안정화 도구를 사용하지 않고도 품질이 낮은 핸드헬드 비디오를 개선하는 AMD의 새로운 그래픽 성능을 위한 애플리케이션이 하나 더 있습니다. 비디오 안정화 기술은 AMD Steady Video라고 하며, 이미 두 번째 버전이 출시되었습니다.

소프트웨어 안정기의 알고리즘은 매우 간단합니다. 비디오 스트림을 기반으로 카메라 움직임(이동, 회전, 확대/축소)에 대한 통계가 수집되고 이 움직임이 이전 프레임과 비교하여 현재 프레임에서 보정됩니다. 이미지가 이동됩니다. , 회전 및 크기가 조정되어 사진이 많이 흔들리지 않고 안정적으로 유지됩니다.

말은 쉽지만 실천은 어렵다. 화면에 2백만 개의 픽셀이 있고 초당 최대 30개 또는 심지어 60개 프레임이 있기 때문에 가능한 모든 프레임 이동을 추적하기 위해 얼마나 많은 계산을 수행해야 하는지 상상해 보십시오. 우리는 이미 비디오 처리에 사용되는 QSAD 기능에 대해 위에서 작성했으며, 모션 감지 알고리즘의 속도를 높이기 위해 Steady Video 2.0에서도 사용됩니다. 따라서 GPU는 모든 방향에서 최대 32픽셀의 진폭으로 임의 이동을 처리해야 하며, 이를 위해서는 초당 5000억 개 이상의 SAD 작업(60FPS에서 1920x1080)에 해당하는 성능이 필요합니다.

Radeon HD 7970에서 새로운 QSAD 명령어를 지원함으로써 모션 감지 알고리즘에서 강력한 CPU에 비해 10배를 초과하는 이점이 있습니다! 즉, 이제 비디오 편집기에서 홈 비디오를 처리할 때뿐만 아니라 다른 사람의 온라인 비디오를 볼 때 누구도 무엇을, 어떻게 촬영할지 모르는 고품질 비디오가 우리에게 제공될 것입니다.

세부 정보: Radeon HD 7800 시리즈

칩 코드명: "Pitcairn"
생산 기술: 28nm
28억 개의 트랜지스터(라데온 HD 6900 시리즈의 기반이 되는 카이맨보다 약간 많음)
정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
256비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 4개
코어 클럭: 최대 1000MHz(Radeon HD 7870용)
총 1280개의 부동 소수점 ALU가 있는 80개의 SIMD 코어로 구성된 20개의 GCN 컴퓨팅 유닛(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀도 지원)
모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 80개의 텍스처 유닛
FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티 앨리어싱 모드를 지원하는 32개의 ROP. 클럭당 최대 32개 샘플 및 무색 모드(Z 전용)에서 최대 성능 - 클럭당 128개 샘플

Radeon HD 7870 그래픽 사양

코어 주파수: 1000MHz
범용 프로세서 수: 1280
텍스처 유닛 수: 80, 블렌딩 유닛: 32
메모리 유형: GDDR5
메모리 용량: 2GB
이론상 최대 채우기 속도: 초당 32.0기가픽셀.
이론적 텍스처 샘플링 속도: 초당 80.0기가텍셀.
CrossFire 커넥터 1개
PCI 익스프레스 3.0 버스
커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
소비 전력: 3~175W
6핀 전원 커넥터 2개
듀얼 슬롯 디자인
미국 MSRP: $349

Radeon HD 7850 그래픽 사양

코어 주파수: 860MHz
범용 프로세서 수: 1024
텍스처 유닛 수: 64, 블렌딩 유닛: 32
유효 메모리 주파수: 4800MHz(4×1200MHz)
메모리 유형: GDDR5
메모리 용량: 2GB
메모리 대역폭: 초당 153.6GB
이론상 최대 채우기 속도: 초당 27.5기가픽셀.
이론적 텍스처 샘플링 속도: 초당 55.0기가텍셀.
CrossFire 커넥터 1개
PCI 익스프레스 3.0 버스
커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
소비 전력: 3~130W
듀얼 슬롯 디자인
미국 MSRP: $249

그리고 이번에는 자사 제품의 네이밍 원칙을 바꾸지 않고 이전 시리즈의 트렌드를 이어갔다. GCN 아키텍처를 기반으로 하는 중간 예산 시리즈의 비디오 카드는 인덱스의 두 번째 숫자에서 상단 및 예산 라인과 다릅니다. 7과 9 대신 숫자 8이 설정되어 매우 논리적입니다. AMD가 GPU 주파수에 대해 1000MHz의 심리적 임계값을 취했기 때문에 Radeon HD 7870은 이름에 "GHz Edition"을 추가하여 이 주파수의 채택을 나타냅니다.

이름에서 알 수 있듯이 Radeon HD 7800은 HD 7700보다 생산성이 높지만 이전 모델인 HD 7900에 비해 속도가 더 낮습니다. NVIDIA 솔루션과의 비교는 당시 출시된 이전 HD 7870입니다. 릴리스는 GeForce GTX 비디오 카드 570과 경쟁하고 더 어린 것은 GTX 560 Ti와 싸우는 것을 목표로 하며 NVIDIA는 아직 새로운 28nm 미드레인지 칩을 출시하지 않았습니다.

AMD의 두 가지 비디오 카드 모델에는 동일한 2GB의 GDDR5 메모리가 있습니다. 둘 다 256비트 메모리 버스를 사용하므로 1, 2 또는 4GB를 넣을 수 있습니다. 1GB는 너무 작고 4GB는 너무 비쌉니다. 가격대. 따라서 2GB의 이상적인 비디오 메모리가 선택되었다고 말할 수 있습니다. 이는 고해상도에서도 대다수의 게임에 충분하고 비용면에서 너무 비싸지 않습니다.

다른 면에서는 소비자의 관점에서 HD 7850과 HD 7870 모델은 여전히 다릅니다. 구형 라데온 HD 7870은 소비전력이 높아 6핀 전원 커넥터 2개가 추가로 필요하고, HD 7850은 그 중 하나만으로 만족한다. 두 보드 모두 2슬롯 냉각 시스템 설계를 가지고 있지만 대부분의 제조업체는 자체 설계로 최소한 쿨러와 심지어 PCB까지 설계한 보드를 생산합니다.

Radeon HD 7800 제품군의 아키텍처 기능

위에서 새로운 GCN(Graphics Core Next) 아키텍처의 모든 기능을 주의 깊게 설명했으므로 가장 중요한 것만 반복하겠습니다. 회사의 모든 새로운 GPU는 그래픽 처리뿐만 아니라 다양한 유형의 계산을 혼합한 비그래픽 컴퓨팅에서도 뛰어난 기능과 성능을 제공합니다. 또한 새로운 GCN 아키텍처는 코드 최적화 작업의 심각한 단순화, 개발 및 지원의 단순화, 안정적이고 예측 가능한 성능 및 일반적으로 상당히 높은 효율성을 제공합니다.

새로운 아키텍처의 기본 블록은 GCN 블록이며, 이 블록에서 서던 아일랜드 시리즈의 모든 GPU가 조립됩니다. Pitcairn 칩의 블록 다이어그램을 고려하십시오.

다이어그램은 Radeon HD 7870 GPU("단순화된" HD 7850은 연결이 끊긴 여러 블록이 다릅니다)를 보여줍니다. GCN 아키텍처의 20개의 컴퓨팅 장치가 있습니다. Radeon HD 7800 시리즈의 주니어 솔루션의 경우 그 중 4개가 비활성화되어 있고 그 안에 있는 활성 블록의 수는 16개입니다. 이는 각각 1280 및 1024 스트림 프로세서에 해당합니다(HD의 경우와 동일). 7700 제품군, 정확히 두 배의 블록만 있음) . 각 GCN 단위에는 4개의 텍스처 단위가 있으므로 이전 모델의 총 TMU 수는 80 TMU이고 더 젊은 모델의 경우 64 TMU입니다.

그러나 HD 7870 및 HD 7850의 ROP 및 메모리 컨트롤러 수 역시 가장 어린 라인의 솔루션과 동일합니다. ROP 블록의 수는 두 모델 모두 32개로 상당히 많이 남아 있습니다. Pitcairn 기반 보드용 메모리 버스는 256비트로 축소되었으며 4개의 64비트 채널에서 조립됩니다. 메모리 버스가 전통적으로 먼저 절단되기 때문에 맨 위 라인보다 1.5배 적지만 이 수준의 솔루션에는 나쁘지 않습니다. 빠른 GDDR5 메모리를 사용하여 153GB/s의 비교적 높은 대역폭을 제공하는 것이 좋습니다.

나머지 GCN 아키텍처 칩과 마찬가지로 Pitcairn은 9세대 테셀레이터 블록을 통합합니다. 이 블록은 다양한 버퍼링 및 캐싱 최적화를 특징으로 하여 지오메트리 처리 성능을 크게 향상시킬 수 있습니다. 다음은 합성 문제에서 이전 세대의 솔루션과 새로운 AMD 보드를 비교한 것입니다. 이에 따라 테셀레이션 속도가 최대 4배 증가한다고 가정할 수 있습니다.

새로운 Radeon HD 7000 비디오 칩에 도입 및 개선된 많은 AMD 기술도 동일한 방식으로 지원됩니다. 여기에 불완전한 목록이 있습니다: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, 텍스처 필터링 품질 개선 등 이 모든 것은 위에서 더 자세히 설명되어 있습니다. 목록에 추가하기 위해 Radeon HD 7800은 개선된 MLAA 2.0 앤티앨리어싱 알고리즘과 SSAA(수퍼샘플링 앤티앨리어싱)를 모두 완벽하게 지원합니다.

게임에서의 성능 비교에 관한 한 Radeon HD 7870은 직접적인 경쟁자 GeForce GTX 570보다 훨씬 빠릅니다. 특히 후자의 1.25GB VRAM(해당 솔루션의 경우 2GB와 비교)에 대해 다음에서 관찰되었습니다. 높은 렌더링 해상도의 최신 게임. 더 젊은 Radeon HD 7850은 GeForce GTX 560 Ti와 비교할 수 있으며 여기서 더 이상 메모리 양을 자랑할 수 없습니다. 그러나 AMD의 측정에 따르면 그들의 새로운 솔루션은 여전히 대부분의 게임에서 경쟁 제품보다 빠릅니다.

세부 정보: Radeon HD 7700 시리즈

칩 코드명: "Cape Verde"
생산 기술: 28nm
15억 개의 트랜지스터(Radeon HD 6800 시리즈의 기반이 되는 Barts보다 적음)
정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
코어 클럭: 최대 1000MHz(Radeon HD 7770용)
총 640개의 부동 소수점 ALU로 구성된 40개의 SIMD 코어를 포함한 10개의 GCN 컴퓨팅 유닛(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀도 지원)
모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 40개의 텍스처 유닛
HDMI 1.4a 및 DisplayPort 1.2를 포함하여 최대 6개의 모니터에 대한 통합 지원

Radeon HD 7770 그래픽 사양

코어 주파수: 1000MHz
범용 프로세서 수: 640
텍스처 유닛 수: 40, 블렌딩 유닛: 16
메모리 유형: GDDR5
메모리 용량: 1기가바이트
이론적 텍스처 샘플링 속도: 초당 40.0기가텍셀.
CrossFire 커넥터 1개
PCI 익스프레스 3.0 버스
커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
소비 전력: 3~80W
6핀 전원 커넥터 1개
듀얼 슬롯 디자인
미국 권장소비자가격: $159

Radeon HD 7750 그래픽 사양

코어 주파수: 800MHz
범용 프로세서 수: 512
텍스처 유닛 수: 32, 블렌딩 유닛: 16
유효 메모리 주파수: 4500MHz(4×1125MHz)
메모리 유형: GDDR5
메모리 용량: 1기가바이트
메모리 대역폭: 초당 72GB
이론상 최대 채우기 속도: 초당 12.8기가픽셀.
이론적 텍스처 샘플링 속도: 초당 25.6기가텍셀
PCI 익스프레스 3.0 버스
커넥터: DVI 듀얼 링크, HDMI 1.4, DisplayPort 1.2 1개
소비 전력: 3~55W
추가 전원이 필요하지 않음
단일 슬롯 디자인
미국 MSRP: $109

GCN 아키텍처를 기반으로 한 저가형 비디오 카드 시리즈는 인덱스의 두 번째 숫자에서 상단 및 중간 라인과 다릅니다. 이전과 마찬가지로 9위는 숫자 7로 차지했습니다. Radeon HD 7770은 더 생산적인 솔루션이지만 더 젊은 모델인 HD 7750도 있습니다. 이전 보드는 출시 당시 시장에 직접적인 경쟁자가 없었으며 GeForce GTX 560과 GTX 550 Ti 사이에 위치했습니다. , 그리고 더 어린 것은 GTX 550 Ti와 싸우는 것을 목표로 합니다. HD 7770의 경우 GeForce GTX 560 SE에 맞서 경쟁자가 나중에 발표되었습니다(모든 NVIDIA 솔루션은 구형 GPU를 기반으로 함).

AMD 비디오 카드의 고려된 두 모델 모두 1GB의 동일한 양의 GDDR5 메모리를 가지고 있습니다. 128비트 메모리 버스를 사용하기 때문에 2GB를 추가할 수 있지만 이 정도의 GDDR5 메모리는 가격대에 비해 너무 많은 비용이 듭니다. 따라서 이러한 볼륨의 모델은 지금까지 출시되었지만 향후 2GB의 비디오 메모리 옵션도 출시될 수 있습니다. 그동안 우리는 HD 7800용으로 이 볼륨을 남겨두기로 결정했습니다.

다른 소비자 특성 측면에서 HD 7750 및 HD 7770 모델은 상당히 다릅니다. 구형 Radeon HD 7770에 냉각 시스템의 2슬롯 디자인이 있고 쿨러가 구형 솔루션과 같이 플라스틱 케이스로 덮인 경우, 더 젊은 HD 7750은 하나의 슬롯을 차지하고 단순한 쿨러를 사용하여 눈에 띄게 더 단순해 보입니다. 그러나 대부분의 제조업체는 여전히 자체 디자인으로 보드를 생산합니다. 이 가격대의 새 모델의 전력 소비량도 다르며 이전 모델에는 6핀 보조 전원 커넥터가 1개 있고 젊은 모델에는 PCI Express로 전원이 공급됩니다.

아키텍처 기능 Radeon HD 7700

새로운 아키텍처의 기본 블록은 GCN 블록이며 시리즈의 모든 GPU가 이 블록에서 조립됩니다. 사용 가능한 각 GCN 블록은 자체적으로 명령을 스케줄링하고 배포할 수 있으며 하나의 컴퓨팅 장치는 최대 32개의 독립 명령 스트림을 실행할 수 있습니다. Cape Verde 칩의 블록 다이어그램을 살펴보겠습니다.

다이어그램은 Radeon HD 7770 GPU를 보여줍니다("제거된" HD 7750은 몇 개의 연결 해제된 장치를 특징으로 함). 우리는 GCN 아키텍처의 10개의 컴퓨팅 장치를 볼 수 있습니다. Radeon HD 7700 시리즈의 주니어 솔루션의 경우 그 중 2개를 비활성화하기로 결정하여 블록 수가 8개가 되었습니다. 이는 640 및 512 스트림 프로세서에 해당합니다. 그리고 각 GCN 단위의 구성에는 4개의 텍스처 단위가 있으므로 이전 모델의 TMU 수에 대한 최종 수치는 40 TMU이고 더 젊은 모델의 경우 32 TMU입니다.

HD 7770과 HD 7750의 ROP와 메모리 컨트롤러의 수는 동일하며 ROP를 너무 많이 자르지 않고 각각 16개로 유지하기로 결정했습니다. 그러나 Cape Verde의 메모리 버스는 2개의 64비트 채널에서 조립된 128비트로 축소되었습니다. 일반적으로 이것은 상위 시리즈보다 3배 적으며 우선 저렴한 칩에서 메모리 버스가 전통적으로 축소된다는 또 다른 확인을 보았습니다. 빠른 GDDR5 메모리를 사용하면 72GB/s의 비교적 높은 대역폭(저렴한 솔루션의 경우)을 남길 수 있습니다.

상당히 많은 양의 L2 캐시(최고급 칩의 경우 768KB와 비교하여 - 분명히 L2 캐시는 칩에서 너무 많은 공간을 차지하지 않음)에 주목해야 합니다. 기하학적 성능의 개선으로. 최고급 칩과 마찬가지로 Cape Verde는 다중 버퍼링 및 캐싱 최적화를 특징으로 하는 9세대 테셀레이터를 사용하여 Radeon HD 6000 시리즈에 비해 상당한 지오메트리 성능 향상을 제공합니다.

일반적으로 새로운 Radeon HD 7000 비디오 칩에서 구현 및 개선된 AMD 기술에 대한 모든 정보를 반복하지는 않을 것입니다(여기에 일부 목록이 있습니다: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, 텍스처 필터링 품질 개선 , etc. .p.), 이 모든 것이 위에서 더 자세히 설명되어 있습니다. HD 7700 시리즈는 6개의 모니터와 스테레오 렌더링을 지원하는 AMD Eyefinity 2.0은 물론 향상된 비디오 디코딩 및 인코딩 장치를 포함하여 여기에 나열된 모든 기능을 지원합니다.

그러나 가장 중요한 것은 무엇입니까? 게임에서의 성능은 무엇입니까? 렌더링 속도의 첫 번째 추정은 항상 제조업체의 프레젠테이션에서 확인할 수 있습니다. AMD는 Radeon HD 7770이 각각 GeForce GTX 560과 GeForce GTX 550 Ti의 중간쯤에 있다고 생각하고 두 번째 경쟁 모델과 소재를 비교합니다.

그러나 그들은 Radeon HD 7750을 어떤 것과도 비교하지 않으며, 단순히 FullHD 해상도의 최대 설정에서 이 모델에서 대부분의 최신 게임을 재생할 수 있다는 점에 주목합니다. 그러나 최근 몇 년 동안 PC 독점이 거의 없었고 다중 플랫폼 게임이 훨씬 덜 까다 롭기 때문에 이것은 놀라운 일이 아닙니다. 따라서 Radeon HD 7700 시리즈 보드는 까다로운 사용자에게 적합합니다.

세부 정보: 모델 Radeon HD 7790

칩 코드명: "Bonaire"
생산 기술: 28nm
20억 8000만 트랜지스터(Radeon HD 7700의 Cape Verde보다 많지만 Radeon HD 7800의 Pitcairn보다 작음)
정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
128비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 2개
코어 주파수: 1000MHz
총 896개의 부동 소수점 ALU(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀도 지원)가 있는 56개의 SIMD 코어로 구성된 14개의 GCN 계산 장치
모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 56개의 텍스처 유닛
FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티 앨리어싱 모드를 지원하는 16개의 ROP. 클럭당 최대 16개 샘플 및 무색 모드(Z 전용)에서 최대 성능 - 클럭당 64개 샘플

Radeon HD 7790 그래픽 사양

코어 주파수: 1000MHz
범용 프로세서 수: 896
텍스처 유닛 수: 56, 블렌딩 유닛: 16
메모리 유형: GDDR5
메모리 용량: 1기가바이트
메모리 대역폭: 초당 96GB
이론상 최대 채우기 속도: 초당 16.0기가픽셀.
이론적 텍스처 샘플링 속도: 초당 56.0기가텍셀.
CrossFire 커넥터 1개
PCI 익스프레스 3.0 버스
커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
소비 전력: 3~85W
6핀 전원 커넥터 1개
듀얼 슬롯 디자인
미국 권장소비자가격: $149

새로운 중간 예산 칩을 기반으로 한 저렴한 비디오 카드 모델은 인덱스의 세 번째 숫자만큼 HD 7700 하위 제품군의 이전 상위 모델과 다릅니다. 7 대신 성능 향상을 나타내는 숫자 9를 넣습니다. 동시에 Radeon HD 7790 인덱스는 한 단계 더 높은 HD 7800 라인에 비해 생산성이 떨어지는 비디오 카드임을 분명히 나타냅니다.

그러나 여기에서도 모든 것이 그렇게 간단하지 않습니다. 확실히 더 젊은 HD 7850과 논쟁할 수 있습니다. 그러나 Radeon HD 7790의 권장 가격은 149달러로, HD 7770과 HD 7850의 중간 정도입니다. 같은 가격대의 경쟁사 솔루션에 대해서는 HD 7790의 출시가 GK106 칩을 기반으로 하는 GeForce GTX 650 Ti는 가격과 속도 면에서 HD 7770과 HD 7850 사이에 위치합니다. 그러나 NVIDIA는 AMD의 새 보드 출시에 즉시 더 뛰어난 성능이 특징인 GeForce GTX 650 Ti Boost의 오버클럭 버전을 출시하여 대응했습니다.

이 AMD 그래픽 카드 모델에는 1GB 용량의 GDDR5 메모리가 있습니다. GPU에는 128비트 메모리 버스가 있으며 이론적으로 2GB를 공급할 수 있지만 이 가격대의 고속 GDDR5 메모리는 여전히 너무 비싸고 AMD는 메모리가 더 작은 모델을 출시했지만 그렇지는 않을 수도 있습니다. 낮은 설정과 해상도에서도 일부 최신 게임에는 충분합니다. 그러나 2GB의 비디오 메모리가 있는 파트너의 비디오 카드도 가능합니다.

옆에 나란히 서 있는 모델과 마찬가지로 Radeon HD 7790에는 플라스틱 케이스로 덮인 냉각 시스템의 이중 슬롯 설계가 있습니다. 대부분의 제조업체는 여전히 자체 쿨러 디자인의 보드를 출시하지만 참조용 보드는 그다지 중요하지 않습니다. 흥미롭게도 새 모델의 소비 전력은 HD 7770에 비해 크게 증가하지 않았지만 에너지 효율의 향상이 기대됐다. 그건 그렇고, 이것이 참신에 6 핀 보조 전원 커넥터가 하나만있는 이유입니다.

건축적 특징

출시된 Radeon HD 7790의 기반이 되는 새로운 Bonaire GPU는 우리가 1년 반 동안 알고 있던 것과 동일한 GCN(Graphics Core Next) 아키텍처에 속하지만 AMD는 이를 GCN 1.1이라고 부르며 사소한 변경을 암시합니다. 사실, 칩은 약간의 변화가 있긴 하지만 아키텍처적으로는 이전 칩과 거의 동일합니다. 예를 들어, 새로운 아키텍처는 이기종 아키텍처(Heterogeneous System Architecture - HSA), 더 많은 동시 실행 스레드 지원, AMD PowerTune 기술의 새 버전에 유용한 지침을 도입했습니다. 그러나 이러한 모든 변경 사항은 기본 블록에 새로운 것이 없고 효율성이 향상되기 때문에 중요하다고 할 수 없습니다.

따라서 새로운 GCN(Graphics Core Next) 아키텍처의 모든 기능을 주의 깊게 설명하는 를 안전하게 참조할 수 있으며 여기서는 특정 제품의 가장 중요한 특성 및 기능만 반복합니다. AMD의 모든 최신 GPU는 두 가지를 혼합한 것을 포함하여 그래픽 및 비그래픽 처리 모두에서 뛰어난 기능과 성능을 제공합니다. 새로운 GCN 아키텍처는 또한 높은 효율성을 유지하면서 최적화 및 소프트웨어 개발 작업을 크게 단순화합니다.

아시다시피 아키텍처의 기본 블록은 남군도 시리즈의 모든 GPU가 조립되는 GCN 블록입니다. GCN 컴퓨팅 장치는 하위 섹션으로 나뉘며 각 하위 섹션은 자체 명령 스트림에서 작동합니다. GCN 블록에는 데이터 교환 또는 로컬 레지스터 스택 확장을 위한 전용 64KB 로컬 데이터 스토리지가 있습니다. 또한 블록에는 읽기 및 쓰기 기능이 있는 1단계 캐시 메모리와 샘플링 및 필터링 블록이 있는 본격적인 텍스처 파이프라인이 있습니다. 사용 가능한 각 GCN 장치는 자체적으로 명령을 스케줄링하고 배포할 수 있으며 하나의 컴퓨팅 장치는 여러 개의 독립적인 명령 스트림을 실행할 수 있습니다. 새 칩의 블록 다이어그램을 살펴보겠습니다.

Bonaire 방식은 10개의 GCN 컴퓨팅 장치가 있는 Cape Verde와 20개의 GCN 장치가 있는 Pitcairn 간의 성능을 제공하는 새로운 솔루션의 목표를 확인합니다. 2012년에 출시된 이 두 GPU는 크기가 거의 정확히 절반에 불과하기 때문에 중간에 다소 큰 성능 격차가 있었는데 보네르가 이를 메웠습니다.

다이어그램은 어떤 블록도 자르지 않는 완전한 솔루션인 Radeon HD 7790 형태의 그래픽 프로세서를 보여줍니다. 이 칩에는 896개의 스트림 프로세서에 해당하는 GCN 아키텍처의 14개의 컴퓨팅 장치가 포함되어 있습니다. 각 GCN에는 4개의 텍스처 단위가 있으므로 새 모델의 총 TMU 수는 56 TMU입니다. 즉, Bonaire는 주파수가 동일할 경우 수학적 계산 및 텍스처 가져오기 속도 측면에서 Cape Verde 칩보다 정확히 1.4배 빠릅니다.

그러나 Bonaire 및 Radeon HD 7790의 ROP 장치 및 메모리 컨트롤러 수는 Cape Verde 및 Radeon HD 7770에서 본 것과 유사합니다. 16개의 ROP 장치를 남기기로 결정했으며 새 칩의 메모리 버스는 128비트 , 2개의 64비트 채널에서 조립됩니다. 빠른 GDDR5 메모리를 사용하면 96GB/s의 비교적 높은 처리량을 제공할 수 있기 때문에 적은 수의 ROP 블록이 솔루션의 "아킬레스건"일 수 있지만 ROP 성능에 대해서는 아무 것도 할 수 없습니다.

그러나 새로운 GPU에서는 기하학적 성능과 테셀레이션 속도가 향상되었습니다. 예, Cape Verde에도 9세대 테셀레이터가 있지만 Bonaire는 지오메트리 블록, 래스터라이저 및 명령 프로세서(다이어그램에서 ACE로 표시)의 수를 두 배로 늘렸습니다. 이제 그 중 두 개가 있습니다. 이러한 개선을 통해 Bonaire는 더 강력한 Pitcairn 및 Tahiti와 마찬가지로 클록당 최대 2개의 기하학적 원형을 처리할 수 있습니다.

기억하시겠지만, AMD가 처음으로 1GHz와 동일한 GPU 클럭 주파수의 중요한 심리적 임계값을 취한 것은 Radeon HD 7770이었습니다. 따라서 HD 7790도 1GHz의 동일한 기준 주파수를 가지므로 HD 7770에 비해 성능이 향상되는 것은 아키텍처 변경과 실행 장치 수의 증가만으로 정당화될 수 있습니다.

그러나 참신함의 비디오 메모리의 빈도는 훨씬 높습니다. HD 7770의 메모리 주파수가 4.5GHz로 비교적 낮았다면 HD 7790에는 6GHz에서 작동하는 고속 GDDR5 메모리가 장착되어 3분의 1 더 많은 대역폭을 제공합니다. Radeon HD 7700 하위 제품군에 비해 비디오 메모리 대역폭이 33% 증가하여 게임 성능이 확실히 향상되었습니다. AMD는 HD 7790 프레임 속도와 4.5 및 6.0GHz에서 실행되는 메모리를 비교하여 이 차트를 제공합니다.

메모리 대역폭 증가로 인한 최대 속도 향상은 StarCraft II 및 Crysis 2와 같은 게임에서 달성되었습니다. 그리고 평균적으로 메모리 대역폭이 33% 증가하면 최신 게임 세트에서 평균 프레임 속도가 약 10% 증가합니다. 성능에 대한 유일한 강조는 아니지만 메모리 대역폭이 우리 시대에 매우 중요하다는 것을 보여주는 나쁜 지표는 아닙니다. 더 많은 ROP를 사용하면 Bonaire의 속도가 훨씬 더 빨라질 수 있습니다.

HD 7770에 비해 평균 소비 전력이 약간 증가한 것은 분명합니다. 이전 모델의 경우 이 값이 80W이고 HD 7790의 경우 85W입니다. 이것은 33-40%의 이론적 성능 향상을 위해 지불하기에는 매우 작은 가격입니다! 아키텍처 개선(PowerTune), 이전 GPU의 경험을 기반으로 한 새로운 GPU 설계 및 TSMC의 기술 프로세스의 지속적인 개선 - 이 모든 것이 속도 특성의 상당한 개선과 함께 약간의 소비 증가로 이어졌습니다.

Bonaire의 칩 면적과 트랜지스터 수는 새 칩이 확실히 Cape Verde보다 크지만 계산, 질감 및 기하학적 단위의 추가는 눈에 띄지 않을 수 없었습니다. 이러한 매개변수에 따르면 Bonaire는 Cape Verde와 Pitcairn 사이의 대략 중간에 위치합니다. Bonaire는 160mm 2 칩에 20억 8천만 개의 트랜지스터를 포함하고 있으며 Cape Verde의 경우 이 수치는 각각 15억 및 123mm 2이며 Pitcairn의 경우 28억 개의 트랜지스터 및 212mm 2 칩 면적입니다.

당연히 새로운 칩은 새로운 Radeon HD 7000 제품군(불완전한 목록: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, 텍스처 필터링 품질 개선 등)에 도입 및 개선된 모든 AMD 기술을 지원합니다. AMD Radeon HD 7970: 새로운 단일 프로세서 리더 문서에 자세히 설명되어 있습니다. HD 7790 모델은 6개의 모니터와 스테레오 렌더링이 있는 AMD Eyefinity 2.0을 포함하여 나열된 모든 기능을 지원하며 향상된 비디오 디코딩 및 인코딩 장치도 갖추고 있습니다.

향상된 PowerTune 기술

2010년에 AMD는 Cayman 칩(AMD Radeon HD 6900 시리즈)에 PowerTune 기술을 도입했습니다. 이 GPU는 PowerTune이라는 동적 전원 관리 기능을 최초로 탑재했습니다. FurMark와 같은 특수 안정성 테스트에서 너무 많은 전력 소비를 피하면서 일반적인 애플리케이션의 최대 클럭 속도를 높일 수 있었습니다. 그런 다음이 기술은 듀얼 칩 모델 AMD Radeon HD 6990에 적용되었으며 분명한 이유로 더 필요했습니다.

이 기술은 2012년 중반에 AMD PowerTune에 자동 주파수 증가인 Boost가 추가되면서 주요 업데이트를 받았습니다. AMD Radeon HD 7970 GHz Edition에서 이 알고리즘은 비디오 카드의 일반 버전에 비해 훨씬 더 많은 성능 향상을 허용했습니다. 자동 오버클럭이 없는 그래픽 카드의 PowerTune 작동 알고리즘은 유휴(유휴), 경부하 모드(낮은 3D) 및 최대 속도의 세 가지 상태를 사용합니다. HD 7970GHz에는 Boost 오버클러킹 모드가 추가되었습니다. PowerTune은 필요할 때 더 낮은 부하 모드로 전환하여 필요한 소비량 내에서 유지하는 역할을 합니다. 이 경우 기술은 클록 주파수 값을 크게 줄입니다. 실제로 이러한 점프는 두 가지 활성 모드 사이의 큰 간격으로 인해 드뭅니다.

GPU 클럭 속도를 낮추면 전력 소비가 줄어들지만 더 많은 효과적인 관리전압을 줄여야 합니다. 이것이 바로 Radeon HD 7790이 하는 일입니다. 새로운 Bonaire 그래픽 칩은 다른 주파수와 전압 설정을 가진 8개의 상태를 가지고 있어 GPU가 항상 최적의 전압과 주파수에서 실행되도록 하는 동시에 이전보다 더 높은 클럭 속도를 허용합니다. 상태 간 전환은 GPU 부하와 현재 GPU 전력 소비를 기반으로 합니다.

새로운 알고리즘에서 PowerTune은 소비 수준을 초과할 때 주파수를 갑자기 떨어뜨릴 필요가 없으며 주파수와 함께 전압도 감소합니다. 상태 전환은 짧은 시간에도 소비 제한을 초과하지 않도록 가능한 한 빨라야하므로 Bonaire는 10ms마다 PowerTune 상태를 전환합니다. 즉, 1초마다 칩의 상태가 100번 변경됩니다.

그러한 끊임없는 변화주파수에서 MSI Afterburner 및 GPU-Z와 같은 타사 응용 프로그램은 즉각적인 클럭 속도가 아니라 일정 기간 동안의 평균을 표시합니다. 즉, 소위 "유효" 주파수입니다. 또 다른 흥미로운 혁신은 AMD가 새로운 PowerTune 설정을 타사 애플리케이션. 또한 파트너는 자체 PowerTune 설정을 지정하여 공장에서 오버클럭된 그래픽 카드를 생성하고 AMD의 참조 값보다 더 많은 기능을 제공할 수 있습니다. 진실, 다른 설정 PowerTune은 다른 제조업체의 동일한 모델의 비디오 카드가 서로 다른 클럭 주파수를 가질 뿐만 아니라 시간이 지남에 따라 변경하는 알고리즘을 갖게 되므로 동일한 조건에서 비교하기 어렵습니다.

Radeon HD 7790 모델의 비디오 카드 판매는 2013년 4월 초에 시장에서 시작되었습니다. AMD는 파트너와 함께 기준 주파수와 공장 오버클럭 솔루션이 있는 두 마더보드의 출시를 조직했습니다. 그리고 이제 두 제조업체는 파트너가 제공하는 다양한 옵션을 통해 거의 동일한 방식으로 새로운 비디오 카드를 시장에 출시하고 있습니다. 사실, 파트너들은 기존의 것보다 거의 더 많은 오버클럭된 HD 7790 버전을 출시했으며, 그 안에 있는 그래픽 칩은 약 1075MHz의 주파수에서 작동합니다.

세부 정보: Radeon HD 7990 모델

코드네임 "몰타"
생산 기술: 28nm
각각 43억 개의 트랜지스터가 있는 2개의 칩
정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
이중 384비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 2배 6개
GPU 주파수: 1000MHz
총 4096개의 부동 소수점 ALU로 구성된 128개의 SIMD 코어를 포함한 32개의 GCN 컴퓨팅 장치(정수 및 부동 형식, IEEE 754 표준 내에서 FP32 및 FP64 정밀도 지원)
모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 2x128 텍스처 단위
FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티앨리어싱 모드를 지원하는 2x32 ROP. 클럭당 최대 64개 샘플 및 무색 모드(Z만 해당)에서 최대 성능 - 클럭당 256개 샘플
HDMI 1.4a 및 DisplayPort 1.2를 통해 최대 6개의 모니터에 대한 통합 지원

Radeon HD 7990 그래픽 사양

코어 주파수: 1000MHz
범용 프로세서 수: 4096
텍스처 단위 수: 2x128, 혼합 단위: 2x32
유효 메모리 주파수: 6000MHz(4×1500MHz)
메모리 유형: GDDR5
메모리 용량: 2x3GB
메모리 대역폭: 초당 2x288GB
이론상 최대 채우기 속도: 초당 64기가픽셀.
이론적 텍스처 샘플링 속도: 초당 256기가텍셀.
CrossFire 커넥터 1개
PCI 익스프레스 3.0 버스
커넥터: DVI 듀얼 링크, 4개의 Mini-DisplayPort 1.2
최대 375W의 전력 소비
2개의 8핀 보조 전원 커넥터
듀얼 슬롯 디자인
러시아의 권장 가격은 32,999루블입니다. (미국의 경우 - $999).

이미 2세대 AMD 비디오 카드에서 듀얼 칩 모델의 명명 원칙은 변경되지 않았습니다. 두 개의 가장 강력한 비디오 칩을 기반으로 하는 최고의 솔루션은 인덱스의 첫 번째 숫자에서 이전 세대의 해당 모델과 다릅니다. 6 대신 새 시리즈를 나타내는 숫자 7을 받았습니다. 발표된 비디오 카드는 단일 칩 솔루션과 세 번째 숫자가 달라 세대 내 최대 성능을 나타냅니다.

경쟁사와 비교하자면 오늘 발표된 Radeon HD 7990 모델의 주요 라이벌은 지포스 그래픽 카드거의 1년 전에 출시된 GTX 690과 이 2칩 솔루션이 서로 싸워야 할 것입니다. 사실, NVIDIA는 또 다른 강력한 솔루션을 가지고 있지만 단일 GPU를 기반으로 하는 GeForce GTX Titan은 AMD의 해당 마더보드의 경쟁자로 간주될 수도 있습니다.

새로운 듀얼 칩 Radeon 비디오 카드에는 Tahiti 칩의 384비트 메모리 버스로 인해 GPU당 3GB 용량의 GDDR5 메모리가 장착되어 있습니다. 이러한 볼륨은 최대 설정, 앤티앨리어싱 및 고해상도가 활성화된 일부 최신 게임 응용 프로그램에서는 더 이상 작은 양의 메모리(칩당 2GB 이하)가 더 이상 사용되지 않을 수 있기 때문에 이러한 높은 수준의 제품에 대해 정당화됩니다. 충분한. 그리고 스테레오 모드 또는 Eyefinity 모드의 다중 모니터에서 렌더링할 때 더욱 그렇습니다.

이러한 강력한 듀얼 칩 그래픽 카드에는 기존 AMD 카드 쿨러와 다른 방대한 듀얼 슬롯 냉각 시스템이 있음이 분명합니다. 비교적 낮은 속도로 작동하는 3개의 대형 팬이 있는 덮개 아래에 숨겨진 거대한 방열판을 갖추고 있습니다. 듀얼 GPU 카드의 전력 소비는 명백한 이유 때문에 상당히 높으며 2개의 8핀 전원 커넥터가 있지만 최소한 3개는 아닙니다. 2개의 Tahiti 칩을 기반으로 하는 비참조 샘플의 경우와 같습니다.

건축물

코드명 "Malta"인 비디오 카드는 Southern Islands 제품군의 "Tahiti" GPU 2개를 기반으로 하므로 현재 GCN(Graphics Core Next) 아키텍처의 모든 기능을 철저하게 설명하는 참조만 하면 됩니다. 모재에서는 특정 제품의 가장 중요한 특성과 특징만을 반복합니다.

아키텍처의 기본 블록은 시리즈의 모든 GPU가 조립되는 GCN 블록입니다. 계산 단위는 하위 섹션으로 나뉘며 각 하위 섹션은 자체 명령 스트림에서 작동하며 데이터 전용 로컬 스토리지, 읽기 및 쓰기 기능이 있는 1단계 캐시 메모리, 샘플링 및 필터링 장치. 각 GCN 유닛은 자체적으로 명령을 스케줄링하고 배포할 수 있으며 하나의 컴퓨팅 유닛은 여러 개의 독립적인 명령 스트림을 실행할 수 있습니다. Radeon HD 7990은 이미 우리에게 알려진 두 개의 Tahiti 칩을 사용합니다.

그래픽 프로세서 다이어그램(Radeon HD 7990에는 2개 있음)은 GCN 아키텍처의 32개 컴퓨팅 장치를 보여주며 모두 활성 상태입니다. 이전에는 2칩 솔루션의 경우 375W의 전력 소비에 진입하기 위해 일부를 꺼야 하고 주파수를 낮추어야 한다고 가정했지만 AMD 엔지니어는 이 어려운 작업을 성공적으로 해결했습니다. 아마도 전력 소비가 낮은 Tahiti의 새로운 개정판이 출시되었거나 칩이 매우 엄격한 선택을 통과했을 수 있습니다.

각 GCN 유닛에는 16개의 텍스처 유닛이 있기 때문에 TMU의 수는 칩당 128 유닛으로 초당 256기가텍셀의 총 성능을 제공하며 이는 GeForce GTX 690 경쟁자에게 매우 좋습니다. HD 7990도 단일 칩에 비해 변화가 없었고 GPU당 각각 32개, 6개로 남았다. Radeon HD 7990에는 12개의 64비트 채널로 구성된 듀얼 384비트 메모리 버스가 있어 총 메모리 대역폭이 576GB/s로 또 다른 기록입니다.

다른 모든 측면에서 새 보드는 새로운 Radeon HD 7000 비디오 칩에 도입 및 개선된 모든 최신 AMD 기술(PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, 향상된 텍스처 필터링 품질 등)을 지원합니다. 이 모든 것은 위의 Radeon HD 7970에 대한 설명에서 자세히 설명되어 있으며 반복할 필요가 없습니다.

냉각 시스템 및 전력 소비

이러한 심각한 듀얼 칩 보드의 경우 고효율 냉각 시스템이 특히 중요합니다. 2개의 타히티를 기반으로 한 파트너사의 솔루션의 경우 3슬롯 솔루션을 사용하고 ASUS ARES II의 경우 수냉식까지 사용했다면 이 경우 적은 노력으로 관리할 필요가 있었기 때문에 쿨러는 다음과 같이 설계되었습니다. 매우 방대한 방열판과 향상된 음향 특성을 가진 3개의 팬이 있습니다.

냉각 시스템의 소음과 그래픽 프로세서에 제공되는 온도는 매니아를 위해 설계된 최고의 솔루션을 포함하여 모든 비디오 카드의 가장 중요한 소비자 특성 중 하나입니다. 너무 시끄럽거나 비효율적인 냉각 시스템은 구매자가 덜 수익성 있는 구매로 간주하고 다른 모든 (대략) 지표는 동일합니다. 따라서 AMD는 시장의 다른 최고의 솔루션과 비교할 때 Radeon HD 7990에서 이 문제를 매우 심각하게 받아들였습니다. 새 시스템의 음향 특성을 고려하십시오.

이 다이어그램은 Radeon HD 7990과 두 개의 경쟁사인 NVIDIA의 듀얼 칩 GeForce GTX 690 및 단일 칩 GTX Titan인 세 가지 비디오 카드의 소음 수준을 보여줍니다. 또한, 소음은 Furmark를 사용하여 유휴 모드(시스템 유휴) 및 최대 부하와 같은 다양한 조건에서 측정되었습니다. AMD의 수치에 따르면 단일 칩 Titan조차도 쿨러 소음 측면에서 신제품에 미치지 못합니다. 듀얼 칩 GTX 690으로 이 비교에서 가장 시끄럽습니다.

그러나 이러한 인상적인 음향 성능이 달성된 것은 GPU 온도를 희생한 것이 아닙니까? 다음 차트는 AMD의 Radeon HD 7990과 동일한 두 경쟁업체에서 측정된 GPU 온도를 보여줍니다. 이번에 AMD는 Furmark에서 테스트할 때 고부하 모드만 사용했습니다.

그리고 다시 "교활한"좌표 축은 원점이 아닌 원점과 함께 사용됩니다. 제로 값. Radeon HD 7990과 GTX Titan의 80도와 82도의 실제 차이는 거의 감지할 수 없지만 GTX 690의 87도는 분명히 더 나쁩니다. 다시 말하지만, 이러한 모든 테스트는 이해 당사자에 의해 수행되었으며 독립적인 검증 대상입니다.

전력 소비 측면에서 듀얼 칩 솔루션은 새로운 것이 아니지만 이전에 발표된 ZeroCore Power 기술에 대한 지원도 여기에 있습니다. 이 기술디스플레이 장치가 꺼진 상태에서 "깊은 유휴"(또는 "절전") 모드에서 전력 소비를 크게 줄이는 데 도움이 됩니다. 이 모드에서 유휴 GPU는 거의 완전히 비활성화되고 전체 모드 전력의 5% 미만을 소비하여 대부분의 기능 블록을 끕니다. 그리고 2칩 보드의 경우 CrossFire 시스템에서 운영 체제의 2차원 인터페이스를 렌더링할 때 기본 GPU를 제외한 모든 GPU가 전혀 작동하지 않는 것이 훨씬 더 중요합니다. 즉, Radeon HD 7990의 경우 2D 모드의 칩 중 하나는 최소한의 전력 소비로 딥 슬립에 잠기고 두 번째 칩은 PC 딥 유휴 모드에서 "절전"할 수 있습니다.

단지에 대해. 프로그램들. 철. 인터넷. 창