• 칩 코드명: "Tahiti"
  • 43억 개의 트랜지스터(Cayman보다 60% 이상, Cypress보다 정확히 두 배)
  • 384비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 6개
  • 코어 클럭: 최대 925MHz(Radeon HD 7970용)
  • 총 2048개의 부동 소수점 ALU(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀도 지원)를 위한 128개의 SIMD 코어가 있는 32개의 GCN 계산 장치
  • 모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 128개의 텍스처 유닛
  • FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티 앨리어싱 모드를 지원하는 32개의 ROP. 클럭당 최대 32개 샘플 및 무색 모드(Z 전용)에서 최대 성능 - 클럭당 128개 샘플
  • HDMI 1.4a 및 DisplayPort 1.2를 포함한 6개의 모니터에 대한 통합 지원

Radeon HD 7970 그래픽 사양

  • 코어 클럭: 925MHz
  • 범용 프로세서 수: 2048
  • 텍스처 유닛 수: 128, 블렌딩 유닛: 32
  • 유효 메모리 주파수: 5500MHz(4×1375MHz)
  • 메모리 유형: GDDR5
  • 메모리 용량: 3GB
  • 메모리 대역폭: 초당 264GB
  • 이론적 인 최대 속도채우기: 초당 29.6기가픽셀
  • 이론적 텍스처 샘플링 속도: 초당 118.4기가텍셀
  • 2개의 CrossFire 커넥터
  • PCI 익스프레스 3.0 버스
  • 소비 전력: 3~250W
  • 8핀 1개 및 6핀 전원 커넥터 1개
  • 듀얼 슬롯 디자인
  • 미국 권장소비자가격: $549

Radeon HD 7950 그래픽 사양

  • 코어 주파수: 800MHz
  • 범용 프로세서 수: 1792
  • 텍스처 유닛 수: 112, 블렌딩 유닛: 32
  • 유효 메모리 주파수: 5000MHz(4×1250MHz)
  • 메모리 유형: GDDR5
  • 메모리 용량: 3GB
  • 메모리 대역폭: 초당 240GB
  • 이론상 최대 채우기 속도: 초당 25.6기가픽셀.
  • 이론적 텍스처 샘플링 속도: 초당 89.6기가텍셀
  • 2개의 CrossFire 커넥터
  • PCI 익스프레스 3.0 버스
  • 커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
  • 소비 전력: 3~200W
  • 듀얼 슬롯 디자인
  • 미국 MSRP: $449

새로운 칩의 높은 복잡성은 이전 최고급 그래픽 프로세서의 트랜지스터 수의 절반 이상인 43억 개의 트랜지스터로 주목을 받습니다. 이러한 복잡한 결정을 만드는 능력은 현대적인 28나노미터 공정 기술을 사용하여 가능했으며 새로운 칩은 케이맨 크기보다 약간 작은 면적으로 밝혀졌습니다. 그리고 성능에 영향을 미치는 실용적인 특성(ALU, TMU, 메모리 버스의 수)이 눈에 띄게 개선되었습니다. ROP의 수만 증가하지 않았으며 GDDR5 비디오 메모리의 주파수는 동일한 수준을 유지했습니다.

회사의 비디오 카드 이름 지정 원칙은 동일하게 유지되었습니다. Radeon HD 7970은 회사에서 가장 생산적인 단일 칩 솔루션입니다. 얼마 후 더 젊은 모델 HD 7950이 출시되어 조금 늦게 발표되었습니다. 처음에 HD 7970은 시장에 경쟁자가 없었고 AMD 라인의 특정 비디오 카드를 대체하지 않고 오히려 아래로 옮겼습니다. 경쟁사와 비교하면 NVIDIA는 훨씬 늦게 28nm 솔루션을 출시했습니다.

새로운 AMD 비디오 카드에는 동일한 GDDR5 메모리가 설치되어 있지만 이전 세대의 2GB가 아닌 3GB로 용량이 커졌습니다. 이것은 메모리 버스가 256비트에서 384비트로 확장되었기 때문에 발생했습니다. 이제 새 보드에 1.5GB 또는 3GB를 넣을 수 있습니다. 당연히 마케팅의 관점에서 볼 때 더 작은 볼륨을 설치하는 것은 명백한 단점이 될 것이므로 3GB를 넣는 것으로 결정했지만 오늘은 조금 과합니다. 초고해상도에서만 MSAA 16x 1.5-2GB로는 충분하지 않습니다. 그러나 AMD에는 Eyefinity도 있으며 3개 이상의 모니터에서 게임을 하는 경우 화면 버퍼가 매우 많은 양을 차지합니다.

따라서 Radeon HD 7970을 살펴보겠습니다. 상위 가격대의 새로운 비디오 카드에는 전체 길이를 따라 모든 최신 AMD 마더보드에 익숙한 플라스틱 케이스로 덮인 2슬롯 냉각 시스템이 있습니다. 카드의. 이 케이스의 디자인만 조금 바뀌었지만, 후방 끝여전히 인쇄회로기판을 넘어선다. 그러나 핀이 있는 바의 디자인이 변경되었습니다. 비디오 카드의 냉각을 개선하기 위해 두 개의 슬롯 중 하나(바의 절반)는 방열을 위한 환기 구멍으로만 채워졌습니다.

그러나 사용자는 보드에 바로 납땜되는 DVI 커넥터의 수가 줄어들어서는 안 됩니다. 편의를 위해 패키지에 특수 HDMI-DVI 어댑터가 포함되어 있어 DVI 커넥터가 있는 두 대의 모니터를 연결할 수 있습니다. 그건 그렇고 새 카드의 소비 전력은 Radeon HD 6970보다 낮지 않으므로 8핀 1개와 6핀 전원 커넥터 1개를 세트로 설치해야 했습니다.

그러나 새로운 Radeon HD 7970에서는 냉각 시스템이 개선되었습니다. 새로운 세대의 증발기 챔버와 더 큰 새로운 냉각기가 사용되어 블레이드 모양이 수정되고 성능이 향상되었습니다(더 큰 공기 흐름 제공). 그 결과 소음을 줄이면서 냉각기 효율이 증가합니다.

Radeon HD 6900 설명에서 설명한 Dual BIOS 펌웨어 스위치는 보드에서 사라지지 않았습니다. 사용자와 AMD 모두 이 편리한 솔루션을 매우 좋아했기 때문에 AMD는 이를 통해 계속해서 최고 수준의 솔루션을 완성하기로 결정했습니다.

우리는 인사만 할 수 있어요 이 결정, 플래싱 중 예기치 않은 문제(예: 프로세스의 전원 끄기)와 관련된 다양한 경우에 실제로 도움이 되며 BIOS 이미지로 두려움 없이 다양한 실험을 수행할 수 있습니다. 당연히 AMD는 새로운 그래픽 카드의 탁월한 오버클러킹 기능을 계속해서 암시합니다.

보시다시피 1GHz 이상의 주파수로 오버클러킹하는 것은 실제로 비디오 카드가 고장나더라도 보증이 적용되지 않는다는 작은 비문(스크린샷에는 포함되지 않음)을 고려하지 않으면 약속됩니다. 설정 비디오 드라이버에서 주파수를 높이는 실험의 결과입니다.

아키텍처 기능 Radeon HD 7970

남군도에서 아키텍처 수정의 관련성을 평가하려면 먼저 AMD 관점에서 지난 몇 년 동안의 GPU 개발을 고려하십시오. 2002년 이전에 그래픽 칩은 순수하게 그래픽 컴퓨팅이 가능한 특정 하드웨어였습니다. 그 당시 비디오 칩은 기능이 제한적이었고 텍스처를 적용 및 필터링하고 기하학을 처리하고 원시 래스터화에 참여할 수 있었기 때문에 범용 컴퓨팅 작업에는 전혀 적합하지 않았습니다.

다음 몇 년 동안 기본 프로그래밍 기능이 GPU에 추가되었지만 그래픽 작업에만 집중되었습니다. 부동 소수점 기능이 있는 제한된 기능의 셰이더 프로그램인 DirectX 8 및 9가 지원되는 시기였습니다. 당시 비디오 칩에는 정점 및 픽셀 처리를 위한 특수 ALU와 픽셀, 텍스처 및 기타 데이터용 전용 캐시가 있었습니다. 보편성은 아직 가깝지 않았습니다.

그리고 2007년에야 AMD는 CAL, Brook, ATI Stream과 같은 특수 도구를 사용하여 GPU를 프로그래밍하는 기능뿐만 아니라 통합 셰이더 아키텍처 DirectX 10을 얻었습니다. 당시 GPU에는 이미 고급 캐싱과 로컬 및 글로벌 공유 데이터 지원 기능이 있었습니다. 구조적으로 칩은 VLIW5 및 VLIW4 블록을 기반으로 했으며 일부 기본 그래픽 컴퓨팅그러나 여전히 그래픽 알고리즘에 중점을 둡니다.

이제 범용 컴퓨팅에 더욱 적합한 새로운 아키텍처가 필요합니다. 그래픽 코어 넥스트(GCN). AMD에게 이것은 새로운 아키텍처 시대이기 때문에 이름이 선택되었습니다. 새로운 GPU는 뛰어난 그래픽 처리 기능과 성능을 제공하지만 아키텍처 변경은 주로 비그래픽 컴퓨팅에서 위치를 개선하여 복잡한 범용 작업에서 성능과 효율성을 향상시키기 위한 것입니다. 새로운 디자인 GPU는 멀티태스킹 환경에서 그래픽 컴퓨팅과 범용 컴퓨팅이 혼합된 이른바 이기종 컴퓨팅을 위해 설계되었습니다. GCN 아키텍처는 더욱 유연해졌으며 다양한 작업의 에너지 효율적인 실행에 더욱 적합해야 합니다.

새 아키텍처의 기본 블록은 GCN 블록입니다. Southern Islands 시리즈의 모든 새로운 GPU가 기반으로 하는 것은 이 "벽돌"에 있습니다. AMD 그래픽 칩의 아키텍처는 처음으로 non-VLIW 디자인을 사용하고 벡터 및 스칼라 블록을 사용하며 가장 중요한 변경 사항 중 하나는 각 GCN 컴퓨팅 블록마다 고유한 스케줄러가 있고 다양한 프로그램의 명령을 실행할 수 있다는 것입니다. (핵심).

새로운 컴퓨팅 아키텍처는 멀티태스킹 환경에서 컴퓨팅 장치의 고효율 로딩을 위해 설계되었습니다. GCN 계산 단위는 4개의 하위 섹션으로 나뉘며 각 하위 섹션은 클록 주기마다 자체 명령 스트림에서 작동합니다. 스레드는 흐름 제어 또는 포인터 작업을 위해 GCN에 있는 스칼라 블록을 사용할 수도 있습니다. 벡터와 스칼라 블록의 조합은 매우 간단한 프로그래밍 모델을 제공합니다. 예를 들어, 함수 포인터와 스택 포인터는 프로그래밍하기 훨씬 쉽고 컴파일러의 작업은 이제 실행 단위가 스칼라이기 때문에 크게 단순화되었습니다.

각 GCN 블록에는 전용 로컬 스토리지데이터 교환을 위한 64KB 또는 레지스터를 위한 로컬 스택 확장용 데이터. 또한 블록에는 읽기 및 쓰기 기능이 있는 1단계 캐시 메모리와 본격적인 텍스처 파이프라인(샘플링 및 필터링 블록)이 모두 포함됩니다. 따라서 새로운 컴퓨팅 장치는 이전 아키텍처에서 블록 간에 작업을 분배하는 역할을 했던 중앙 스케줄러 없이 독립적으로 작동할 수 있습니다. 이제 각 GCN 블록은 자체적으로 명령을 스케줄링하고 배포할 수 있으며, 하나의 컴퓨팅 장치는 최대 32개의 서로 다른 명령 스트림을 실행할 수 있습니다.

AMD의 이전 GPU 아키텍처는 VLIW4 및 VLIW5 아키텍처 모델을 사용했지만 그래픽 작업, 그러나 그러한 조건에서 작업으로 모든 실행 단위를 로드하는 것은 매우 어렵기 때문에 범용 컴퓨팅에는 충분히 효율적이지 않습니다. 새로운 GCN 아키텍처는 유사하게 많은 수의 실행 단위를 제공하지만 레지스터와 명령어의 제한과 종속성을 제거하는 스칼라 실행을 제공합니다. VLIW 아키텍처에서 스칼라 실행으로의 전환은 코드 최적화 작업을 눈에 띄게 단순화합니다.

이전 VLIW4 아키텍처에서 명령을 실행할 때 컴파일러는 레지스터 충돌 해결, 코드 컴파일 단계에서 실행 단위로의 복잡한 명령 배포 등을 처리해야 합니다. 동시에 고성능을 달성하기 위해 사소한 최적화가 종종 대부분의 그래픽 작업에 적합하고 다른 계산에는 훨씬 덜 유연합니다. 새로운 아키텍처는 개발 및 지원의 상당한 단순화, 저수준 코드의 단순화된 생성, 분석 및 오류 포착, 안정적이고 예측 가능한 성능을 제공합니다.

메모리 캐싱 하위 시스템

대역폭, 메모리 및 캐시는 결코 충분하지 않으며 항상 이를 증가시킬 필요와 방법이 있습니다. AMD의 새로운 GPU는 완전한 2레벨 읽기/쓰기 캐시를 사용합니다. 각 컴퓨팅 장치에는 16킬로바이트의 첫 번째 레벨 캐시가 있고 두 번째 레벨 캐시의 총 볼륨은 768킬로바이트입니다(총 칩은 512KB L1 및 768KB L2를 얻음). 이는 이전 칩보다 50% 더 많습니다. , L2 캐시에 전혀 쓸 수 있는 기능이 없습니다.

성능 면에서 각 GCN 계산 장치는 명령 스트림 간에 데이터를 교환하는 역할을 하는 한 사이클에서 L1 캐시 또는 글로벌 메모리에서/로 64바이트의 데이터를 수신하거나 쓸 수 있습니다. 동일한 양의 데이터로 L2 캐시 메모리의 각 섹션을 송수신할 수 있습니다. 그 결과 회사의 최고급 GPU는 L1이 2테라바이트/초, L2가 700GB/초를 달성해 이전 최고 AMD 솔루션보다 50% 더 높은 수준이다.

타히티 GPU

새로운 Southern Islands 시리즈의 낮은 수준의 아키텍처 변경 사항을 살펴보았으므로 이제 두 가지 모델을 포함하는 라인의 가장 강력한 솔루션인 Radeon HD 7900의 세부 사항으로 넘어갈 차례입니다. 우선, Radeon HD 5870이 기반으로 하는 칩의 두 배인 43억 개 이상의 트랜지스터가 포함되어 있기 때문에 새 GPU의 엄청난 복잡성에 주목합시다! 당연히 이러한 강력한 칩은 새로운 28nm 공정 기술 덕분에 가능해졌습니다. 그래서 그는 안에 무엇을 가지고 있습니까?

기하학적 블록의 수는 Cayman과 비교하여 변경되지 않았지만 여전히 2개가 있지만 작업 효율성이 크게 향상되었습니다. 잠시 후에 더 자세히 설명하겠습니다. 그래픽 프로세서 다이어그램에서 Radeon HD 7970에서 사용 가능한 32개의 GCN 아키텍처 컴퓨팅 장치를 볼 수 있으며 주니어 솔루션의 경우 일부는 비활성화됩니다. 솔루션의 최대 컴퓨팅 성능을 고려하면 오늘날 GPU의 절대 기록인 거의 3.8테라플롭(초당 부동 소수점 연산 수)입니다.

각 GCN 블록에는 16개의 텍스처 유닛이 있어 칩당 총 128 TMU 또는 118 기가텍셀/초 이상을 제공합니다. 이는 출시 당시의 또 다른 기록이며 마지막이 아닙니다. 그러나 ROP 블록의 수는 변경되지 않았으며 8개의 확대된 RBE 블록에 여전히 32개가 있습니다. 또 다른 흥미로운 아키텍처 변경 사항은 이제 ROP 블록이 이전과 같이 메모리 채널이 아니라 GCN 블록에 "연결"된다는 것입니다.

이론적인 프레임버퍼 쓰기 속도는 크게 변하지 않고 클럭당 최대 32개의 색상 값과 128개의 깊이 값이 동일하지만, 증가로 인해 실제 애플리케이션에서 실제적인 필레이트(채움율)가 크게 증가했습니다. 메모리 대역폭. AMD는 Cayman을 클럭당 23픽셀로 측정한 반면, 새로운 Tahiti는 이론상 클록당 32픽셀에 접근했습니다.

이는 새로운 AMD 비디오 칩이 현재 최고급 경쟁업체의 솔루션과 마찬가지로 64비트 채널인 384비트 메모리 버스를 가지고 있기 때문에 이해할 수 있습니다. 실제 텍스처 가져오기 및 프레임 버퍼 쓰기 속도를 높일 수 있는 것은 메모리 대역폭이 1.5배 증가했기 때문입니다. 264GB/s의 대역폭은 118gigaxels/sec 및 30gigapixels/sec의 이론적 수치에 가깝게 짜내는 데 도움이 되며 실제 부분에서는 이를 확인할 것입니다.

"제거된" Radeon HD 7950 그래픽 프로세서의 경우, Tahiti는 칩에서 물리적으로 사용 가능한 32개 중 28개의 GCN 아키텍처 활성 컴퓨팅 장치를 포함합니다. Radeon HD 7970 시리즈의 주니어 솔루션의 경우 그 중 4개를 비활성화하기로 결정했습니다. 각 GCN에는 16개의 텍스처 단위가 있으므로 새 모델의 총 TMU 수치는 112 TMU이며 거의 90기가텍셀/초의 처리량을 제공합니다.

그러나 HD 7950의 ROP와 메모리 컨트롤러의 수는 변경되지 않았으며, 이를 줄이지 않고 각각 동일한 32개와 6개를 유지하기로 결정했습니다. 따라서 Tahiti Pro 비디오 칩에는 최고의 AMD 솔루션과 동일한 384비트 메모리 버스가 있으며 64비트 채널 6개로 조립됩니다. 아무래도 제작 과정에서 결혼 생활에서 가장 큰 피해를 입는 것은 컴퓨팅 기능 기기들인 것 같고, 나머지는 다 자르지 않기로 했다.

테셀레이션 및 기하학 처리

건축학적 관점에서, 케이맨 이후로 타히티의 기하학적 블록에서 특별한 것은 아무것도 변경되지 않았습니다. 기하학적 데이터 및 래스터화의 처리(정점 및 테셀레이션 설정)에 여전히 두 개의 블록을 사용하며, 테셀레이터가 이미 9세대라고 불리는 것을 제외하고는 이전에 본 것과 매우 유사합니다.

도식적 유사성에도 불구하고 이러한 블록의 최신 세대는 블록이 크게 수정되었기 때문에 테셀레이션 및 지오메트리 처리 성능이 크게 향상될 수 있습니다. 최고 성능은 초당 거의 20억 개의 정점 및 기본 요소(925MHz 및 클록당 2개의 정점)로 증가했지만, 실제 성능더 성장했습니다. 이것은 캐시 크기를 늘리고 기하 데이터의 버퍼링을 개선하며 정점 데이터를 재사용함으로써 달성되었습니다.

그 결과 모든 삼각형 분할 비율에서 테셀레이션 성능이 이전 세대 Radeon HD 6970보다 최대 4배 향상되었습니다. 그러나 AMD 자체의 다이어그램에서도 모든 경우에 4배는 달성되지 않습니다.

이 차트는 분할 비율 1~32에서 Radeon HD 7970과 HD 6970의 테셀레이션 성능을 비교한 것입니다. 그리고 보시다시피 성능 차이는 1.7~4배입니다. 그러나 이것은 알몸 합성입니다. 그리고 현실에 더 가까워지기 위해 게임 애플리케이션에서 이미 테셀레이션 속도에 대한 더 많은 데이터를 제공할 것입니다.

보시다시피 AMD의 합성 숫자는 게임 숫자에서 잘 지원됩니다. "무거운" 테셀레이션이 있는 실제 응용 프로그램의 성능이 크게 향상되었습니다. 이것은 합성 및 게임 응용 프로그램의 예를 사용하여 실제 부분에서 확실히 확인할 매우 좋은 결과입니다.

비그래픽 계산

이기종 및 비그래픽 컴퓨팅 작업의 관점에서 두 가지 비동기 컴퓨팅 엔진(Asynchronous Compute Engines - ACE)이 등장했습니다. 효율적인 멀티태스킹 및 그래픽 명령 프로세서(Command Processor)와 함께 작업을 수행하기 위해 실행 단위 간에 작업을 예약하고 분산하도록 설계되었습니다.

Radeon HD 7900에는 2개의 독립적인 컴퓨팅 엔진과 1개의 그래픽 엔진이 있습니다. 전체적으로 이것은 서로 완전히 분리된 세 개의 프로그래밍 가능한 블록과 세 개의 명령 스트림을 제공합니다. 또한 빠른 컨텍스트 전환을 위한 비동기식 명령 실행 외에도 새로운 GPU에는 Cayman에 도입된 2개의 양방향 DMA(직접 메모리 액세스) 컨트롤러가 있습니다. 이 두 컨트롤러는 새로운 PCI Express 3.0 버스를 최대한 활용하는 데 필요합니다.

아시다시피 진지한 계산의 관점에서 보면 단정밀도로 부동 소수점 연산을 수행하는 속도뿐만 아니라 배정밀도(배정밀도 부동 소수점)도 중요합니다. 그리고 AMD의 새로운 아키텍처는 그 일을 꽤 잘합니다. 에 이 순간 FP64 명령어에 대해 실행 속도가 다른 두 가지 버전의 GCN 컴퓨팅 장치가 있다고 가정합니다. 구형 GPU의 경우 실행 속도가 FP32 속도의 1/4이고, 젊은 칩의 경우 실행 속도가 1/16으로 호환성을 유지하기에 충분하지만 저렴한 솔루션을 너무 복잡하게 만들지는 않습니다. 결과적으로 Radeon HD 7970은 초당 9,470억 개의 배정밀도 연산을 수행할 수 있습니다(오, 겨우 테라플롭에 도달했습니다!) - 새로운 AMD 칩의 또 다른 최고 성과가 있습니다.

게다가 이들은 이전 아키텍처의 경우와 같은 기가플롭이 아니라 더 "뚱뚱한" 아키텍처입니다. 결국 복잡한 컴퓨팅 작업에서 새 GPU의 효율성은 심각하게 증가해야 합니다. 첫째, 메모리 및 캐싱 하위 시스템이 개선되었습니다. 둘째, 각 GCN 계산 단위에는 자체 스케줄러가 있어 분기 코드 실행과 전반적인 효율성을 향상시켜야 합니다. 셋째, 컴파일러의 복잡한 최적화가 필요하지 않은 스칼라 실행에 주목합니다. 그 결과 컴퓨팅 장치가 유휴 상태가 되는 빈도가 훨씬 줄어듭니다. 그리고 결과적으로 어떤 작업에서도 새로운 칩이 고성능과 ALU 로딩을 보여주기가 더 쉬울 것입니다.

컴퓨팅 기능과 관련된 다른 혁신 중에서 DRAM 및 SRAM용 ECC를 완벽하게 지원합니다. 소프트웨어 측면에서 Tahiti는 OpenCL 1.2, DirectCompute 11.1, C++ AMP 및 해당 기능과 같은 새로운 API 버전을 완벽하게 지원하는 최초의 GPU라는 것이 중요합니다. 예를 들어 OpenCL 1.2를 사용하면 여러 컴퓨팅 장치의 기능을 하나로 결합할 수 있습니다. AMD은 이미 AMD APP SDK 2.6 및 Catalyst 11.12 드라이버의 형태로 지원을 릴리스했습니다.

아키텍처 성능 및 효율성

Southern Island 시리즈의 최상위 칩 예제에 대한 모든 아키텍처 혁신을 검토한 후 이러한 모든 변경의 효과에 대해 이야기할 시간입니다. 새로운 칩의 성능이 이전 칩의 성능보다 훨씬 높은 것은 분명하지만 그 반대는 매우 놀랍습니다. 문제는 얼마나 더 빠를 것인가이다. 다양한 작업에서 수치는 40-50%(최소!)에서 5배 차이까지 얻습니다. 아키텍처의 개선으로 덤 기가플롭의 이론적인 1.4배 차이를 초과할 수 있습니다. 예를 들어 살펴보겠습니다.

다이어그램은 새로운 최고 솔루션과 이전 단일 칩 솔루션인 Radeon HD 7970 및 HD 6970을 비교하며 이는 상당히 공정합니다. 다양한 성능 테스트가 선택됩니다. SmallptGPU 및 LuxMark는 OpenCL의 레이 트레이싱, SHA256은 보안 해싱 알고리즘, AES256은 대칭 암호화 알고리즘입니다. 만델브로트는 배정밀도 계산으로 계산된 잘 알려진 문제입니다.

그래프의 수직 파선은 이론적인 성능 차이를 나타내지만 속도 데이터에 따르면 5개 작업 중 3개 작업에서 새 GPU의 속도가 훨씬 더 빨랐습니다. 이는 효율성 향상을 목표로 한 모든 변경 사항(VLIW에서 벗어나기, 각 컴퓨팅 장치에 스케줄러 존재, 캐싱 개선 등) 때문입니다.

렌더링 품질의 변화

사실, 이 부분은 최근에 이미지 품질에 대한 특별한 주장이 없고 여러 가지 이유로 그럴 수 없기 때문에 건너뛸 수 있었습니다. 예를 들어, 다른 제조업체의 비디오 카드에 대한 전체 화면 앤티 앨리어싱의 품질은 특히 모든 GPU에서 정확히 동일한 방식으로 수행되는 사후 처리 필터를 사용하는 소프트웨어 앤티 앨리어싱 방법의 광범위한 사용을 고려할 때 매우 가깝습니다. .

텍스처 필터링에도 동일하게 적용됩니다. 이제 품질이 픽셀 단위로 비교하더라도 AMD와 NVIDIA 솔루션을 구별하기가 매우 어렵습니다. 회사의 이전 세대인 Radeon HD 6900은 이방성 필터링을 조금 더 개선했으며 이제는 "현미경"도 심각한 결함을 찾는 데 도움이 되지 않습니다. 유일한 참고 사항은 작동 중인 Radeon 비디오 카드가 "노이즈" 또는 "모래"와 같은 더 눈에 띄는 특정 아티팩트로 인해 GeForce보다 약간 열등하다는 것입니다.

차세대 비디오 칩이 출시되면서 텍스처 필터의 텍셀 가중치가 다시 한 번 수정되었으며 이러한 아티팩트를 줄이는 방식으로 수정되었으며 특정 유형의 텍스처가 있는 경우 Radeon HD 6900에서 가끔 볼 수 있습니다. (예를 들어 어두운 곳에서 밝은 곳으로의 급격한 전환이 있는 "고주파"). AMD는 HD 7900 대 HD 6900 비교 사진을 제공하지 않고 단순히 GPU 스트림 프로세서에서 실행되는 순수 소프트웨어 알고리즘과 "하드웨어" 알고리즘의 품질을 비교하므로 품질의 변화를 예를 들어 보여주기가 매우 어렵습니다. :

이러한 작은 스크린샷에서는 품질의 차이가 보이지 않지만 AMD는 모든 변경으로 인해 성능 저하가 발생하지 않았으며 어떤 측면에서도 이미지 품질이 악화되지 않았다고 확신합니다. 여전히 각도 및 필터링 품질이 이상적입니다. 미래의 실용적인 재료 중 하나에서 우리는 이것을 확실히 확인할 것입니다.

부분적으로 상주하는 텍스처

부분 상주 텍스처(PRT)의 아이디어는 제시된 GPU의 하드웨어 기능을 사용하는 것입니다. 가상 메모리. 확실히 많은 사용자가 가상 ​​텍스처링 기술을 사용하는 id Software의 RAGE 게임을 이미 보았을 것입니다. 이 게임은 엄청난 양의 텍스처 데이터를 사용하고 비디오 메모리로 스왑(스트리밍)할 수 있는 기능을 제공하는 소위 메가 텍스처링("MegaTexture")입니다.

가상 비디오 메모리를 사용하면 응용 프로그램에서 최대 32테라바이트의 텍스처를 사용할 수 있는 이러한 알고리즘에 대한 효과적인 하드웨어 지원을 얻는 것이 매우 쉽습니다. 총 결석텍스처 데이터를 로드하는 데 문제가 있습니다. 사실, AMD의 예시는 너무 이상해서 특별히 명확한 것은 없습니다.

PRT를 사용하면 고화질을 얻을 수 있고 비디오 메모리 사용의 효율성을 높일 수 있습니다. 유사한 알고리즘이 이미 id Software 엔진에서 사용되고 있으며 많은 차세대 엔진에 나타날 것으로 예상됩니다. 미래의 게임은 엄청난 양의 데이터를 처리해야 하며, 새로운 GPU의 장점은 PRT 알고리즘의 로컬 그래픽 메모리가 하드웨어 캐시 메모리처럼 작동하고 필요할 때 텍스처가 메모리에 로드된다는 점입니다. Southern Islands 제품군의 GPU는 최대 32테라바이트(최대 해상도 16384×16384)의 "메가 텍스처"를 지원하며, 가장 중요한 것은 이전 비디오 칩에서는 사용할 수 없는 하드웨어 텍스처 필터링을 지원한다는 것입니다.

가상 텍스처는 64킬로바이트(텍셀이 아닌 킬로바이트)의 조각으로 나뉘며 이 조각 크기는 고정되어 있습니다. 그리고 현재 프레임을 렌더링할 때 필요한 것만 비디오 카드의 로컬 메모리에 로드합니다. 이 기술은 텍스처 형식에 관계없이 작동하며 텍셀의 조각 크기만 다릅니다. 예를 들어 색상당 32비트의 일반 비압축 텍스처의 경우 청크 크기는 128x128 텍셀이고 DXT3 압축 텍스처의 경우 256x256 텍셀입니다.

이 기술은 또한 밉 수준의 텍스처(텍스처 필터링에 사용되는 더 작은 복사본)를 사용합니다. 렌더링 및 필터링 시 여러 번 액세스해야 합니다. 예제에서 알고리즘의 작동을 고려하십시오.

이 그림은 렌더링에 필요한 서로 다른 밉 레벨의 4가지 다른 부분을 강조 표시합니다. 셰이더 프로그램이 데이터를 요청할 때 일부 조각은 이미 로컬 메모리에 있으며 이 데이터는 추가 계산을 위해 즉시 셰이더로 전송됩니다. 그러나 일부 항목이 테이블에서 누락되었으며 애플리케이션은 이러한 누락에 대해 다음에 수행할 작업을 결정해야 합니다. 예를 들어 더 낮은 해상도의 밉 레벨에서 데이터를 요청할 수 있습니다. 그러면 이미지가 흐릿하지만 최소한 진실처럼 보이고 지체 없이 그려질 것입니다. 그리고 다음 프레임이 렌더링될 때 이미 캐시(로컬 비디오 메모리)에 로드될 수 있습니다. RAGE를 해본 사람들은 우리를 이해할 것입니다.

이것은 각 개체에 고유한 거대한 텍스처를 사용할 수 있게 해주는 강력한 알고리즘입니다. 실시간 계산의 필요성을 제외하고 유사한 알고리즘이 오프라인 렌더링에 오랫동안 사용되었습니다. AMD는 애니메이션 영화를 위해 Walt Disney Animation Studios에서 개발한 Per-Face Texture Mapping 기술을 사용하여 데모도 만들었습니다. 불행히도 데모는 아직 준비되지 않았으며 저해상도 스크린샷만 보았습니다.

이 텍스처 매핑 기술의 핵심은 UV 변환을 사용할 필요 없이 각 다각형에 특정 텍스처 조각을 할당하는 것입니다. 차원 질감). 이 접근 방식은 변위 매핑 알고리즘을 매우 간단하게 만들어 테셀레이션된 콘텐츠 생성과 관련된 몇 가지 문제를 해결합니다. 그리고 이 방법의 PRT는 텍스처 데이터에 대한 효율적인 저장 및 액세스를 위해 사용됩니다.

미디어 취급 지침

Southern Islands의 흥미로운 혁신은 정적 및 동적 이미지 처리에 사용되는 특수 명령을 지원하는 것 같습니다. 예를 들어 SAD(Sum of Absolute Differences)로 더 잘 알려진 "절대 차이 합계"라는 널리 사용되는 명령어가 개선되었습니다. 실행 속도는 동작 감지, 제스처 인식, 이미지 검색, 컴퓨터 비전 등과 같은 많은 이미지 및 비디오 데이터 처리 알고리즘에서 성능에 매우 중요한 병목 현상입니다.

그러나 고대 비디오 카드 Radeon HD 5870에 대한 리뷰에서 우리는 이미 SAD 지원에 대해 썼습니다. 이제 일반적인 SAD(4 × 1)에 추가하여 남섬은 새로운 지시- 성능과 전력 효율성을 높이기 위해 SAD와 시프트 연산자를 결합하는 QSAD(4중 SAD)와 배경 픽셀을 무시하고 배경에서 프레임에서 움직이는 개체를 분리하는 데 사용되는 "마스크" 명령 MQSAD.

새로운 GPU는 클록당 GCN 계산 단위당 최대 256픽셀을 처리할 수 있습니다. AMD 라데온 HD 7970은 8비트 정수 색상 값의 경우 초당 최대 7조 6천억 픽셀을 처리할 수 있는 능력을 의미합니다. 이것은 이론적인 수치이지만 새로운 GPU의 시각적 처리 능력은 상당히 인상적입니다. 많은 비디오 처리 작업을 실시간으로 수행할 수 있습니다.

PCI 익스프레스 3.0

우리는 Southern Islands의 새로운 그래픽 솔루션의 전체 라인에 의해 PCI Express의 세 번째 버전의 지원을 지나칠 수 없었습니다. PCI Express의 세 번째 버전 사양이 2010년 가을에 마침내 승인되었기 때문에 이러한 지원은 충분히 예상되었지만 지원하는 하드웨어 솔루션은 아직 없었습니다. 마더보드 2011년 말에 비디오 카드가 출시되었으며 해당 중앙 프로세서가 있습니다.

업데이트된 인터페이스는 버전 2.0의 경우 5GT/s가 아닌 초당 8기가트랜잭션의 전송 속도를 가지며, 처리량 PCI Express 2.0 표준과 비교하여 다시 한 번 두 배(최대 32Gb/s). 새 버스는 버스를 통해 전송되는 데이터에 대해 다른 코딩 체계를 사용하지만 PCI Express의 이전 버전과의 호환성은 유지되었습니다.

최초의 마더보드 PCI 지원 Express 3.0은 2011년 여름에 메인 베이스에 도입되었습니다. 인텔 칩셋 Z68, 그리고 그들은 같은 해 가을에만 광범위하게 판매되었습니다. 따라서 비디오 카드가 제 시간에 도착했고 AMD는 가장 앞선 기술을 지원하는 새로운 그래픽 프로세서 출시 속도 면에서 다시 한 번 앞서게 되었습니다. 그러나 PCI-E 3.0이 실용화될 것인지 판단하기에는 아직 이르다.

AMD 파워튠 기술

Cayman에서 가장 흥미로운 혁신 중 하나는 PowerTune 고급 전원 관리 기술이었습니다. 유연한 GPU 전원 관리는 오래전부터 사용되어 왔지만, Radeon HD 6900 이전에는 이러한 모든 기술이 다소 원시적이고 대부분 소프트웨어적인 방식이었고 주파수와 전압을 단계적으로 변경하여 비디오 칩의 많은 부분을 끌 수 없었습니다. .

Radeon HD 5000 제품군에서도 특정 소비량 수준을 초과하면 성능 제한이 나타났고, Radeon HD 6900에서는 시스템이 질적으로 다른 수준으로 이동했습니다. 이를 위해 부팅 매개 변수를 모니터링하는 모든 블록의 칩에 특수 센서가 포함되었습니다. GPU는 지속적으로 부하 및 전력 소비를 측정하고 후자가 특정 임계값을 초과하지 않도록 하여 매개변수가 지정된 열 패키지 내에 유지되도록 주파수와 전압을 자동으로 조정합니다.

초기 전원 관리 기술과 달리 PowerTune은 주파수와 전압을 변경하여 간접적으로 제어하는 ​​것과 달리 GPU 전력 소비를 직접 제어합니다. 이 기술은 높은 GPU 주파수를 설정하고 게임에서 고성능을 얻으며 소비가 안전한 한계를 넘을 수 있음을 두려워하지 않도록 도와줍니다. 결국 GPU 컴퓨팅을 사용하는 대부분의 게임 및 일반 응용 프로그램은 Furmark 및 OCCT와 같은 안정성 테스트와 달리 전력 요구 사항이 현저히 낮고 위험한 전력 소비 제한에 접근하지 않습니다.

가장 무거운 게임도 최대 전력 소모를 요구하지 않으며, 주파수별로 소모량을 제한하고 극한의 테스트로 비디오 카드를 테스트하면 3D 게임의 경우 사용하지 않는 성능과 전력 기회가 상당히 많을 것입니다. 비디오 카드가 안전 소비 수준의 한계에 도달하지 않은 경우 GPU는 공장에서 설정된 주파수로 작동하며 FurMark 및 OCCT 테스트에서는 GPU 주파수가 감소하여 소비 한계 내에서 유지됩니다.

따라서 PowerTune은 설정된 최대 전력 수준에서 GPU 리소스를 가장 효율적으로 사용하도록 더 높은 공장 주파수를 설정하고 시스템을 조정하는 데 도움이 됩니다. 위의 예에서 HD 5870은 PowerTune을 사용하지 않으며 내구성 테스트에서 높은 소비의 GPU 주파수 제한으로 인해 최대 잠재력을 사용하지 않습니다. Radeon HD 7970에 대해 최대 TDP가 설정되어 있고 비디오 칩은 주파수를 초과할 때만 주파수를 재설정하여 모든 애플리케이션에서 가능한 최고의 성능을 얻습니다.

이것은 다음 다이어그램에 명확하게 나와 있습니다. 게임 애플리케이션의 경우 GPU의 주파수를 높여 TDP를 달성할 수 있으며 최대 부하의 경우 내구성 테스트를 통해 주파수를 안전한 수준의 전력 소비로 줄입니다. PowerTune이 없으면 FurMark와 OCCT가 오랫동안 실행될 때 비디오 카드 오류의 가능성을 얻거나 게임의 잠재적인 성능을 줄이려면 선택해야 합니다. 신기술은 이러한 문제를 가능한 한 효율적으로 해결합니다.

AMD PowerTune은 하드웨어 기술인 만큼 변화하는 조건(마이크로초)에 빠르게 응답하는 것이 특징입니다. 또한 유연한 주파수 튜닝으로 구별되며 이전 칩에서와 같이 계단이 없습니다. 모든 측정은 드라이버와 독립적이지만 비디오 카드 설정을 사용하여 사용자가 조정할 수 있습니다.

PowerTune과 이전에 일반적으로 받아 들여진 접근 방식의 차이점은 다른 경우에는 GPU를 상당히 감소된 소비 모드로 전환하는 열 조절이 사용되고 PowerTune은 단순히 주파수를 부드럽게 줄여 GPU 소비를 설정된 제한기로 가져오는 것입니다. 그 결과 클럭 속도와 성능이 향상됩니다.

AMD 제로코어 기술

AMD는 이전 솔루션에서 이미 알려진 전원 관리 기술을 사용하는 데 그치지 않았습니다. Southern Islands 제품군의 첫 번째 칩에는 AMD ZeroCore 기술이 도입되어 모든 운영 체제에서 지원되는 비활성화된 디스플레이 장치로 "깊은 유휴"(또는 "절전") 모드에서 훨씬 더 큰 에너지 효율성을 달성하는 데 도움이 됩니다. .

결국 거의 모든 시스템, 심지어 게임 시스템도 그래픽 프로세서의 저부하 모드에서 대부분의 시간을 보냅니다. 그리고 이 모드에서 비디오 카드는 많은 전력을 소모하지 않아야 합니다. 더욱이 모니터가 꺼져 있는 모드는 말할 것도 없고, 이 경우 GPU를 완전히 끄는 것이 좋습니다. 그것이 AMD가 한 일입니다. ZeroCore 덕분에 새 GPU는 최대 유휴 상태일 때 전체 모드에서 전력의 5% 미만을 소비하여 이 모드에서 대부분의 기능 블록을 비활성화합니다.

AMD는 이 기술을 지원하지 않는 자체 Radeon HD 5870과의 개략적인 비교를 제공합니다. ZeroCore는 노트북용으로 설계된 모바일 GPU의 데스크탑 솔루션에 대한 남섬 독점 혁신입니다. 그건 그렇고,이 기술의 장점은 소비 감소와 관련이 있습니다. 또한 장시간 유휴 모드에서 디스플레이가 꺼지면 비디오 카드도 비디오 카드 쿨러의 팬을 완전히 끕니다!

이것이 바로 많은 사용자들이 오랫동안 기다려온 것입니다. 가장 흥미로운 점은 우리 데이터에 따르면 PowerTune 및 ZeroCore와 같은 솔루션에 대한 실험실 테스트가 몇 세대 전에 비디오 카드에 수행되었다는 것입니다. 시장을 떠난 지 오래 된 AMD 시리즈의 비디오 카드 엔지니어링 샘플 중 일부는 정확히 이와 같이 작동하여 유휴 시간에 쿨러를 완전히 끕니다.

그러나 AMD의 새로운 ZeroCore 지원 그래픽 카드로 소음 감소 및 전력 소비의 이점을 얻는 것은 단일 GPU 사용자만이 아닙니다. 2개, 3개, 심지어 4개의 GPU를 기반으로 하는 CrossFire 시스템의 행복한 소유자도 유사한 개선 사항을 기다리고 있습니다. 결국 운영 체제의 2 차원 인터페이스를 렌더링하는 모드에서 기본 카드를 제외한 모든 비디오 카드가 전혀 작동하지 않아야한다는 것이 논리적입니까? 그러나 그것이 그들이 지금 일하는 방식입니다!

2D 모드에서 ZeroCore를 지원하는 비디오 카드의 CrossFire 시스템의 경우, 모든 보조 비디오 카드는 최소의 전력 소비와 비활성화된 쿨러로 깊은 절전 모드에 들어갑니다. 이 모드는 여러 개의 단일 칩 비디오 카드와 2칩 솔루션 모두에서 작동합니다. 또한 기본 CrossFire 그래픽 카드는 Windows에 구성된 긴 유휴 시간의 경우에도 이 모드로 들어갑니다. 시각적으로 작업의 차이는 다음과 같습니다.

그건 그렇고, 기술은 보이는 것처럼 간단하지 않습니다. AMD 엔지니어는 유휴 모드에서 운영 체제의 작동과 관련된 많은 문제를 해결해야 했습니다. 예를 들어, 그들은 모니터가 꺼져 있어도 Windows가 화면의 정보를 업데이트하려고 시도한다는 것을 발견했습니다. 물론 GPU를 전혀 비활성화할 수는 없습니다. 따라서 회사 프로그래머는 절전 모드에서 모니터가 꺼져 있을 때 모든 화면 그리기 명령을 무시하고 해결 방법을 취해야 했습니다.

AMD 아이피니티 2.0 기술

당연히 새 아키텍처에는 여러 모니터에 이미지를 표시하기 위한 입증된 기술인 AMD Eyefinity(현재 버전 2.0)를 개선할 수 있는 위치가 있었습니다. 새로운 기능, 더 높은 해상도, 더 많은 디스플레이 지원 및 향상된 유연성을 제공합니다.

이 기술은 매우 흥미롭지만 극소수의 사용자가 방에 공간을 확보하고 가족 앞에서 두 대 이상의 모니터를 설치하기 위해 용기를 냅니다. 하지만 아예 없는 것보다 항상 사용할 수 있는 기회가 있는 것이 좋습니다. 또한 대각 모니터의 가격은 거의 떨어지지 않지만 중급 솔루션은 지속적으로 저렴해지고 있습니다.

사실, 이제는 30인치 모니터 1대보다 대각선이 24인치인 모니터 3대를 사는 것이 더 유리합니다. AMD는 30인치 2560x1600 모니터의 가격이 1,000달러가 넘는 반면 24인치 FullHD 모니터 3대는 그 절반 가격으로 구입할 수 있는 예를 보여줍니다.

그러나 방에서 돈과 공간을 사용하는 방법은 각 사용자의 개인적인 문제입니다. 중요한 것은 그러한 기회가 있다는 것입니다. 또한 Eyefinity 2.0은 이제 HD3D 스테레오 모드에서 이미지 출력을 지원합니다. 이는 이 매개변수에서 경쟁 제품보다 열등했던 이전 솔루션에는 없었습니다. AMD Eyefinity와 HD3D 기술을 결합한 Radeon HD 7970은 스테레오 모드에서 3개의 모니터를 지원하는 최초의 단일 칩 솔루션입니다.

고해상도 스테레오 렌더링에는 매우 빠른 데이터 전송 인터페이스가 필요합니다. 그리고 이전과 HDMI 버전출력에서 가능성은 눈당 24Hz로 제한되어 Blu-ray 3D로 영화를 감상하기에 충분하지만 게이머에게는 분명히 너무 적습니다.

이러한 작업을 위해 좌안과 우안용 프레임을 하나로 합치는 프레임 패킹 형식을 사용하기 시작했으며, AMD Radeon HD 7970은 스테레오 출력용 HDMI 1.4a 프레임 패킹 형식을 지원합니다. 이것은 프레임 패킹이 있는 3GHz HDMI를 지원하는 최초의 비디오 카드로, 각 눈에는 60Hz(총 120Hz)의 FullHD 영상이 있습니다.

또 다른 흥미로운 참신함은 Eyefinity와 함께 작동하는 DDMA(Discrete Digital Multi-Point Audio) 다중 채널 오디오 출력 기술인 것 같습니다. 이전의 모든 GPU는 HDMI 및 DisplayPort를 통해 하나의 오디오 스트림만 출력할 수 있습니다. 즉, 다른 방에 있는 3개의 모니터가 HDMI를 통해 PC에 연결되어도 사운드 채널하나만 전송됩니다. 그러나 AMD Radeon HD 7900은 한 번에 여러 독립 오디오 채널의 동시 출력을 지원하므로 일부 다중 모니터 구성에서 유용할 수 있습니다.

동일한 기능은 별도의 화면에 여러 대담자가 출력되는 화상 회의 응용 프로그램뿐만 아니라 게임 오디오가 있는 3개의 모니터에서 재생하고 독립 오디오 스트림으로 별도의 화면에서 뉴스를 보는 것과 같은 멀티태스킹 응용 프로그램에 매우 유용합니다. 이전에는 이 모든 것을 위해 여러 개의 개별 오디오 시스템을 사용해야 했지만 이제는 모든 것이 가능한 한 편리하게 작동합니다.

Eyefinity의 소프트웨어 지원도 잊혀지지 않으며 거의 ​​매달 기술이 업데이트됩니다. 새로운 기회가 나타납니다. 따라서 10월에 최대 16384 × 16384의 해상도와 수평 및 수직 5 × 1, 3 × 2 모드의 6개 모니터를 기반으로 하는 새로운 다중 모니터 구성에 대한 지원이 나타났습니다.

12월 AMD Catalyst 비디오 드라이버 업데이트는 Eyefinity와 HD3D가 함께 작동하도록 하며, 2월에는 사용자 지정 해상도 지원, 작업 표시줄 배치 조정 및 사전 설정 관리 개선 사항이 발표됩니다.

6개의 모니터에 대한 출력은 2개의 DisplayPort 1.2 포트와 2개의 MST 허브(이전에 썼음)를 사용하여 달성할 수 있지만 3개 또는 4개의 모니터에는 하나의 포트와 해당 허브만 필요합니다. 이 허브는 유연한 디스플레이 구성을 제공하고 DisplayPort 1.2 커넥터당 최대 4개의 FullHD 장치를 지원하며 2012년 여름까지 제공될 예정입니다.

허가를 말하는 것입니다. 고해상도 또는 초고해상도 - 초고해상도. 더 큰 측면에서 4000픽셀의 해상도를 가진 현재 장치는 한 번에 여러 케이블(DP 1.1 2개 또는 DVI 4개)을 사용하여 연결해야 합니다. 이 차세대 해상도의 모니터는 단 하나의 케이블(DP 1.2 HBR2 또는 HDMI 1.4a 3GHz)을 사용하여 연결됩니다. 그리고 새로운 그래픽 카드 AMD는 이미 그러한 모니터에 대한 준비가 되어 있으며 다시 세계 최초가 되었습니다.

비디오 인코딩 및 디코딩

AMD Radeon HD 7970에는 이전 세대의 회사 비디오 칩에 등장한 비디오 데이터 디코딩을 위한 동일한 UVD 블록이 포함되어 있는 것이 당연합니다. MVC 멀티 스트림 코덱, MPEG-2/MPEG-4(DivX), VC-1 및 H.264 디코딩을 지원하고 지원되는 모든 형식의 FullHD 스트림 2개를 디코딩하는 등 수정이 필요하지 않습니다.

AMD 솔루션 제공 최대 품질비디오 스트림 디코딩, 수십 가지 특수 품질 개선 알고리즘을 사용하고 HQV와 같은 품질 테스트에서 최대 결과를 제공합니다. 지원되는 기능 중에는 색상 및 톤 조정, 노이즈 감소, 선명하게 하기, 고품질 스케일링, 동적 대비, 고급 디인터레이싱 및 역 텔레시네가 있습니다. 다음은 즉석 대비 향상의 예입니다.

그러나 디코딩과 함께 모든 비디오 칩은 오랫동안 순서가 있었습니다. 모든 새로운 GPU는 비디오 데이터를 볼 때 적절한 품질과 성능을 제공합니다. 그러나 GPU의 비디오 인코딩은 아직 초기 단계이며 사용자의 주요 불만은 결과 압축 이미지의 품질이 낮다는 것입니다.

아마도 새로운 Radeon HD 7000 시리즈는 시리즈의 모든 그래픽 프로세서에 VCE(비디오 코덱 엔진) 비디오 인코딩 장치가 있기 때문에 이를 도울 수 있습니다. Radeon HD 7970은 하드웨어 가속 인코딩 및 특수 블록(이전에는 스트림 프로세서가 인코딩에 참여)을 사용하여 비디오 압축을 지원하는 최초의 비디오 카드였습니다.

실시간보다 훨씬 빠른 60fps 인코딩에서 1080p를 지원하므로 품질과 성능이 이전보다 확실히 향상되어야 합니다. 테스트 없이 품질에 대해 뭐라 말하기는 어렵지만 비디오 데이터 및 게임에 대해 다양한 수준의 인코더 최적화와 가변 압축 품질(품질 또는 성능 향상 중에서 선택할 수 있는 기능)을 약속합니다.

지금까지 VCE를 시도할 수 있는 곳이 없습니다. 단순히 이를 지원하는 응용 프로그램이 없지만 AMD는 관련 VCE에 대한 지원을 제공하기 위해 ArcSoft와 같은 파트너와 협력하고 있습니다. 소프트웨어 제품. 향후에는 개발자가 차세대 AMD 제품을 보다 쉽게 ​​지원할 수 있도록 비디오 인코딩을 가속화하기 위한 소프트웨어 라이브러리를 출시할 계획입니다.

인코딩은 전체 및 하이브리드(GPU 스트림 프로세서의 기능 사용)의 두 가지 모드로 수행할 수 있습니다. 전체 모드는 최대 에너지 효율성과 일관된 수준의 성능이 필요한 애플리케이션을 위해 설계되었습니다. 인코딩 전체 모드 VCE에서 실시간보다 빠르고 짧은 대기 시간을 제공합니다. 그러나 하이브리드 모드도 있습니다.

이 모드에서 GPU 수학 블록은 VCE와 함께 작동합니다. 다이어그램에서 노란색 원으로 표시된 모든 고도로 병렬화 가능한 단계는 GCN 계산 장치의 성능을 사용할 수 있으며 전용 VCE 장치는 효율적인 하드웨어 엔트로피 코딩에 참여합니다. 이 모드는 Radeon HD 7970과 같이 수학 능력이 뛰어난 비디오 카드에 매우 적합합니다. 이 두 모드의 품질에 대해 여전히 의문점이 있지만 별도의 자료에서 철저한 분석이 필요합니다.

AMD 스테디 비디오

비디오 데이터를 인코딩 및 디코딩하는 것 외에도 삼각대 또는 기타 유사한 이미지 안정화 도구를 사용하지 않고 품질이 낮은 핸드헬드 비디오를 개선하는 AMD의 새로운 그래픽의 힘을 사용할 수 있는 또 다른 영역이 있습니다. 비디오 안정화 기술은 AMD Steady Video라고 하며, 이미 두 번째 버전이 출시되었습니다.

소프트웨어 안정기의 알고리즘은 매우 간단합니다. 비디오 스트림을 기반으로 카메라의 움직임(이동, 회전, 확대/축소)에 대한 통계가 수집되고 이 움직임은 이전 프레임과 비교하여 현재 프레임에서 보정됩니다. 사진이 많이 흔들리지 않고 안정적으로 유지되도록 이동, 회전 및 크기 조정됩니다.

말은 쉽지만 실천은 어렵다. 단순히 화면에 2백만 개의 픽셀이 있고 초당 최대 30개 또는 심지어 60개 프레임이 있기 때문에 가능한 모든 프레임 이동을 추적하기 위해 얼마나 많은 계산을 수행해야 하는지 상상해 보십시오. 우리는 이미 비디오 처리에 사용되는 QSAD 기능에 대해 위에서 작성했으며, 모션 감지 알고리즘의 속도를 높이기 위해 Steady Video 2.0에서도 사용됩니다. 따라서 GPU는 모든 방향에서 최대 32픽셀의 진폭으로 임의 이동을 처리해야 하며, 이를 위해서는 초당 5000억 개 이상의 SAD 작업(60FPS에서 1920x1080)에 해당하는 성능이 필요합니다.

Radeon HD 7970에서 새로운 QSAD 명령어를 지원함으로써 모션 감지 알고리즘에서 강력한 CPU에 비해 ​​10배를 초과하는 이점이 있습니다! 즉, 이제 비디오 편집기에서 홈 비디오를 처리할 때뿐만 아니라 다른 사람의 온라인 비디오를 볼 때 누구도 무엇을, 어떻게 촬영할지 모르는 고품질 비디오가 우리에게 제공될 것입니다.

세부 정보: Radeon HD 7800 시리즈

  • 칩 코드명: "Pitcairn"
  • 생산 기술: 28nm
  • 28억 개의 트랜지스터(라데온 HD 6900 시리즈의 기반이 되는 카이맨보다 약간 많음)
  • 정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
  • 셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
  • 256비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 4개
  • 코어 클럭: 최대 1000MHz(Radeon HD 7870용)
  • 총 1280개의 부동 소수점 ALU(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀도 지원)를 위한 80개의 SIMD 코어가 있는 20개의 GCN 계산 장치
  • 모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 80개의 텍스처 유닛
  • FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티 앨리어싱 모드를 지원하는 32개의 ROP. 클럭당 최대 32개 샘플 및 무색 모드(Z 전용)에서 최대 성능 - 클럭당 128개 샘플

Radeon HD 7870 그래픽 사양

  • 코어 주파수: 1000MHz
  • 범용 프로세서 수: 1280
  • 텍스처 유닛 수: 80, 블렌딩 유닛: 32
  • 메모리 유형: GDDR5
  • 메모리 용량: 2GB
  • 이론상 최대 채우기 속도: 초당 32.0기가픽셀.
  • 이론적 텍스처 샘플링 속도: 초당 80.0기가텍셀.
  • CrossFire 커넥터 1개
  • PCI 익스프레스 3.0 버스
  • 커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
  • 소비 전력: 3~175W
  • 2개의 6핀 전원 커넥터
  • 듀얼 슬롯 디자인
  • 미국 MSRP: $349

Radeon HD 7850 그래픽 사양

  • 코어 주파수: 860MHz
  • 범용 프로세서 수: 1024
  • 텍스처 유닛 수: 64, 블렌딩 유닛: 32
  • 유효 메모리 주파수: 4800MHz(4×1200MHz)
  • 메모리 유형: GDDR5
  • 메모리 용량: 2GB
  • 메모리 대역폭: 초당 153.6GB
  • 이론상 최대 채우기 속도: 초당 27.5기가픽셀.
  • 이론적 텍스처 샘플링 속도: 초당 55.0기가텍셀.
  • CrossFire 커넥터 1개
  • PCI 익스프레스 3.0 버스
  • 커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
  • 소비 전력: 3~130W
  • 듀얼 슬롯 디자인
  • 미국 MSRP: $249

그리고 이번에는 자사 제품의 네이밍 원칙을 바꾸지 않고 이전 시리즈의 트렌드를 이어갔다. GCN 아키텍처를 기반으로 하는 중간 예산 시리즈의 비디오 카드는 인덱스의 두 번째 숫자에서 상단 및 예산 라인과 다릅니다. 7과 9 대신 숫자 8이 설정되어 매우 논리적입니다. AMD가 GPU 주파수에 대해 1000MHz의 심리적 임계값을 취했기 때문에 Radeon HD 7870은 이름에 "GHz Edition"을 추가하여 이 주파수의 채택을 나타냅니다.

이름에서 알 수 있듯이 Radeon HD 7800은 HD 7700보다 생산성이 높지만 이전 모델인 HD 7900에 비해 속도가 더 낮습니다. NVIDIA 솔루션과 비교하면 출시 당시 출시된 구형 HD 7870이 비디오 카드와 경쟁 지포스 GTX 570이고 더 어린 것은 GTX 560 Ti와 싸우는 것을 목표로 하고 있으며 NVIDIA는 아직 새로운 28nm 미드레인지 칩을 출시하지 않았습니다.

AMD의 두 가지 비디오 카드 모델에는 동일한 2GB의 GDDR5 메모리가 있습니다. 둘 다 256비트 메모리 버스를 사용하므로 1, 2 또는 4GB를 넣을 수 있습니다. 1GB는 너무 작고 4GB는 너무 비쌉니다. 가격대. 따라서 2GB의 이상적인 비디오 메모리가 선택되었다고 말할 수 있습니다. 이는 고해상도에서도 대다수의 게임에 충분하고 비용면에서 너무 비싸지 않습니다.

다른 면에서는 소비자의 관점에서 HD 7850과 HD 7870 모델은 여전히 ​​다릅니다. 구형 라데온 HD 7870은 소비전력이 높아 6핀 전원 커넥터 2개가 추가로 필요하고, HD 7850은 그 중 하나만으로 만족한다. 두 보드 모두 2슬롯 냉각 시스템 설계를 가지고 있지만 대부분의 제조업체는 자체 설계로 최소한 쿨러와 심지어 PCB까지 설계한 보드를 생산합니다.

Radeon HD 7800 제품군의 아키텍처 기능

위에서 새로운 GCN(Graphics Core Next) 아키텍처의 모든 기능을 주의 깊게 설명했으므로 가장 중요한 것만 반복하겠습니다. 회사의 모든 새로운 GPU는 그래픽 처리뿐만 아니라 다양한 유형의 계산을 혼합한 비그래픽 컴퓨팅에서도 뛰어난 기능과 ​​성능을 제공합니다. 또한 새로운 GCN 아키텍처는 코드 최적화 작업의 심각한 단순화, 개발 및 지원의 단순화, 안정적이고 예측 가능한 성능 및 일반적으로 상당히 높은 효율성을 제공합니다.

새로운 아키텍처의 기본 블록은 GCN 블록이며, 이 블록에서 서던 아일랜드 시리즈의 모든 GPU가 조립됩니다. Pitcairn 칩의 블록 다이어그램을 고려하십시오.

다이어그램은 Radeon HD 7870 GPU를 보여줍니다("단순화된" HD 7850은 연결되지 않은 여러 블록이 다릅니다). GCN 아키텍처의 20개의 컴퓨팅 장치가 있습니다. Radeon HD 7800 시리즈의 주니어 솔루션의 경우 그 중 4개가 비활성화되어 있고 그 안에 있는 활성 블록의 수는 16개입니다. 이는 각각 1280 및 1024 스트림 프로세서에 해당합니다(HD의 경우와 동일). 7700 제품군, 정확히 두 배의 블록만 있음) . 각 GCN 단위에는 4개의 텍스처 단위가 있으므로 이전 모델의 총 TMU 수는 80 TMU이고 더 젊은 모델의 경우 64 TMU입니다.

그러나 HD 7870 및 HD 7850의 ROP 및 메모리 컨트롤러 수 역시 가장 어린 라인의 솔루션과 동일합니다. ROP 블록의 수는 두 모델 모두 32개로 상당히 많이 남아 있습니다. Pitcairn 기반 보드용 메모리 버스는 256비트로 축소되었으며 4개의 64비트 채널에서 조립됩니다. 메모리 버스가 전통적으로 먼저 절단되기 때문에 맨 위 라인보다 1.5배 적지만 이 수준의 솔루션에는 나쁘지 않습니다. 빠른 GDDR5 메모리를 사용하여 153GB/s의 비교적 높은 대역폭을 제공하는 것이 좋습니다.

나머지 GCN 아키텍처 칩과 마찬가지로 Pitcairn은 9세대 테셀레이터 블록을 통합하여 다양한 버퍼링 및 캐싱 최적화를 제공하여 형상 처리 성능을 크게 향상시킬 수 있습니다. 다음은 합성 문제에서 이전 세대의 솔루션과 새로운 AMD 보드를 비교한 것입니다. 이에 따라 테셀레이션 속도가 최대 4배 증가한다고 가정할 수 있습니다.

새로운 Radeon HD 7000 비디오 칩에 도입 및 개선된 많은 AMD 기술도 동일한 방식으로 지원됩니다. 여기에 불완전한 목록이 있습니다: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, 텍스처 필터링 품질 개선 등 이 모든 것은 위에서 더 자세히 설명되어 있습니다. 목록에 추가하기 위해 Radeon HD 7800은 개선된 MLAA 2.0 앤티앨리어싱 알고리즘과 SSAA(수퍼샘플링 앤티앨리어싱)를 모두 완벽하게 지원합니다.

게임 성능에 관한 한 Radeon HD 7870은 직접적인 경쟁자 GeForce GTX 570보다 훨씬 빠릅니다. 특히 고해상도의 최신 게임에서 관찰되는 후자의 1.25GB VRAM(해당 솔루션의 경우 2GB와 비교)을 고려할 때 . 더 젊은 Radeon HD 7850은 GeForce GTX 560 Ti와 비교할 수 있으며 여기서 더 이상 메모리 양을 자랑할 수 없습니다. 그러나 AMD의 측정에 따르면 그들의 새로운 솔루션은 여전히 ​​대부분의 게임에서 경쟁 제품보다 빠릅니다.

세부 정보: Radeon HD 7700 시리즈

  • 칩 코드명: "Cape Verde"
  • 생산 기술: 28nm
  • 15억 개의 트랜지스터(Radeon HD 6800 시리즈의 기반이 되는 Barts보다 적음)
  • 정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
  • 셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
  • 코어 클럭: 최대 1000MHz(Radeon HD 7770용)
  • 총 640개의 부동 소수점 ALU(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀 지원)를 위한 40개의 SIMD 코어가 있는 10개의 GCN 계산 장치
  • 모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 40개의 텍스처 유닛
  • HDMI 1.4a 및 DisplayPort 1.2를 포함하여 최대 6개의 모니터에 대한 통합 지원

Radeon HD 7770 그래픽 사양

  • 코어 주파수: 1000MHz
  • 범용 프로세서 수: 640
  • 텍스처 유닛 수: 40, 블렌딩 유닛: 16
  • 메모리 유형: GDDR5
  • 메모리 용량: 1기가바이트
  • 이론적 텍스처 샘플링 속도: 초당 40.0기가텍셀.
  • CrossFire 커넥터 1개
  • PCI 익스프레스 3.0 버스
  • 커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
  • 소비 전력: 3~80W
  • 6핀 전원 커넥터 1개
  • 듀얼 슬롯 디자인
  • 미국 권장소비자가격: $159

Radeon HD 7750 그래픽 사양

  • 코어 주파수: 800MHz
  • 범용 프로세서 수: 512
  • 텍스처 유닛 수: 32, 블렌딩 유닛: 16
  • 유효 메모리 주파수: 4500MHz(4×1125MHz)
  • 메모리 유형: GDDR5
  • 메모리 용량: 1기가바이트
  • 메모리 대역폭: 초당 72GB
  • 이론상 최대 채우기 속도: 초당 12.8기가픽셀.
  • 이론적 텍스처 샘플링 속도: 초당 25.6기가텍셀
  • PCI 익스프레스 3.0 버스
  • 커넥터: DVI 듀얼 링크, HDMI 1.4, DisplayPort 1.2 1개
  • 소비 전력: 3~55W
  • 추가 전원이 필요하지 않음
  • 단일 슬롯 디자인
  • 미국 MSRP: $109

GCN 아키텍처를 기반으로 한 저가형 비디오 카드 시리즈는 인덱스의 두 번째 숫자에서 상단 및 중간 라인과 다릅니다. 이전과 마찬가지로 9위는 숫자 7로 차지했습니다. Radeon HD 7770은 더 생산적인 솔루션이지만 더 젊은 모델인 HD 7750도 있습니다. 이전 보드는 출시 당시 시장에 직접적인 경쟁자가 없었으며 GeForce GTX 560과 GTX 550 Ti 사이에 위치했습니다. , 그리고 더 어린 것은 GTX 550 Ti와 싸우는 것을 목표로 합니다. HD 7770의 경우 GeForce GTX 560 SE에 맞서 경쟁자가 나중에 발표되었습니다(모든 NVIDIA 솔루션은 구형 GPU를 기반으로 함).

AMD 비디오 카드의 고려된 두 모델 모두 1GB의 동일한 양의 GDDR5 메모리를 가지고 있습니다. 128비트 메모리 버스를 사용하기 때문에 2GB의 메모리를 장착할 수 있지만 이 정도의 GDDR5 메모리는 가격대에 비해 너무 많은 비용이 듭니다. 따라서 이러한 볼륨의 모델은 지금까지 출시되었지만 향후 2GB의 비디오 메모리 옵션이 출시될 수 있습니다. 그동안 우리는 HD 7800용으로 이 볼륨을 남겨두기로 결정했습니다.

다른 소비자 특성 측면에서 HD 7750 및 HD 7770 모델은 상당히 다릅니다. 구형 Radeon HD 7770에 냉각 시스템의 2슬롯 디자인이 있고 쿨러가 구형 솔루션과 같이 플라스틱 케이스로 덮인 경우, 더 젊은 HD 7750은 하나의 슬롯을 차지하고 단순한 쿨러를 사용하여 눈에 띄게 더 단순해 보입니다. 그러나 대부분의 제조업체는 여전히 자체 디자인으로 보드를 생산합니다. 이 가격대의 새 모델의 전력 소비량도 다르며 이전 모델에는 6핀 보조 전원 커넥터가 1개 있고 젊은 모델에는 PCI Express로 전원이 공급됩니다.

아키텍처 기능 Radeon HD 7700

새로운 아키텍처의 기본 블록은 GCN 블록이며 시리즈의 모든 GPU가 이 블록에서 조립됩니다. 사용 가능한 각 GCN 블록은 자체적으로 명령을 스케줄링하고 배포할 수 있으며 하나의 컴퓨팅 장치는 최대 32개의 독립 명령 스트림을 실행할 수 있습니다. Cape Verde 칩의 블록 다이어그램을 살펴보겠습니다.

다이어그램은 Radeon HD 7770 GPU를 보여줍니다("제거된" HD 7750은 몇 개의 연결 해제된 장치를 특징으로 함). 우리는 GCN 아키텍처의 10개의 컴퓨팅 장치를 볼 수 있습니다. Radeon HD 7700 시리즈의 주니어 솔루션의 경우 그 중 2개를 비활성화하기로 결정하여 블록 수가 8개가 되었습니다. 이는 640 및 512 스트림 프로세서에 해당합니다. 그리고 각 GCN 단위의 구성에는 4개의 텍스처 단위가 있으므로 이전 모델의 TMU 수에 대한 최종 수치는 40 TMU이고 더 젊은 모델의 경우 32 TMU입니다.

HD 7770 및 HD 7750의 ROP 및 메모리 컨트롤러 수는 동일하며 ROP를 너무 많이 자르지 않기로 결정하여 각각 16개로 두었습니다. 그러나 Cape Verde의 메모리 버스는 2개의 64비트 채널에서 조립된 128비트로 축소되었습니다. 일반적으로 이것은 상위 시리즈보다 3배 적으며 우선 저렴한 칩에서 메모리 버스가 전통적으로 축소된다는 또 다른 확인을 보았습니다. 빠른 GDDR5 메모리를 사용하면 72GB/s의 비교적 높은 대역폭(저렴한 솔루션의 경우)을 남길 수 있습니다.

상당히 많은 양의 L2 캐시(최고급 칩의 경우 768KB와 비교하여 - 분명히 L2 캐시는 칩에서 너무 많은 공간을 차지하지 않음)에 주목해야 합니다. 기하학적 성능의 개선으로. 최고급 칩과 마찬가지로 Cape Verde는 다중 버퍼링 및 캐싱 최적화를 특징으로 하는 9세대 테셀레이터를 갖추고 있어 Radeon HD 6000 시리즈에 비해 지오메트리 처리 성능이 크게 향상되었습니다.

일반적으로 새로운 Radeon HD 7000 비디오 칩에서 구현 및 개선된 AMD 기술에 대한 모든 정보를 반복하지는 않을 것입니다(여기에 일부 목록이 있습니다: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, 텍스처 필터링 품질 개선 , etc. .p.), 이 모든 것이 위에서 더 자세히 설명되어 있습니다. HD 7700 시리즈는 6개의 모니터와 스테레오 렌더링을 지원하는 AMD Eyefinity 2.0은 물론 향상된 비디오 디코딩 및 인코딩 장치를 포함하여 여기에 나열된 모든 기능을 지원합니다.

그러나 가장 중요한 것은 무엇입니까? 게임에서의 성능은 무엇입니까? 렌더링 속도의 첫 번째 추정은 항상 제조업체의 프레젠테이션에서 확인할 수 있습니다. AMD는 Radeon HD 7770이 각각 GeForce GTX 560과 GeForce GTX 550 Ti의 중간쯤에 있다고 생각하고 두 번째 경쟁 모델과 소재를 비교합니다.

그러나 그들은 Radeon HD 7750을 어떤 것과도 비교하지 않으며, 단순히 FullHD 해상도의 최대 설정에서 이 모델에서 대부분의 최신 게임을 재생할 수 있다는 점에 주목합니다. 그러나 이것은 놀라운 일이 아닙니다. 지난 몇 년 PC 독점은 거의 없으며 다중 플랫폼 게임은 요구 사항이 훨씬 적습니다. 따라서 Radeon HD 7700 시리즈 보드는 까다로운 사용자에게 적합합니다.

세부 정보: 모델 Radeon HD 7790

  • 칩 코드명: "Bonaire"
  • 생산 기술: 28nm
  • 20억 8000만 트랜지스터(Radeon HD 7700의 Cape Verde보다 많지만 Radeon HD 7800의 Pitcairn보다 작음)
  • 정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
  • 셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
  • 128비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 2개
  • 코어 주파수: 1000MHz
  • 총 896개의 부동 소수점 ALU가 있는 56개의 SIMD 코어로 구성된 14개의 GCN 컴퓨팅 유닛(정수 및 부동 소수점 형식, IEEE 754 FP32 및 FP64 정밀도 지원)
  • 모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 56개의 텍스처 유닛
  • FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티 앨리어싱 모드를 지원하는 16개의 ROP. 클럭당 최대 16개 샘플 및 무색 모드(Z 전용)에서 최대 성능 - 클럭당 64개 샘플

Radeon HD 7790 그래픽 사양

  • 코어 주파수: 1000MHz
  • 범용 프로세서 수: 896
  • 텍스처 유닛 수: 56, 블렌딩 유닛: 16
  • 메모리 유형: GDDR5
  • 메모리 용량: 1기가바이트
  • 메모리 대역폭: 초당 96GB
  • 이론상 최대 채우기 속도: 초당 16.0기가픽셀.
  • 이론적 텍스처 샘플링 속도: 초당 56.0기가텍셀.
  • CrossFire 커넥터 1개
  • PCI 익스프레스 3.0 버스
  • 커넥터: DVI 듀얼 링크, HDMI 1.4, Mini-DisplayPort 1.2 2개
  • 소비 전력: 3~85W
  • 6핀 전원 커넥터 1개
  • 듀얼 슬롯 디자인
  • 미국 권장소비자가격: $149

새로운 중간 예산 칩을 기반으로 한 저렴한 비디오 카드 모델은 HD 7700 하위 제품군의 이전 상위 모델과 인덱스의 세 번째 숫자가 다릅니다. 7 대신 성능 향상을 나타내는 숫자 9를 표시합니다. 동시에 Radeon HD 7790 인덱스는 한 단계 높은 HD 7800 라인에 비해 생산성이 떨어지는 비디오 카드임을 분명히 나타냅니다.

그러나 여기에서도 모든 것이 그렇게 간단하지 않습니다. 확실히 더 젊은 HD 7850과 논쟁할 수 있습니다. 그러나 Radeon HD 7790의 권장 가격은 $149, 즉 HD 7770과 HD 7850의 중간 정도입니다. 같은 가격대의 경쟁업체 솔루션에 대해 말하자면 HD 7790은 분명히 가지다 엔비디아 지포스 GK106 칩을 기반으로 하는 GTX 650 Ti는 가격과 속도면에서 HD 7770과 HD 7850 사이에 있습니다. 그러나 NVIDIA는 AMD의 새 보드 출시에 즉시 더 높은 성능이 특징인 GeForce GTX 650 Ti Boost의 오버클럭 버전을 출시하여 대응했습니다.

이 AMD 그래픽 카드 모델에는 1GB 용량의 GDDR5 메모리가 있습니다. GPU에는 128비트 메모리 버스가 있으며 이론적으로 2GB를 공급할 수 있지만 이 가격대의 고속 GDDR5 메모리는 여전히 너무 비싸고 AMD는 메모리가 더 작은 모델을 출시했지만 그렇지는 않을 수도 있습니다. 낮은 설정과 해상도에서도 일부 최신 게임에는 충분합니다. 그러나 2GB의 비디오 메모리가 있는 파트너의 비디오 카드도 가능합니다.

옆에 나란히 서 있는 모델과 마찬가지로 Radeon HD 7790에는 플라스틱 케이스로 덮인 냉각 시스템의 이중 슬롯 설계가 있습니다. 대부분의 제조업체는 여전히 자체 쿨러 디자인의 보드를 출시하지만 참조용 보드는 그다지 중요하지 않습니다. 흥미롭게도 새 모델의 소비 전력은 HD 7770에 비해 크게 증가하지 않았지만 전력 효율의 향상은 기대할 수 있었다. 그건 그렇고, 이것이 참신에 6 핀 보조 전원 커넥터가 하나만있는 이유입니다.

건축적 특징

출시된 Radeon HD 7790의 기반이 되는 새로운 Bonaire GPU는 우리가 1년 반 동안 알고 있던 것과 동일한 GCN(Graphics Core Next) 아키텍처에 속하지만 AMD는 이를 GCN 1.1이라고 부르며 사소한 변경을 암시합니다. 사실, 이 칩은 약간의 변화가 있긴 하지만 아키텍처적으로는 이전 칩과 거의 동일합니다. 예를 들어 새로운 아키텍처는 이기종 아키텍처(Heterogeneous System Architecture - HSA), 더 많은 동시 실행 스레드 지원, AMD PowerTune 기술의 새 버전에 유용한 지침을 도입했습니다. 그러나 이러한 모든 변경 사항이 중요하다고 할 수는 없습니다. 기본 블록에 새로운 것이 없고 효율성이 향상되기 때문입니다.

따라서 새로운 GCN(Graphics Core Next) 아키텍처의 모든 기능을 신중하게 설명하는 를 안전하게 참조할 수 있으며 여기서는 특정 제품의 가장 중요한 특성 및 기능만 반복합니다. AMD의 모든 최신 GPU는 두 가지를 혼합한 것을 포함하여 그래픽 및 비그래픽 처리 모두에서 뛰어난 기능과 ​​성능을 제공합니다. 새로운 GCN 아키텍처는 또한 높은 효율성을 유지하면서 최적화 및 소프트웨어 개발 작업을 크게 단순화합니다.

아시다시피 아키텍처의 기본 블록은 남군도 시리즈의 모든 GPU가 조립되는 GCN 블록입니다. GCN 컴퓨팅 장치는 하위 섹션으로 나뉘며 각 하위 섹션은 자체 명령 스트림에서 작동합니다. GCN 블록에는 데이터 교환 또는 로컬 레지스터 스택 확장을 위한 전용 64KB 로컬 데이터 스토리지가 있습니다. 또한 블록에는 읽기 및 쓰기 기능이 있는 1단계 캐시 메모리와 샘플링 및 필터링 블록이 있는 본격적인 텍스처 파이프라인이 있습니다. 기존의 각 GCN 유닛은 자체적으로 명령을 스케줄링하고 배포할 수 있으며 하나의 컴퓨팅 유닛은 여러 개의 독립적인 명령 스트림을 실행할 수 있습니다. 새 칩의 블록 다이어그램을 살펴보겠습니다.

Bonaire 방식은 10개의 GCN 컴퓨팅 장치가 있는 Cape Verde와 20개의 GCN 장치가 있는 Pitcairn 간의 성능을 제공하는 새로운 솔루션의 목표를 확인합니다. 2012년에 출시된 이 두 GPU는 거의 정확히 절반 정도 차이가 나기 때문에 중간에 다소 큰 성능 격차가 있었는데 이를 현재 보네르가 채웠습니다.

다이어그램은 어떤 블록도 자르지 않는 완전한 솔루션인 Radeon HD 7790 형태의 그래픽 프로세서를 보여줍니다. 이 칩에는 896개의 스트림 프로세서에 해당하는 GCN 아키텍처의 14개의 컴퓨팅 장치가 포함되어 있습니다. 각 GCN에는 4개의 텍스처 단위가 있으므로 새 모델의 총 TMU 수는 56 TMU입니다. 즉, Bonaire는 주파수가 동일할 경우 수학적 계산 및 텍스처 가져오기 속도 측면에서 Cape Verde 칩보다 정확히 1.4배 빠릅니다.

그러나 Bonaire 및 Radeon HD 7790의 ROP 장치 및 메모리 컨트롤러 수는 Cape Verde 및 Radeon HD 7770에서 본 것과 유사합니다. 16개의 ROP 장치를 남기기로 결정했으며 새 칩의 메모리 버스는 128비트 , 2개의 64비트 채널에서 조립됩니다. 적은 수의 ROP가 솔루션의 "아킬레스건"이 될 수 있습니다. 빠른 GDDR5 메모리를 사용하면 96GB/s의 비교적 높은 처리량을 제공할 수 있지만 ROP 성능에 대해서는 아무 것도 할 수 없기 때문입니다.

그러나 새로운 GPU에서는 기하학적 성능과 테셀레이션 속도가 향상되었습니다. 예, Cape Verde에도 9세대 테셀레이터가 있지만 Bonaire는 지오메트리 블록, 래스터라이저 및 명령 프로세서(다이어그램에서 ACE로 표시)의 수를 두 배로 늘렸습니다. 이제 그 중 두 개가 있습니다. 이러한 개선을 통해 Bonaire는 보다 강력한 Pitcairn 및 Tahiti와 마찬가지로 클록당 최대 2개의 기하학적 원형을 처리할 수 있습니다.

기억하시겠지만, AMD가 처음으로 1GHz와 동일한 GPU 클럭 주파수의 중요한 심리적 임계값을 취한 것은 Radeon HD 7770이었습니다. 따라서 HD 7790도 1GHz의 정확히 동일한 기준 주파수를 가지므로 HD 7770에 비해 성능이 향상되는 것은 아키텍처 변경과 실행 장치 수의 증가만으로 정당화될 수 있습니다.

그러나 참신함의 비디오 메모리의 빈도는 훨씬 높습니다. HD 7770의 메모리 주파수가 4.5GHz로 비교적 낮았다면 HD 7790에는 6GHz에서 작동하는 고속 GDDR5 메모리가 장착되어 3분의 1 더 많은 대역폭을 제공합니다. Radeon HD 7700 하위 제품군에 비해 비디오 메모리 대역폭이 33% 증가하여 게임 성능이 확실히 향상되었습니다. AMD는 HD 7790 프레임 속도와 4.5 및 6.0GHz에서 실행되는 메모리를 비교하여 이 차트를 제공합니다.

메모리 대역폭 증가로 인한 최대 속도 향상은 StarCraft II 및 Crysis 2와 같은 게임에서 달성되었습니다. 그리고 평균적으로 메모리 대역폭이 33% 증가하면 최신 게임 세트에서 평균 프레임 속도가 약 10% 증가합니다. 성능에 대한 유일한 강조는 아니지만 메모리 대역폭이 우리 시대에 매우 중요하다는 것을 보여주는 나쁜 지표는 아닙니다. 더 많은 ROP를 사용하면 Bonaire의 속도가 훨씬 더 빨라질 수 있습니다.

HD 7770에 비해 평균 소비 전력이 약간 증가한 것은 분명합니다. 이전 모델의 경우 이 값이 80W이고 HD 7790의 경우 85W입니다. 이것은 33-40%의 이론적 성능 향상을 위해 지불하기에는 매우 작은 가격입니다! 아키텍처 개선(PowerTune), 이전 GPU의 경험을 기반으로 한 새로운 GPU 설계 및 TSMC의 기술 프로세스의 지속적인 개선 - 이 모든 것이 속도 특성의 상당한 개선과 함께 약간의 소비 증가로 이어졌습니다.

Bonaire의 칩 면적과 트랜지스터 수는 새 칩이 확실히 Cape Verde보다 크지만 계산, 질감 및 기하학적 단위의 추가는 눈에 띄지 않을 수 없었습니다. 이러한 매개변수에 따르면 Bonaire는 Cape Verde와 Pitcairn 사이의 대략 중간에 위치합니다. Bonaire는 160mm 2 칩에 20억 8천만 개의 트랜지스터를 포함하고 있으며 Cape Verde의 경우 이 수치는 각각 15억 및 123mm 2이며 Pitcairn의 경우 28억 개의 트랜지스터 및 212mm 2 칩 면적입니다.

당연히 새로운 칩은 새로운 Radeon HD 7000 제품군에 도입 및 개선된 모든 AMD 기술을 지원합니다(불완전한 목록: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, 텍스처 필터링 품질 개선 등), 이 모두 AMD Radeon HD 7970: 새로운 단일 프로세서 리더 문서에 자세히 설명되어 있습니다. HD 7790 모델은 6개의 모니터 및 스테레오 렌더링이 있는 AMD Eyefinity 2.0을 포함하여 나열된 모든 기능을 지원하며 향상된 비디오 디코딩 및 인코딩 장치도 갖추고 있습니다.

향상된 PowerTune 기술

2010년에 AMD는 Cayman 칩(AMD Radeon HD 6900 시리즈)에 PowerTune 기술을 도입했습니다. 이 GPU는 PowerTune이라는 동적 전원 관리 기능을 최초로 탑재했습니다. FurMark와 같은 특수 안정성 테스트에서 너무 많은 전력 소비를 피하면서 일반적인 애플리케이션의 최대 클럭 속도를 높일 수 있었습니다. 그런 다음이 기술은 듀얼 칩 모델 AMD Radeon HD 6990에 적용되었으며 분명한 이유로 더 필요했습니다.

이 기술은 2012년 중반에 AMD PowerTune에 자동 주파수 증가인 Boost가 추가되면서 주요 업데이트를 받았습니다. AMD Radeon HD 7970 GHz Edition에서 이 알고리즘은 일반 버전비디오 카드. 자동 오버클러킹이 없는 비디오 카드의 PowerTune 작동 알고리즘은 유휴(유휴), 경부하 모드(낮은 3D) 및 최대 속도의 세 가지 상태를 사용합니다. HD 7970GHz에는 Boost 오버클러킹 모드가 추가되었습니다. PowerTune은 필요할 때 더 낮은 부하 모드로 전환하여 필요한 소비량 내에서 유지하는 역할을 합니다. 이 경우 기술은 클록 주파수 값을 급격히 줄입니다. 실제로 이러한 점프는 두 가지 활성 모드 사이의 큰 간격으로 인해 드뭅니다.

GPU 클럭 속도를 줄이면 전력 소비가 줄어들지만 더 나은 제어를 위해서는 전압을 줄여야 합니다. 이것이 바로 Radeon HD 7790이 하는 일입니다. 새로운 Bonaire 그래픽 칩은 다른 주파수와 전압 설정을 가진 8개의 상태를 가지고 있어 GPU가 항상 최적의 전압과 주파수에서 실행되도록 하는 동시에 이전보다 더 높은 클럭 속도를 허용합니다. 상태 간 전환은 GPU 부하와 현재 GPU 전력 소비를 기반으로 합니다.

새로운 알고리즘에서 PowerTune은 소비 수준을 초과할 때 주파수를 갑자기 떨어뜨릴 필요가 없으며 주파수와 함께 전압도 감소합니다. 상태 전환은 짧은 시간에도 소비 제한을 초과하지 않도록 가능한 한 빨라야하므로 Bonaire는 10ms마다 PowerTune 상태를 전환합니다. 즉, 1초마다 칩의 상태가 100번 변경됩니다.

이러한 지속적인 주파수 변화로 인해 MSI Afterburner 및 GPU-Z와 같은 타사 응용 프로그램은 즉각적인 클럭 속도를 표시하지 않고 일정 기간 동안의 평균(소위 "유효" 주파수)을 표시합니다. 또 다른 흥미로운 혁신은 AMD가 새로운 PowerTune 설정을 타사 애플리케이션. 또한 파트너는 자체 PowerTune 설정을 지정하여 공장에서 오버클럭된 그래픽 카드를 생성하고 AMD의 참조 값보다 더 많은 기능을 제공할 수 있습니다. 진실, 다른 설정 PowerTune은 다른 제조업체의 동일한 모델의 비디오 카드가 서로 다른 클럭 주파수를 가질 뿐만 아니라 시간이 지남에 따라 변경하는 알고리즘을 갖게 되므로 동일한 조건에서 비교하기 어렵습니다.

Radeon HD 7790 모델의 비디오 카드 판매는 2013년 4월 초에 시장에서 시작되었습니다. AMD는 파트너와 함께 기준 주파수와 공장 오버클럭 솔루션이 있는 두 마더보드의 출시를 조직했습니다. 그리고 이제 두 제조업체는 파트너가 제공하는 다양한 옵션을 통해 거의 동일한 방식으로 새로운 비디오 카드를 시장에 출시하고 있습니다. 사실, 파트너들은 기존의 것보다 거의 더 많은 오버클럭된 HD 7790 버전을 출시했으며, 그 안에 있는 그래픽 칩은 약 1075MHz의 주파수에서 작동합니다.

세부 정보: Radeon HD 7990 모델

  • 코드네임 "몰타"
  • 생산 기술: 28nm
  • 각각 43억 개의 트랜지스터가 있는 2개의 칩
  • 정점, 픽셀 등 다양한 데이터 유형의 스트리밍 처리를 위한 공통 프로세서 어레이가 있는 통합 아키텍처.
  • 셰이더 모델 Shader Model 5.0을 포함한 DirectX 11.1에 대한 하드웨어 지원
  • 이중 384비트 메모리 버스: GDDR5 메모리를 지원하는 64비트 폭 컨트롤러 2배 6개
  • GPU 주파수: 1000MHz
  • 총 4096개의 부동 소수점 ALU(정수 및 부동 형식, IEEE 754 표준 내에서 FP32 및 FP64 정밀도 지원)로 구성된 128개의 SIMD 코어를 포함한 2개의 32개의 GCN 계산 장치
  • 모든 텍스처 형식에 대해 삼선형 및 이방성 필터링을 지원하는 2x128 텍스처 단위
  • FP16 또는 FP32 프레임 버퍼 형식을 포함하여 픽셀당 16개 이상의 샘플을 프로그래밍 가능한 샘플링이 가능한 앤티앨리어싱 모드를 지원하는 2x32 ROP. 클럭당 최대 64개 샘플 및 무색 모드(Z만 해당)에서 최대 성능 - 클럭당 256개 샘플
  • HDMI 1.4a 및 DisplayPort 1.2를 통해 최대 6개의 모니터에 대한 통합 지원

Radeon HD 7990 그래픽 사양

  • 코어 주파수: 1000MHz
  • 범용 프로세서 수: 4096
  • 텍스처 단위 수: 2x128, 혼합 단위: 2x32
  • 유효 메모리 주파수: 6000MHz(4×1500MHz)
  • 메모리 유형: GDDR5
  • 메모리 용량: 2x3GB
  • 메모리 대역폭: 초당 2x288GB
  • 이론상 최대 채우기 속도: 초당 64기가픽셀.
  • 이론적 텍스처 샘플링 속도: 초당 256기가텍셀.
  • CrossFire 커넥터 1개
  • PCI 익스프레스 3.0 버스
  • 커넥터: DVI 듀얼 링크, 4개의 Mini-DisplayPort 1.2
  • 최대 375W의 전력 소비
  • 2개의 8핀 보조 전원 커넥터
  • 듀얼 슬롯 디자인
  • 러시아의 권장 가격은 32,999루블입니다. (미국의 경우 - $999).

이미 2세대 AMD 비디오 카드에서 듀얼 칩 모델의 명명 원칙은 변경되지 않았습니다. 두 개의 가장 강력한 비디오 칩을 기반으로 하는 최고의 솔루션은 인덱스의 첫 번째 숫자만큼 이전 세대 모델의 해당 클래스와 다릅니다. 6 대신 새 시리즈를 나타내는 숫자 7을 받았습니다. 발표된 비디오 카드는 단일 칩 솔루션과 세 번째 숫자가 달라 세대 내 최대 성능을 나타냅니다.

경쟁사와 비교하자면, 오늘 발표된 Radeon HD 7990 모델의 주요 경쟁자는 거의 1년 전에 출시된 GeForce GTX 690 비디오 카드이며, 서로 싸워야 할 것은 이 2칩 솔루션입니다. 사실, NVIDIA는 강력한 솔루션이 하나 더 있지만 이미 단일 GPU인 GeForce GTX Titan을 기반으로 하고 있으며, 이는 해당 AMD 보드의 경쟁자로 간주될 수도 있습니다.

새로운 듀얼 칩 Radeon 비디오 카드에는 Tahiti 칩의 384비트 메모리 버스로 인해 GPU당 3GB 용량의 GDDR5 메모리가 장착되어 있습니다. 이러한 볼륨은 최대 설정, 앤티앨리어싱 및 고해상도가 활성화된 일부 최신 게임 응용 프로그램에서는 더 이상 작은 양의 메모리(칩당 2GB 이하)가 더 이상 사용되지 않을 수 있기 때문에 이러한 높은 수준의 제품에 대해 정당화됩니다. 충분한. 그리고 스테레오 모드 또는 Eyefinity 모드의 다중 모니터에서 렌더링할 때 더욱 그렇습니다.

이러한 강력한 듀얼 칩 그래픽 카드에는 기존 AMD 카드 쿨러와 다른 방대한 듀얼 슬롯 냉각 시스템이 있음이 분명합니다. 비교적 낮은 속도로 작동하는 3개의 대형 팬이 있는 덮개 아래에 숨겨진 거대한 방열판을 갖추고 있습니다. 듀얼 GPU 카드의 전력 소비는 명백한 이유 때문에 상당히 높으며 2개의 8핀 전원 커넥터가 있지만 최소한 3개는 아닙니다. 2개의 Tahiti 칩을 기반으로 하는 비참조 샘플의 경우와 같습니다.

건축물

코드명 "Malta"인 비디오 카드는 Southern Islands 제품군의 "Tahiti" GPU 2개를 기반으로 하므로 현재 GCN(Graphics Core Next) 아키텍처의 모든 기능을 철저하게 설명하는 참조만 하면 됩니다. 모재에서는 특정 제품의 가장 중요한 특성과 특징만을 반복합니다.

아키텍처의 기본 블록은 시리즈의 모든 GPU가 조립되는 GCN 블록입니다. 계산 단위는 하위 섹션으로 나뉘며 각 하위 섹션은 자체 명령 스트림에서 작동하며 데이터 전용 로컬 스토리지, 읽기 및 쓰기 기능이 있는 1단계 캐시 메모리, 샘플링 및 필터링 장치. 각 GCN 블록은 자체적으로 명령을 스케줄링하고 배포할 수 있으며 하나의 컴퓨팅 블록은 여러 개의 독립적인 명령 스트림을 실행할 수 있습니다. Radeon HD 7990은 이미 우리에게 알려진 두 개의 Tahiti 칩을 사용합니다.

그래픽 프로세서 다이어그램(Radeon HD 7990에는 2개 있음)은 GCN 아키텍처의 32개 컴퓨팅 장치를 보여주며 모두 활성 상태입니다. 이전에는 2칩 솔루션의 경우 375W의 전력 소비에 진입하기 위해 일부를 꺼야 하고 주파수를 낮추어야 한다고 가정했지만 AMD 엔지니어는 이 어려운 작업을 성공적으로 해결했습니다. 아마도 전력 소비가 낮은 Tahiti의 새로운 개정판이 출시되었거나 칩이 매우 엄격한 선택을 통과했을 수 있습니다.

각 GCN 유닛에는 16개의 텍스처 유닛이 있기 때문에 TMU의 수는 칩당 128 유닛으로 초당 256기가텍셀의 총 성능을 제공하며 이는 GeForce GTX 690 경쟁자에게 매우 좋습니다. HD 7990도 단일 칩에 비해 변화가 없었고 GPU당 각각 32개, 6개로 남았다. Radeon HD 7990에는 12개의 64비트 채널로 구성된 듀얼 384비트 메모리 버스가 있어 총 메모리 대역폭이 576GB/s로 또 다른 기록입니다.

그렇지 않으면 새 보드가 모든 것을 지원합니다. 현대 기술 Radeon HD 7000 라인의 새로운 비디오 칩에 도입 및 개선된 AMD의 PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, 개선된 텍스처 필터링 품질 등 이 모든 것은 위의 Radeon HD 7970에 대한 설명에서 자세히 설명되어 있으며 반복할 필요가 없습니다.

냉각 시스템 및 전력 소비

이러한 심각한 듀얼 칩 보드의 경우 고효율 냉각 시스템이 특히 중요합니다. 2개의 타히티 기반 파트너 솔루션의 경우 3슬롯 솔루션을 사용하고 ASUS ARES II의 경우에도 수냉, 이 경우 더 적은 전력으로 버틸 필요가 있었기 때문에 매우 거대한 방열판과 향상된 음향 특성을 가진 3개의 팬이 있는 쿨러를 설계했습니다.

냉각 시스템의 소음과 GPU에 제공되는 온도는 매니아를 위해 설계된 최고의 솔루션을 포함하여 모든 비디오 카드의 가장 중요한 소비자 특성 중 하나입니다. 너무 시끄럽거나 비효율적인 냉각 시스템은 구매자에게 수익성이 낮은 구매로 간주되며 다른 조건은 (대략) 동일합니다. 따라서 AMD는 시장의 다른 최고의 솔루션과 비교할 때 Radeon HD 7990에서 이 문제를 매우 심각하게 받아들였습니다. 새 시스템의 음향 특성을 고려하십시오.

이 다이어그램은 Radeon HD 7990과 두 개의 경쟁업체인 세 가지 비디오 카드의 소음 수준을 보여줍니다. 듀얼 칩 지포스 NVIDIA의 GTX 690 및 단일 칩 GTX Titan. 또한, 소음은 Furmark를 사용하여 유휴 모드(시스템 유휴) 및 최대 부하와 같은 다양한 조건에서 측정되었습니다. AMD의 수치를 믿으면 이 비교에서 가장 큰 듀얼 칩 GTX 690은 말할 것도 없고 단일 칩 Titan조차도 쿨러 소음 측면에서 참신함에 미치지 못합니다.

그러나 이러한 인상적인 음향 성능이 달성된 것은 GPU 온도의 손상 때문이 아닙니까? 다음 차트는 AMD의 Radeon HD 7990과 동일한 두 경쟁업체에서 측정된 GPU 온도를 보여줍니다. 이번에 AMD는 Furmark에서 테스트할 때 고부하 모드만 사용했습니다.

그리고 다시 "교활한"좌표 축은 0이 아닌 원점과 함께 사용됩니다. Radeon HD 7990과 GTX Titan의 80도와 82도의 실제 차이는 거의 감지할 수 없지만 GTX 690의 87도는 분명히 더 나쁩니다. 다시 말하지만, 이러한 모든 테스트는 이해 당사자에 의해 수행되었으며 독립적인 검증 대상입니다.

전력 소비 측면에서 듀얼 칩 솔루션은 새로운 것이 아니지만 이전에 발표된 ZeroCore Power 기술에 대한 지원도 여기에 있습니다. 이 기술디스플레이 장치가 꺼진 상태에서 "깊은 유휴"(또는 "절전") 모드에서 전력 소비를 크게 줄이는 데 도움이 됩니다. 이 모드에서 유휴 GPU는 거의 완전히 비활성화되고 전체 모드 전력의 5% 미만을 소비하여 대부분의 기능 블록을 끕니다. 그리고 2칩 보드의 경우 CrossFire 시스템에서 운영 체제의 2차원 인터페이스를 그릴 때 메인을 제외한 모든 GPU가 전혀 작동하지 않는 것이 훨씬 더 중요합니다. 즉, Radeon HD 7990의 경우 2D 모드의 칩 중 하나는 최소한의 전력 소비로 딥 슬립에 잠기고 두 번째 칩은 PC 딥 유휴 모드에서 "절전"할 수 있습니다.

AMD 라데온 HD 7850M- GCN 아키텍처를 기반으로 하는 DirectX 11을 지원하는 그래픽 카드. 이 카드는 중대형 노트북용으로 설계되었습니다. 2012년 가장 생산적인 비디오 카드 중 하나입니다. 제조에는 28nm 공정 기술이 사용됩니다.

Radeon 7800M 시리즈 어댑터는 Cape Verde 칩뿐만 아니라 라데온 HD 7770 640개의 1D 셰이더 코어와 40개의 텍스처 유닛이 있는 데스크탑 컴퓨터용. 그러나 클럭 속도면에서 HD 7850M은 HD 7870M(각각 675MHz ~ 800MHz)보다 열등합니다. 전반적으로 7850M은 HD 7750데스크탑용.

예상대로 Radeon HD 7850M은 NVIDIA의 GeForce GTX 560M의 경쟁자가 되었습니다. 더 높은 성능과 더불어 더 낮은 전력 소비(예: GeForce GTX 660M)도 보여주기 때문입니다. 따라서 현대의 까다로운 게임은 중간 및 높음 설정에서 자유롭게 실행됩니다.

7850M에는 MPEG-4 AVC/H.264, VC-1, MPEG-2, Flash, MVC(Multi-View Codec) 및 MPEG-4 part 2(DivX, xVid) HD 비디오 형식을 디코딩하기 위한 새로운 UVD3 비디오 디코더가 있습니다. .

7800M 시리즈 카드도 지원 자동 전환통합 그래픽과 개별 그래픽 사이. 이 기능은 Enduro라고 하며 NVIDIA의 Optimus 기술과 유사합니다. 또한 HD 7850M은 Enduro가 비활성화된 경우 Eyefinity 기술을 사용하여 동시에 최대 6개의 모니터를 지원할 수 있습니다.

다음 기능 HD 7850M디스플레이가 꺼져 있는 "절전" 모드에 있을 때 자동으로 전력 소비를 줄이는 ZeroCore 기능입니다. PowerTune 기술을 사용하면 전력 소비가 허용 가능한 한도 내에 있는 한 그래픽 카드를 오버클럭할 수 있습니다. 예를 들어 FurMark 및 OCCT 실행 시 빈도가 감소하고 일부 게임(Planet, Crysis 또는 Resident Evil 5)에서는 빈도가 증가할 수 있습니다.

내장 HD 오디오 프로세서는 HDMI 및 DisplayPort(예: Blu-ray 비디오)를 통해 고품질 오디오(TrueHD 또는 DTS 마스터 오디오 형식)를 제공할 수 있습니다. 또한 DDMA 기술의 도움으로 여러 장치에서 동시에 소리를 출력할 수 있습니다.

에너지 수준 7850M코어 클럭이 낮기 때문에 7870M보다 훨씬 낮습니다.

제조사: AMD
시리즈: 라데온 HD 7800M
코드: 히드로 프로
건축물: GCN
스레드: 640-통합
클록 주파수: 675*MHz
셰이더 주파수: 675*MHz
메모리 주파수: 1000*MHz
메모리 버스 폭: 128비트
메모리 유형: GDDR5
공통 메모리: 아니
다이렉트X: 다이렉트X 11.1, 셰이더 5.1
에너지 소비: 32W
기술: 28nm
노트북 크기:
출시일: 24.04.2012

* 명시된 클럭 속도는 제조사 사정에 따라 변경될 수 있습니다.

다른 사양의 7800 시리즈. Graphic Core Next 마이크로아키텍처에 구축된 이 칩은 28억 개의 트랜지스터에 해당하는 공간을 차지합니다. Radeon의 대부분의 카드와 마찬가지로 여기에는 최대 6개의 모니터를 동시에 연결할 수 있는 Eyefinity 기술이 있습니다. 그들은 서로 독립적으로 작동하거나 하나의 대형 모니터를 구성할 수 있습니다. 그것은 모두 어떤 설정이 노출되는지에 달려 있습니다.

라데온 7850

이 AMD 7800 시리즈 그래픽 카드의 프로세서 주파수는 800MHz입니다. 고성능 및 대역폭(초당 153기가비트)은 256비트의 버스 크기를 제공합니다. 컴퓨팅 시스템은 1.76테라플롭에 해당하는 데이터를 처리합니다. 컴퓨팅 단위는 16개, 텍스처 단위는 64개입니다. 컴퓨팅 프로세스에는 두 개의 코어가 있습니다.

메모리 형식은 GDDR5 표시에 해당하며 DirectX 버전 11에 대한 지원은 운영 체제 응용 프로그램과의 상호 작용 속도를 높이는 데 도움이 됩니다. 을 위한 더 나은 최적화그래픽 프로세서의 모든 기능을 완전히 공개하고 액세스를 제공할 수 있기 때문에 드라이버 업데이트를 따라야 합니다. 필요한 설정. 시스템의 비디오 카드를 지정하는 기본 드라이버가 카드에 포함되어 있으며 업데이트된 버전은 AMD 웹사이트에서 볼 수 있습니다.

이 AMD Radeon HD 7800 시리즈 그래픽 프로세서에는 최대 4096 x 2160 픽셀에 도달할 수 있는 동시에 60 프레임에서 고품질의 부드러운 이미지를 즐길 수 있는 최신 기술이 내장되어 있습니다. 모든 최신 요구 사항을 충족하여 고품질 사운드를 제공하는 오디오 스트림에도 동일하게 적용됩니다.

라데온 7870

이 AMD Radeon HD 7800 시리즈 그래픽 카드는 특성 면에서 이전 카드의 강력한 후속 제품입니다. 그녀는 그래픽 프로세서로 작업할 수 있는 전체 기가헤르츠를 가지고 있습니다. 컴퓨팅 작업의 성능은 이전 버전인 2.56테라플롭보다 훨씬 높습니다. 20개의 컴퓨팅 유닛과 80개의 텍스처 유닛이 있습니다.

7800 시리즈의 플래그십인 만큼 여러 면에서 동급을 능가한다. 테셀레이션 기술에 대한 지원은 오랫동안 이 제조업체의 비디오 카드에 도입되었지만 이 버전에서는 한계에 도달했습니다. 이제 현실감과 디테일이 돋보이는 3차원 이미지를 즐길 수 있습니다. 그리고 향상된 앤티 앨리어싱은 부드럽고 쾌적한 사진을 얻는 데 도움이됩니다.

다른 매개변수에서 이 AMD Radeon HD 7800 시리즈 대표는 특성면에서 이전 비디오 카드와 완전히 동일합니다. 두 카드 모두 비디오와 게임 모두에서 3D 기술을 지원할 수 있습니다. 성능을 높이기 위해 여러 카드를 연결할 수도 있지만 이 매개변수는 마더보드의 기능에 따라 달라질 수도 있습니다.

2/5페이지

"남쪽 제도"

먼저 AMD의 최신 제품 라벨링에 대해 간략히 알아보겠습니다. 제조사는 성능에 따라 3단계로 나눴다. 코드명 "Cape Verde"는 Radeon HD 7700을 의미합니다. "Pitcairn"이라는 이름은 오늘날의 Radeon HD 7870 및 HD 7850 테스터를 의미합니다.

  • 보급형 = Cape Verde = Radeon HD 7700 시리즈;
  • 주류 = Pitcairn = Radeon HD 7800 시리즈;
  • 고성능 제품 = Tahiti = Radeon HD 7900 시리즈.

즉, 현재 AMD는 28nm 그래픽 칩으로 모든 시장 부문을 커버했습니다. Tahiti 칩을 기반으로 하는 듀얼 코어 비디오 카드의 출시만 예상됩니다. 가명 라데온 HD 7990.

AMD Radeon HD 7800 시리즈 기능

Radeon HD 7800 그래픽 프로세서(Pitcairn)에는 약 28억 개의 트랜지스터와 Graphic Core Next 마이크로아키텍처가 있습니다. 위에서 언급했듯이 Radeon HD 7850 칩(Pitcairn Pro)에는 16개의 컴퓨팅 장치가 있으며 최대 TDP는 130와트입니다. Radeon HD 7870(Pitcairn XT)의 경우 이 수치는 각각 20과 175입니다.

아래 슬라이드는 Radeon HD 7850 및 HD 7870 비디오 카드의 주요 사양을 보여줍니다.

2GB의 GDDR5 메모리는 이미 대부분의 중급 및 고급 모델의 표준이 되고 있습니다. 256비트 덕분입니다. 버스 및 1200MHz(4800MHz 유효)의 높은 클록 주파수에서 대역폭은 154GB/s입니다. 이것은 고해상도와 화질이 있는 게임의 성능에 긍정적인 영향을 미칩니다.

PCI 익스프레스 3 인터페이스

2011년 하반기에 거의 모든 마더보드 제조업체에서 PCI Express 3세대 인터페이스가 있는 마더보드 모델을 발표했습니다. Radeon HD 7000 시리즈가 출시되면서 이 인터페이스가 있는 비디오 카드도 등장했습니다. PCI Express 3는 이전 세대 PCI Express의 대역폭(32Gb/s)의 두 배입니다. PCIe 2에 비해 레인당 처리량이 500Mb/s에서 1Gb/s로 두 배 증가했습니다.

당연히 새로운 PCIe 3을 활용하려면 이 인터페이스가 있는 비디오 카드와 마더보드뿐만 아니라 프로세서의 지원도 필요합니다(Ivy Bridge 제품군의 모든 모델이 PCIe 3을 지원하지는 않음).

아이피니티 2.0

AMD는 여러 모니터에 이미지를 표시하도록 설계된 Eyefinity 기술로 한 걸음 더 나아갔습니다. 높은 덕분에 컴퓨팅 파워 HD 7000 시리즈 및 Eyefinity 2.0 지원으로 이제 총 해상도가 16000 x 16000인 여러 모니터에 이미지를 표시할 수 있습니다. 이를 통해 가로 방향으로 설정된 2560x1600 해상도로 5개의 디스플레이에 이미지를 표시할 수 있습니다. 이러한 해상도로 작업하기 위해 레코드 3GB GDDR5(HD 7970 및 HD 7950)가 제품군의 이전 모델에 설치됩니다.

AMD 드라이버 Catalyst는 2월부터 사용자 지정 해상도를 지원합니다. 즉, Eyefinity의 디스플레이 구성에 따라 필요한 해상도를 설정할 수 있습니다. Catalyst 12.2부터 시작 메뉴를 예전처럼 맨 왼쪽이 아닌 편리한 디스플레이로 설정하는 옵션이 있습니다. 또한 Eyefinity 2는 스테레오 HD3D 출력을 지원합니다. 3D 모드에서 작동하는 3개의 모니터 조합을 지원합니다.

테셀레이션 개선

비디오 카드 AMD 제품군 Radeon HD 7000은 9세대 테셀레이터를 특징으로 하며 현대 게임의 지오메트리 처리에서 상당한 성능 향상을 받았습니다. GCN 코어에는 여전히 두 개의 그래픽 엔진이 포함되어 있지만 이전에 테셀레이션 및 래스터화를 위한 블록이 포함되어 있었다면 이제는 형상 및 픽셀을 처리하도록 설계된 임의의 수의 파이프라인으로 구성됩니다.

AMD Radeon HD 7800 그래픽 카드 지원 HDMI 인터페이스 1.4a, 120Hz(각 눈에 60Hz)의 사진을 표시할 수 있어 3D 이미지를 표시할 수 있습니다. 이전 버전의 HDMI에서는 이것이 불가능했습니다. 12월부터 AMD는 HD3D와 Eyefinity가 드라이버에서 함께 작동할 수 있도록 지원했습니다.

다이렉트X 11.1

Radeon 7000 제품군의 비디오 카드는 곧 출시될 DirectX 11.1을 지원합니다. DX 11.1이 Windows 8과 함께 출시될 것이기 때문에 이것이 실제로 무엇을 줄 것인지 말하기에는 너무 이릅니다. 새 API의 주요 이점은 다음과 같습니다.

  • 독립적인 래스터화;
  • 그래픽 컴퓨팅과 비디오 처리의 유연한 결합
  • 기본 스테레오 3D 지원.

AMD 통합 비디오 디코더

비디오 스트림 디코딩을 담당하는 AMD GPU의 하드웨어 부분입니다. Radeon 7000 시리즈에서 UVF는 일부 개선되었습니다. 일반적으로 UVD는 H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV profile D, Multi-View Codec(MVC), Video Codec Engine에 대한 지원과 같이 이전 제품의 모든 기능을 유지했습니다. ( VCE), AMD 스테디 비디오 2.0. 듀얼 스트림 HD+HD 형식에 대한 지원이 추가되었습니다.

3월 10일 2016년

아래 이 페이지에는 최신 무료 다운로드 링크가 있습니다. AMD 그래픽 카드 드라이버 Radeon HD 시리즈 제품군의 일부인 Radeon HD 7800 시리즈에서. 설치 파일은 공식 사이트에서 가져왔으며 다음에 적합합니다. 윈도우 7, 10, 8, 8.1, XP, 비스타 32/64비트(x86/x64).

올바른 파일 선택의 편의를 위해 Windows 버전과 해당 비트 깊이("비트 깊이")가 아래에 표시됩니다.

컴퓨터는 다음에서 실행됩니다.

  1. 다운로드 (153.5MB / 버전 16.8.2(Crimson Edition 16.8.2 핫픽스) / 릴리스 날짜 2016년 8월 12일)

    Windows 7 32비트용

  2. 다운로드 (239.8MB / 버전 16.8.2(Crimson Edition 16.8.2 핫픽스) / 릴리스 날짜 2016년 8월 12일)

    Windows 7 64비트용

  3. 다운로드 (134.8MB / 버전 16.8.2(Crimson Edition 16.8.2 핫픽스) / 릴리스 날짜 2016년 8월 12일)

    Windows 10 32비트용

  4. 다운로드 (208.24MB / 버전 16.8.2(Crimson Edition 16.8.2 핫픽스) / 릴리스 날짜 2016년 8월 12일)

    Windows 10 64비트용

  5. 다운로드 (205MB / 버전 14.4(Catalyst 소프트웨어 제품군) / 릴리스 날짜 2014년 4월 25일)

    Windows 8 32비트용

  6. 다운로드 (260MB / 버전 14.4(Catalyst Software Suite) / 릴리스 날짜 2014년 4월 25일)

    Windows 8 64비트용

  7. 다운로드 (154.21MB / 버전 16.8.2(Crimson Edition 16.8.2 핫픽스) / 릴리스 날짜 2016년 8월 12일)

    Windows 8.1 32비트용

  8. 다운로드 (239.88MB / 버전 16.8.2(Crimson Edition 16.8.2 핫픽스) / 릴리스 날짜 2016년 8월 12일)

    Windows 8.1 64비트용

  9. 다운로드 (179MB / 버전 14.4(Catalyst 소프트웨어 제품군) / 릴리스 날짜 2014년 4월 25일)

    Windows XP 32 및 64비트용

  10. 다운로드 (151MB / 버전 13.12(Catalyst 소프트웨어 제품군) / 릴리스 날짜 2013년 12월 18일)

    을 위한 윈도우 비스타 32비트

  11. 다운로드 (209MB / 버전 13.12(Catalyst 소프트웨어 제품군) / 릴리스 날짜 2013년 12월 18일)

    Windows Vista 64비트용

대체 - AMD 드라이버 자동 감지를 사용하여 드라이버 얻기

이 옵션편리한 프로그램이기 때문에 AMD Driver Autodetect는 최신 작동 드라이버를 자동으로 선택하고 다운로드합니다., AMD 그래픽 카드 및 Windows 버전에 적합합니다. 이 프로그램은 설치할 필요가 없으며 AMD에서 만들었고 파일은 공식 서버에서 다운로드됩니다.

지침:

  1. AMD Driver Autodetect를 실행하면 드라이버 설치에 필요한 파일이 즉시 자동으로 선택됩니다.
  2. 파일을 다운로드하려면 "지금 다운로드" 버튼을 클릭하십시오.
  3. 파일이 다운로드될 때까지 기다렸다가 설치를 시작합니다.