Графические процессоры AMD Radeon HD 6000 Олег Нечай

Графические процессоры AMD Radeon HD 6000

Олег Нечай

Опубликовано 07 июля 2011 года

Замену выпускавшейся с сентября 2009 серии графических процессоров R800 (кодовое название Evergreen), известных под маркой Radeon 5xxx, планировалось представить осенью 2010 года. При этом новые чипы должны были выпускаться уже не по 40-нм, а по более тонкой 32-нм технологии. Однако компания TSMC, на мощностях которой размещают заказы как AMD, так и NVIDIA, после не слишком удачного запуска приняла решение отказаться от дальнейшего внедрения этого техпроцесса и сосредоточиться на подготовке к 28-нм технологическим нормам. В результате инженерам AMD пришлось менять конструкцию уже готовых к производству чипов, и первыми на рынке появились не флагманские ускорители, а видеокарты среднего класса.

Новая микроархитектура получила кодовое название Northern Islands («северные острова»), причём вошедшие в серию Radeon HD 6000 графические процессоры по сути разделились на два разных семейства: одно из них фактически представляет собой микросхемы предыдущего поколения с минимальными конструктивными доработками (Juniper, Turks, Caicos, Barts), а второе — это серьёзно переработанные Cypress с вычислительными процессорами на основе архитектуры VLIW4 (Cayman и Antilles).

AMD Radeon HD 6000 стали первыми графическими процессорами компании, из логотипа и из названия которых полностью исчезло какое-либо упоминание об ATI, канадском разработчике видеокарт, купленном AMD в 2006 году. Карты предыдущей серии носили официальное название ATI Radeon HD 5000.

Особенности микроархитектуры Northern Islands

Поговорим об архитектурных отличиях семейства Radeon HD 6000 от ускорителей предыдущего поколения. Интересующихся конструктивными особенностями Radeon HD 5000 отсылаем к подробной статье о микроархитектуре R800.

Начнём с графических процессоров Barts, на основе которых выпускаются видеокарты AMD Radeon HD 68xx. Обратимся к блок-схеме этого чипа.

Нетрудно заметить, что в новой микросхеме уменьшилось общее число универсальных процессоров (унифицированных шейдеров): до 1120 по сравнению с 1600 в Cypress. В чипе 14 SIMD-ядер, каждое из которых состоит из 16 блоков суперскалярных потоковых процессоров по пять вычислительных ядер ALU (архитектура VLIW5). Число блоков текстурирования — 56, на каждый SIMD-блок приходится по четыре текстурных. Для связи с видеопамятью типа GDDR5 применяется 256-битная шина с четырьмя 64-разрядными двухканальными контроллерами.

Инженеры AMD не ограничились чисто количественными сокращениями SIMD-ядер, в Barts были внесены и качественные изменения. Главное из них — обновлённый аппаратный движок тесселяции 7-го поколения (по неким внутренним подсчётам AMD). Разработчики говорят об улучшенных механизмах управления потоками и буферизации и утверждают, что по геометрической производительности новый движок не уступает тесселятору чипов NVIDIA на архитектуре Fermi, ранее значительно опережавшему решения AMD. В качестве фактора тесселяции было выбрано значение в 16 пикселей: более «мелкие» полигоны способны лишь тормозить расчёты, не давая принципиального повышения качества изображения.

В Barts также доработаны алгоритмы анизотропной фильтрации и реализован новый механизм сглаживания Morphological Anti-Aliasing (MLAA). Фактически это программный фильтр пост-обработки для двухмерного изображения, рассчитывающий «полутоновые» переходы между пикселями и делающий картинку более естественной.

Из важнейших аппаратных изменений необходимо упомянуть также уницифированный модуль видеодекодера третьего поколения (UVD3), способный аппаратно декодировать не только традиционные форматы H.264 или MPEG-2, но и MPEG-4 (DivX/XviD) и Blu-ray, включая Blu-ray 3D. UVD3 реализован во всех чипах нового поколения, за исключением Radeon HD 6750 и HD 6770 на базе старых микросхем Juniper, где применяется UVD2. Поддерживаются самые свежие версии цифровых видеоинтерфейсов: DisplayPort 1.2 и HDMI 1.4a (с возможностью передачи 3D-видео).

На интерфейсах стоит остановиться отдельно, поскольку все карты серии Radeon HD 6000, включая самые доступные, поддерживают фирменную технологию AMD Eyefinity, позволяющей за счёт вывода нескольких каналов по шине DisplayPort подключать к одному разъёму сразу несколько мониторов. Пропускной способности интерфейса DisplayPort 1.2 достаточно для одновременного подключения к одному порту четырёх дисплеев. Возможны две конфигурации: использование специального хаба (разветвителя) оснащённого набором различных интерфейсов (DP, VGA, DVI или HDMI), либо последовательное соединение дисплеев, полностью совместимых с DisplayPort 1.2, то есть имеющих как входы, так и выходы DP.

Наконец, была переименована технология неграфических вычислений ATI Stream, которая теперь официально называется AMD Accelerated Parallell Processing. Принципиальных аппаратных доработок здесь нет, всё так же поддерживаются API OpenCL и DirectCompute.

Графический процессор Juniper не претерпел никаких изменений: это всё тот же урезанный Cypress с 10 SIMD-ядрами и видеодекодером UVD2, а чипы Radeon HD 6770 и HD 6750 в действительности представляют собой переименованные Radeon HD 5770 и 5770. Единственное отличие — поддержка HDMI 1.4, но неполная, без возможности работы с 3D-видео, которую даёт UVD3.

Бюджетный процессор Turks представляет собой серьёзно урезанный Barts: в нём 6 SIMD-ядер, в каждом из которых работают по 16 блоков потоковых процессоров с 5 ALU. Шина памяти сужена вдвое — до 128 бит. При этом в чипе реализованы все изменения, внесённые в Barts, включая улучшенный тесселятор, поддержку MLAA и видеодекодер UVD3. Младшая модификация Radeon HD 6570 может работать не только с видеопамятью GDDR5, но и с дешёвой памятью DDR3.

Чип начального уровня Caicos — предельно упрощённый Barts: в нём всего два SIMD-ядра и единственный 64-битный контроллер памяти. Производитель предлагает довольно широкий диапазон рабочих частот как процессора, так и видеопамяти, причём поддерживается оба варианта микросхем, как GDDR5, так и DDR3.

Графический процессор Cayman претерпел наибольшие изменения по сравнению с чипами Cypress предыдущего поколения, и они затронули не только чисто количественные показатели, но и саму архитектуру микросхемы. Для оптимизации энергопотребления и упрощения конструкции было принято решения отказаться от суперскалярной архитектуры VLIW5, в который каждый потоковый процессор оснащался пятью вычислительными блоками ALU: четыре из них были рассчитаны на выполнение простых арифметических операций, а пятый («трансцендентный») — на сложные алгебраические вычисления. Эта схема была разработана ещё инженерами ATI, но спустя годы стало очевидно, что она неоправданно усложняет чипы, не принося существенного прироста производительности.

В Cayman применяются потоковые процессоры нового типа на базе архитектуры VLIW4, состоящие из четырёх одинаковых вычислительных модулей ALU. При этом сложные операции выполняются тремя из четырёх модулей, что теоретически снижает общую производительность, однако заметно упрощает микросхему и уменьшает её площадь. Зато распределять задачи по одинаковым модулям значительно проще, а значит, и быстрее, в особенности при вычислениях с двойной точностью.

Кроме того, для подъёма производительности в Cayman используется целый ряд новых конструктивных решений. Процессор состоит из 24 SIMD-ядра с 16-ю блоками процессоров по 4 ALU в каждом. Флагман получил сразу 16 текстурных блоков для обработки геометрии и два блока тесселяции уже восьмого поколения. По данным самой AMD, это позволило втрое повысить скорость тесселяции у Radeon HD 6970 по сравнению с предыдущим флагманом HD 5870.

В чипах Cayman также реализован новый алгоритм сглаживания Enhanced Quality Anti-Aliasing (EQAA) и обеспечивающий значительно более высокое качество изображения, чем MSAA при существенно меньшей потери производительности, составляющей не более нескольких процентов.

Наконец, последняя из важнейших новых технологий, появившихся в Cayman, это технология динамического управления рабочими частотами и напряжением графического ускорителя AMD PowerTune. Благодаря датчикам, встроенным во все блоки микросхемы, управляющий модуль постоянно отслеживает нагрузку, температуру и напряжение и при превышении установленных значений снижать частоты и напряжение, предотвращая повреждение чипа. Через утилиту ATI Overdrive можно устанавливать свои предельные значения, но, разумеется, под ответственность пользователя.

Модельный ряд Radeon HD 6000

В линейку AMD/ATI Radeon HD 6000 входят несколько графических карт: HD 6990 (Antilles), HD 6970 (Cayman XT), HD 6950 (Cayman Pro), HD 6870 (Barts XT), HD 6850 (Barts Pro), HD 6790 (Barts LE), HD6770 (Juniper XT), HD 6750 (Juniper Pro), HD 6670 и HD 6570 (Turks) и HD 6450 (Caicos).

К топовым моделям относится двухпроцессорная Radeon HD 6990, базовая HD 6970 и младшая HD 6950. Как обычно, хотя в HD 6990 устанавливаются два чипа HD 6970, их тактовая частота, а также частоты работы памяти, несколько понижены — это сделано для того, чтобы обеспечить разумное энергопотребление и благоприятный температурный режим для этой высокопроизводительной карты, по достоинству считающейся самым мощным в мире десктопным 3D-ускорителем и опережающей такого сильного конкурента, как двухпроцессорный NVIDIA GeForce GTX 590.

В картах применяется система двойных BIOS: одна из микросхем защищена от перезаписи, что позволяет восстановить работоспособность карты в случае неудачных экспериментов. Аппаратный переключатель BIOS расположен рядом с разъёмом CrossFireX.

Основные технические характеристики видеокарты Radeon HD 6990 (в скобках — данные для режима uber mode)

Два графических процессора Cayman (кодовое название Antilles)

3072 универсальных процессора

2 х 96 текстурных и 2 х 32 блока блендинга

Тактовая частота ядра — 830 (880) МГц

Частота видеопамяти, эффективная — 5000 МГц (4 х 1250 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 2 х 2 Гбайта

Шина памяти — 2 х 256 бит

Пропускная способность памяти — 2 х 160 Гбайт/с

Максимальная скорость выборки — 159 (169) Гтекст/с

Максимальная скорость закраски — 53 (56) Гпикс/с

Максимальная производительность — 5099 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, четыре mini DisplayPort

Пиковое энергопотребление — 350 (415) Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 700 долл.

Основные технические характеристики видеокарты Radeon HD 6970

Графический процессор Cayman

1536 универсальных процессоров

96 текстурных и 32 блока блендинга

Тактовая частота ядра — 880 МГц

Частота видеопамяти, эффективная — 5500 МГц (4 х 1375 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 2 Гбайта

Шина памяти — 256 бит

Пропускная способность памяти — 176 Гбайт/с

Максимальная скорость выборки — 84,5 Гтекст/с

Максимальная скорость закраски — 28,2 Гпикс/с

Максимальная производительность — 2703 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, DVI-I Single Link, HDMI, два mini DisplayPort

Пиковое энергопотребление — 250 Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1,

DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 370 долл.

Основные технические характеристики видеокарты Radeon HD 6950

Графический процессор Cayman

1408 универсальных процессоров

88 текстурных и 32 блока блендинга

Тактовая частота ядра — 800 МГц

Частота видеопамяти, эффективная — 5000 МГц (4 х 1250 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 2 Гбайта

Шина памяти — 256 бит

Пропускная способность памяти — 160 Гбайт/с

Максимальная скорость выборки — 70,4 Гтекст/с

Максимальная скорость закраски — 25,6 Гпикс/с

Максимальная производительность — 2253 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, DVI-I Single Link, HDMI, два mini DisplayPort

Пиковое энергопотребление — 200 Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 300 долл.

К самому популярному среднему классу относятся модели Radeon HD 6870 и 6850, которые при вполне доступной цене обеспечивают производительность, достаточную для большинства современных компьютерных игр.

Основные технические характеристики видеокарты Radeon HD 6870

Графический процессор Barts

1120 универсальных процессоров

56 текстурных и 32 блока блендинга

Тактовая частота ядра — 900 МГц

Частота видеопамяти, эффективная — 4200 МГц (4 х 1050 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 1 Гбайт

Шина памяти — 256 бит

Пропускная способность памяти — 134,4 Гбайт/с

Максимальная скорость выборки — 50,4 Гтекст/с

Максимальная скорость закраски — 28,8 Гпикс/с

Максимальная производительность — 2016 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, DVI-I Single Link, HDMI, два mini DisplayPort

Пиковое энергопотребление — 151 Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 240 долл.

Основные технические характеристики видеокарты Radeon HD 6850

Графический процессор Barts

960 универсальных процессоров

48 текстурных и 32 блока блендинга

Тактовая частота ядра — 775 МГц

Частота видеопамяти, эффективная — 4000 МГц (4 х 1000 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 1 Гбайт

Шина памяти — 256 бит

Пропускная способность памяти — 128 Гбайт/с

Максимальная скорость выборки — 37,2 Гтекст/с

Максимальная скорость закраски — 24,8 Гпикс/с

Максимальная производительность — 1488 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, DVI-I Single Link, HDMI, два mini DisplayPort

Пиковое энергопотребление — 127 Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 180 долл.

Карты эконом-класса Radeon HD 6750, 6770, 6790 и «супербюджетники» HD 6670, 6570 и 6450 предназначены для сборки мультимедийных машин, ориентированных на просмотр видео высокой чёткости. При этом ускорители Radeon HD 6770 и HD 6750 предназначены только для поставок OEM-сборщикам и в розничную продажу поступать не будут.

Основные технические характеристики видеокарты Radeon HD 6790

Графический процессор Barts

800 универсальных процессоров

40 текстурных и 16 блоков блендинга

Тактовая частота ядра — 840 МГц

Частота видеопамяти, эффективная — 4200 МГц (4 х 1050 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 1 Гбайт

Шина памяти — 256 бит

Пропускная способность памяти — 134,4 Гбайт/с

Максимальная скорость выборки — 33,6 Гтекст/с

Максимальная скорость закраски — 13,4 Гпикс/с

Максимальная производительность — 1344 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, DVI-I Single Link, HDMI, два mini DisplayPort

Пиковое энергопотребление — 150 Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 150 долл.

Основные технические характеристики видеокарты Radeon HD 6770

Графический процессор Juniper

800 универсальных процессоров

40 текстурных и 16 блоков блендинга

Тактовая частота ядра — 850 МГц

Частота видеопамяти, эффективная — 4800 МГц (4 х 1200 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 512 Мбайт или 1 Гбайт

Шина памяти — 128 бит

Пропускная способность памяти — до 76,8 Гбайт/с

Максимальная скорость выборки — 34 Гтекст/с

Максимальная скорость закраски — 13,6 Гпикс/с

Максимальная производительность — до 1360 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, DVI-I Single Link, HDMI, два mini DisplayPort

Пиковое энергопотребление — 108 Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Основные технические характеристики видеокарты Radeon HD 6750

Графический процессор Juniper

720 универсальных процессоров

36 текстурных и 16 блоков блендинга

Тактовая частота ядра — 850 МГц

Частота видеопамяти, эффективная — 4800 МГц (4 х 1200 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 512 Мбайт или 1 Гбайт

Шина памяти — 128 бит

Пропускная способность памяти — до 73,6 Гбайт/с

Максимальная скорость выборки — 25,2 Гтекст/с

Максимальная скорость закраски — 11,2 Гпикс/с

Максимальная производительность — до 1008 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, DVI-I Single Link, HDMI, два mini DisplayPort

Пиковое энергопотребление — 86 Вт

Двухслотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Ультрабюджетники:

Основные технические характеристики видеокарты Radeon HD 6670

Графический процессор Turks

480 универсальных процессоров

24 текстурных и 8 блоков блендинга

Тактовая частота ядра — 800 МГц

Частота видеопамяти, эффективная — 4000 МГц (4 х 1000 МГц)

Тип видеопамяти — GDDR5

Объём памяти — 512 Мбайт или 1 Гбайт

Шина памяти — 128 бит

Пропускная способность памяти — 64 Гбайт/с

Максимальная скорость выборки — 19,2 Гтекст/с

Максимальная скорость закраски — 6,4 Гпикс/с

Максимальная производительность — 768 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, VGA, DisplayPort

Пиковое энергопотребление — 66 Вт

Однослотовая конструкция

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 100 долл.

Основные технические характеристики видеокарты Radeon HD 6570

Графический процессор Turks

480 универсальных процессоров

24 текстурных и 8 блоков блендинга

Тактовая частота ядра — 650 МГц

Частота видеопамяти, эффективная — 1800 МГц (2 х 900 МГц)/4000 МГц (4 х 1000 МГц)

Тип видеопамяти — DDR3/GDDR5

Объём памяти — 2/1 Гбайт

Шина памяти — 128 бит

Пропускная способность памяти — 28,8/64 Гбайт/с

Максимальная скорость выборки — 15,6 Гтекст/с

Максимальная скорость закраски — 5,2 Гпикс/с

Максимальная производительность — 624 Гфлопс

Интерфейс — PCI Express 2.1 x16

Поддержка CrossFireX

Порты — DVI-I Dual Link, VGA, HDMI

Пиковое энергопотребление — 44/60 Вт

Однослотовая конструкция, низкопрофильная

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 80 долл. (GDDR5)

Основные технические характеристики видеокарты Radeon HD 6450

Графический процессор Caicos

160 универсальных процессоров

8 текстурных и 4 блока блендинга

Тактовая частота ядра — 625-750 МГц

Частота видеопамяти, эффективная — 1066-1600 МГц/3200-3600 МГц

Тип видеопамяти — DDR3/GDDR5

Объём памяти — 512 Мбайт или 1 Гбайт

Шина памяти — 64 бит

Пропускная способность памяти — 8,5-12,8/25,6-28,8 Гбайт/с

Максимальная скорость выборки — 5-6 Гтекст/с

Максимальная скорость закраски — 2,5-3 Гпикс/с

Максимальная производительность — 200-240 Гфлопс

Интерфейс — PCI Express 2.1 x16

Порты — DVI-I Dual Link, VGA, HDMI

Пиковое энергопотребление — 18-27 Вт

Однослотовая конструкция, низкопрофильная

Поддержка DirectX 11, включая шейдеры версии 5.0, OpenGL 4.1, DirectCompute 11 и OpenCL 1.1

Рекомендуемая производителем розничная цена — 55 долл. (GDDR5)

Во второй части этого обзора мы поговорим о некоторых конкретных моделях видеокарт на базе Radeon HD 6000.

К оглавлению