Видеокарта Radeon HD4870 - новый король в классе top-middle. Игровые тесты: World in Conflict

Бытовая техника 07.05.2019
Бытовая техника

После недавнего появления в продаже серии Radeon HD 4000 цены на видеокарты упали; теперь за $250 можно приобрести очень даже солидное игровое решение.

Месяц назад мы обозревали свежую Radeon HD 4850, недорогую видеокарту из новой линейки ATI, и бесповоротно влюбились в неё. После этого Nvidia пересмотрела свои цены - теперь за $250 можно приобрести как Radeon HD 4850, так и GeForce 9800 GTX (раньше за неё просили больше $330).

Впрочем, если вы можете себе позволить потратить немного больше, AMD предлагает Radeon HD 4870 - одноядерную видеокарту с ещё большей производительностью примерно за $380. В той же ценовой категории находятся Radeon HD 3870 X2 и GeForce GTX 260; цены на GeForce 9800 GX2 и GeForce GTX 280 значительно выше.

Сегодня мы рассмотрим видеокарту Visiontek Radeon HD 4870 и сравним её со всеми вышеперечисленными топовыми картами. Как она в смысле отношения цены и производительности?

Характеристики Radeon HD 4870 очень даже впечатляют. GPU состоит из 800 потоковых процессоров (160х5), 40 текстурных модулей и 16 блоков растеризации. Сравните эти параметры с параметрами карты прошлого поколения Radeon HD 3870 - который может похвастать лишь 320 потоковыми процессорами (64х5), 16 текстурными модулями и 16 блоками растеризации - и можете представить себе, как изменились цифры вместе с выпуском новой линейки ATI. Пропускная способность памяти Radeon HD 4870 - 115.2 Гб/сек, а Radeon HD 3870 ограничен 57 Гб/сек.

Этот скачок пропускной способности обусловлен использованием новейшей памяти GDDR5, работающей на частоте 900 МГц (1.8 ГГц х 2 = 3.6 Гбит/сек). Ядро работает на частоте 750 МГц (1.2 ТФлоп), на 125 МГц быстрее ядра HD 4850. Кроме различий в характеристиках памяти и частотах HD 4870 и HD 4850 практически идентичны.

Ядро Radeon HD 4870 построено по 55нм-технологии и включает 256-битную шину памяти. Как и серия HD 3000, серия HD 4000 использует слот PCI-Express 2.0, но совместима и со старыми слотами PCI-Express 1.0. В отличие от послдених карт GeForce, линейка Radeon HD 4000 полностью поддерживает DirectX 10.1, что может очень пригодится в дальнейшем. Radeon HD 4870 будет поставляться как с 512, так и с 1024 Мб памяти на борту; наш сегодняшний образец экипирован памятью GDDR5 объёмом 512 Мб.

Видеокарта

Ранний выход на рынок может сыграть с картой от Visiontek шутку - она очень похожа (конечно, для нас, тестеров) на референсную карту от самой AMD. Единственное видимое отличие - лейбл Visiontek на кулере. В любом случае, видеокарта выглядит впечатляюще, особенно выделяется система охлаждения, занимающая два слота.

Как и ядро Radeon HD 3870, ядро нового Radeon HD 4870 произведено по 55нм-технологии. Несмотря на это, ATI не сильно старалась загнать частоты - ядро работает на 750 МГц. Память GDDR5 работает на более впечатляющей частоте - 3.6 ГГц (1.8 ГГц х2) (на этой конкретной модели). Как мы уже упоминали выше, Radeon HD 4870 несёт на себе 800 потоковых процессоров наряду с 40 текстурными модулями и 16 блоками растеризации. Суммируя, можно смело говорить, что это выдающиеся характеристики для видеокарты стоимостью $350-380.

Visiontek поставляет свои Radeon HD 4870 с памятью Qimonda IC на борту (IDGV51-05A1F1C-40X). Эти модули GDDR5 стабильно работают на 4.0ГГц (2.0ГГц x2), так что дальнейший разгон должен быть сравнительно лёгким.

Дизайн Visiontek Radeon HD 4870 подразумевает систему охлаждения на два слота. Большое преимущество такого решения - очень тихий кулер. Но есть и минусы, прямо следующие из плюсов: в режиме простоя карта нагревается до 74 градусов, что не радует, а под нагрузкой температура поднялась почти до 82 градусов.

О габаритах. Radeon HD 4870 всего на полсантиметра длиннее своего собрата Radeon HD 4850; итого - 24 см (9.5 дюймов). Как и другие карты своего сегмента, Radeon HD 4870 нуждается в двух 6-пиновых коннекторах питания.

Карта от Visiontek также поддерживает HDMI и 7.1-канальный звук с помощью идущего в комплекте переходника; на самой карте можно заметить два двусвязных порта DVI и выход S-Video. Также в комплект поставки входит переходник DVI-VGA, компонентный кабель для HDTV и мост для использования Crossfire.

Тесты: Концифгурация тестового стенда и 3Dmark

Конфигурация тестового стенда
- Intel Core 2 Quad Q6600 @ 3.00ГГц (LGA775)
- x2 Kingston HyperX 2Гб PC2-8500
- ASUS P5Q Deluxe (Intel P45)
- OCZ GameXStream (700 Вт)
- Seagate 500GB 7200-об/мин (Serial ATA300)
- ASUS GeForce GTX 280 (1Гб) - 177.41
- Gigabyte GeForce GTX 260 (896Мб) - 177.41
- ASUS GeForce 9800 GX2 (1Гб) - 174.74
- ASUS GeForce 9800 GTX+ (512Мб) - 174.74
- ASUS GeForce 9800 GTX (512Мб) - 174.74
- Visiontek Radeon HD 4870 (512Мб) - 8.7
- ASUS Radeon HD 4850 (512Мб) - 8.7
- VisionTek Radeon HD 3870 X2 (1Гб) - 8.7
Программное обеспечение
- Microsoft Windows Vista Ultimate (64-битная)
- Intel System Driver 8.4.0.1016
- Nvidia Forceware 177.34
- Nvidia Forceware 174.74
- Nvidia Forceware 169.44
- ATI Catalyst 8.7

Основываясь на результатах 3DMark Vantage, можно предположить, что Visiontek Radeon HD 4870 будет немного обгонять GeForce GTX 260 в наших следующих тестах, ну а GeForce GTX 280 будет гораздо быстрее его.

Но мы уверены, что на самом деле именно так чётко дело не пойдёт, так что давайте уже начнём тестирование в реальных игровых приложениях.

Тесты: Company of Heroes

Visiontek Radeon HD 4870 в Company of Heroes не выглядит так уж впечатляюще - он приходит предпоследним из всех протестированных 8-ми карт и обгоняет лишь Radeon HD 4850. С другой стороны, в разрешении 1920х1200 он всего на 1 fps медленнее GeForce 9800 GTX (которая, впрочем, в 1680х1050 отрывается на все 5 fps).

А вот включение настроек 8xAA/16xAF (сглаживание и анизотропная фильтрация) помогает Visiontek Radeon HD 4870 подняться в воздух - тут она оказывается третьей. Как видно из этого и предыдущих тестов, Company Of Heroes очень симпатизирует картам от Nvidia, по крайней мере, в режиме DirectX 10.

Тесты: Crysis

В Crysis Visiontek Radeon HD 4870 снова не особо показывает себя, хотя и догоняет конкурента в лице GeForce GTX 260, оставляя при этом немного позади GeForce 9800 GTX+.

В режиме DirectX 10 Crysis-результаты остаются примерно такими же: Visiontek Radeon HD 4870 идёт вровень с GeForce GTX 260.

Тесты: Devil May Cry 4

В нашем тесте в игре Devil May Cry 4 Visiontek Radeon HD 4870 превосходит GeForce GTX 260. Карта от ATI располагается между GeForce GTX 260 и 280, оставляя Radeon HD 4850 далеко позади.

Включение 8xAA в Devil May Cry 4 почти не влияет на результаты Visiontek Radeon HD 4870 (то же самое можно сказать и о Radeon HD 4850). HD 4870 побеждает более дорогую GeForce GTX 280 в разрешениях 1440х900 и 1680х1050, совсем чуть-чуть уступая в 1920х1200.

Тесты: Enemy Territory: Quake Wars

Если игры Company of Heroes и Crysis отдают предпочтение картам от Nvidia, то Enemy Territory: Quake Wars дружелюбнее относится к ATI-решениям. С выключенными антиальязингом и фильтрацией Visiontek Radeon HD 4870 здесь - быстрее всех с небольшим отрывом. Что ж, посмотрим что будет, если включить эти опции…

Включение 8xAA/16xAF позволяет Visiontek Radeon HD 4870 ещё больше увеличить отрыв от GeForce GTX 280 - карта от ATI становится без сомнений самой быстрой во всех трёх разрешениях экрана. Кстати, в этом тесте Radeon HD 4850 оставляет позади GeForce GTX 260.

Тесты: Supreme Commander

Visiontek Radeon HD 4870 в Supreme Commander ведёт себя хорошо и идёт в ногу с GeForce GTX 280 в разрешениях 1920x1200 и 1680x1050.

С 8xAA Radeon HD 4870 немного отстаёт от GeForce GTX 280 в высоких разрешениях. Впрочем, видеокарта от Visiontek всё ещё быстрее GeForce GTX 260 во всех разрешениях.

Тесты: Unreal Tournament 3

В Unreal Tournament 3 Visiontek Radeon HD 4870 снова показывает себя с лучшей стороны. Хоть обе карты GeForce GTX и лидируют в разрешении 1440х900, в разрешениях повыше карты Radeon в этой не такой уж свежей игре почти догоняют их.

Включение сглаживания и анизотропной фильтрации в Unreal Tournament 3 не помогает Visiontek Radeon HD 4870 лучше противостоять картам GeForce GTX. Хоть показатели и довольно высоки, Unreal Tournament 3 определённо больше симпатизирует картам нового поколения от Nvidia.

Тесты: World in Conflict

Radeon HD 4870 в тесте World in Conflict подбирается к GeForce GTX 260 довольно близко, но обогнать её без включённых сглаживания и анизотропии Radeon"у не по силам.

Включенные опции 4xAA/16xAF позволяют Visiontek Radeon HD 4870 превзойти GeForce GTX 260 в разрешении 1920x1200, хоть в 1440x900 и 1680x1050 дела обстоят по-прежнему.

Энергопотребление и нагрев

Visiontek Radeon HD 4870, не сравнить с ранее протестированным нами HD 4850, очень охоча до электроэнергии и в режиме простоя потребляет 193 Вт (эта цифра - общее энергопотребление системы). Как результат, в этом режиме даже GeForce GTX 280 оказывается предпочтительнее.

Под нагрузкой же Visiontek Radeon HD 4870, наоборот, более скромен и потребляет гораздо меньше, чем GeForce GTX 280, GTX 260, 9800 GX2 и Radeon HD 3870 X2.

Нагревается Visiontek Radeon HD 4870 просто ужасно: даже температура в режиме простоя ниже 74 градусов не опускается. Хотя под нагрузкой большой (80мм) кулер и смог удержать карту в пределах 82 градусов, мы такое положение вещей нормальным назвать никак не можем.

Хотя никаких проблем из-за такого сильного нагрева мы и не испытали, нужно отметить, что более медленная Radeon HD 4850 греется ещё сильнее. Это легко объяснить тем, что её кулер занимает один слот, а HD 4870 использует два.

Мы экспериментировали и выяснили: если на Visiontek Radeon HD 4870 установить кулер Arctic-Cooling S1, температура под нагрузкой упадёт до 49 градусов, а в режиме простоя - и вовсе до гораздо более приемлемых 33. Другими словами, докупить к вашему новому Radeon из серии HD 4000 кулер стороннего производителя - неплохая идея, если вы хотите максимально уменьшить общую температуру в корпусе компьютера.

Итоговые размышления

Visiontek Radeon HD 4870 очень схожа с референсной картой AMD, так что её трудно отличить от других карт на базе Radeon HD 4870, выпущенных до 25 июня. В любом случае, эта видеокарта не разочаровывает и предлагает за свои $350-380 просто превосходную скорость.

По такой же цене вы совершенно точно не найдёте ничего лучше новой карты из серии HD 4000. Хоть Nvidia и подкорректровала свои цены довольно быстро, нужно быть благодарными ATI за то, что она выпустила на рынок такую убедительную линейку. Radeon HD 4850 всё ещё остаётся лучшим выбором для экономных пользователей, ну а если вы можете потратить немного больше - Radeon HD 4870 полностью окупит ваши ожидания и средства.

Как было и в тесте Radeon HD 4850, возникли проблемы с референсной системой охлаждения, используемой в Radeon HD 4870. Хоть он и относительно тихо работает, свежий Radeon нагревался до каких-то экстремальных температур. После установки кулера Arctic-Cooling S1 температура в режиме простоя упала с 74 градусов до 33. Температура под нагрузкой также значительно снизилась - до 52 градусов.

Кстати, мы проинформированы, что некоторые покупатели, использую сторонне ПО вроде RivaTuner, смогли установить фиксированную скорость оборотов референсного кулера. К сожалению, уже на половине своих возможностей этот вентилятор становится слишком громким.

Кроме того, со стандартным кулером и автоматической настройкой его скорости нам совсем не удался разгон. Впрочем, используя Arctic-Cooling S1 и RivaTuner мы запросто подняли частоту ядра и памяти до 835 МГц и 4.2 ГГц (2.1 ГГц х2) соответственно.

Очень надеемся, что Visiontek намерена представить решение с кулером получше, как она уже делала со своим разогнанным Radeon HD 3870 X2. Кроме того, несмотря на графическое оформление коробки с видеокартой в стиле игры Mass Effect, производитель саму игру (и вообще какую-либо игру или игры) в комплекте не поставляет. Ну хоть пожизненная гарантия Visiontek здесь есть.

Итак, если очень горячая видеокарта для вас проблемой не является, Visiontek Radeon HD 4870 будет наилучшей покупкой за свои деньги.

Технические характеристики Radeon HD 4870 X2 представлены в сравнении с вышерассмотренными видеокартами в следующей таблице:

Наименование технических характеристик NVIDIA
GeForce 8800
GTX
ATi Radeon
HD 4870
ATi Radeon
HD 4870 X2
NVIDIA
GeForce GTX
280
Графический(е) процессор(ы) G80 (TSMC) RV770 (TSMC) 2 x RV770 (TSMC) GT200 (TSMC)
Техпроцесс, нм 90 (low-k) 55 (low-k) 55 (low-k) 65 (low-k)
Площадь ядра(ер), кв.мм 484 256 2 x 256 576
Число транзисторов, млн. 681 956 2 x 956 1 400
Частота(ы) графического(их)
процессора(ов), МГц
575
(1350 shader)
750 750 602
(1 296 shader)
Эффективная частота работы
видеопамяти, МГц
1 800 3 600 3 600 2 214
Объем памяти, Мбайт 768 512 / 1024 2 x 1024 1 024
Тип поддерживаемой памяти GDDR3 GDDR5 GDDR5 GDDR3
Разрядность шины обмена с памятью, Бит 384 256 256 512
Интерфейс PCI-Express x16
(v2.0)
PCI-Express x16
(v2.0)
PCI-Express x16
(v2.0)
PCI-Express x16
(v2.0)
Число унифицированных шейдерных
процессоров, шт.
128 800 2 x 800 240
Число текстурных блоков, шт. 32 40 2 x 40 80
Число блоков растеризации (ROPs), шт. 24 16 2 x 16 32
Поддержка версии Pixel Shaders / Vertex
Shaders
4.0 / 4.0 4.1 / 4.1 4.1 / 4.1 4.0 / 4.0
Полоса пропускания видеопамяти,
Гбайт/сек
~86.4 ~115.0 2 x 115.0 ~141.7

закраски, Гпикс./сек
~13.8 ~12.0 2 x 12.0 ~19.3
Теоретическая максимальная скорость
выборки текстур, Гтекс./сек
~38.7 ~30.0 2 x 30.0 ~48.2
Пиковая потребляемая мощность в 3D
режиме работы, Ватт
~177 ~170 ~286
Требования к мощности блока питания,
Ватт
~450 ~500 ~550 ~550
Размеры видеокарты референсного
дизайна, мм (Д х В х Т)
269 x 99 x 38 244 х 99 х 34 269 х 99 х 37 269 х 99 х 40
Выходы 2 х DVI-I (Dual-Link), TV-Out, HDTV-Out, HDCP
Дополнительно поддержка SLI поддержка
CrossFireX
поддержка
CrossFireX
поддержка SLI
(3-Way SLI)
Рекомендованная стоимость, долларов
США
~599* ~299 ~549 ~449

* - установлена осенью 2006 года.

Измерение уровня шума систем референсных систем охлаждения видеокарт проводилось электронным шумомером CENTER-321 по хорошо знакомой постоянным посетителям нашего сайта методике с расстояний в 3 см (от турбины), в 1 и в 3 метра от системного блока. Уровень шума, комфортный по субъективным ощущениям, составляет ~34.5 дБА и отмечен на диаграмме голубой штриховой полосой. Фоновый уровень шума системного блока, измеренный с расстояния в 1 метр, не превышал отметку в 33.5 дБА.

Если анализировать результаты измерения уровня шума референсных систем охлаждения видеокарт в самом актуальном, на мой взгляд, режиме с расстояния в 1 метр, то комфортным можно признать только работу кулера видеокарты Radeon HD 4870 и GeForce GTX 280 в автоматическом режиме работы. С большим натягом можно терпеть шум турбины Radeon HD 4870 на ~2280 об/мин. Во всех остальных случаях никакого удовольствия находиться рядом с системных блоком, в котором установлены столь шумно функционирующие видеокарты, нет.

Измерение энергопотребления видеокарт осуществлялось с помощью многофункциональной панели Zalman ZM-MFC2. Данная панель измеряет потребление системы в целом (без учёта монитора), а не отдельного компонента системного блока (подробная конфигурация указана в следующем разделе). Измерение было проведено в 2D-режиме, при обычной работе в Word или Internet-серфинге, а также в 3D-режиме, нагрузка в котором создавалась с помощью пятикратного бенчмарка Firefly Forest из синтетического графического бенчмарка 3DMark 2006 в разрешении 1920 х 1200 с активированным полноэкранным сглаживанием степени 4х и анизотропной фильтрацией уровня 16х. Столь ресурсоемкий для видеокарт графический режим выбран в целях минимизации влияния на результаты измерений прочих компонентов системного блока (в первую очередь, конечно же, центрального процессора).

Результаты измерения энергопотребления рассмотренных видеокарт представлены вашему вниманию на следующей диаграмме:

Безусловно, разогнанная система с Radeon HD 4870 X2 впечатляет уровнем энергопотребления, примерно на 100 Ватт превышающим оный у системы с установленной GeForce GTX 280 и на 160 ватт у системы с одиночной Radeon HD 4870. Однако, качественного блока питания мощностью в 550 Ватт, для такой конфигурации вполне должно хватить. Не будем забывать, что свою лепту здесь вносит и разогнанный с существенным повышением напряжения до 4.33 ГГц центральный процессор и прочие, далеко не рядовые компоненты системного блока. Кроме того, обращает на себя внимание очень низкий уровень энергопотребления GeForce GTX 280 в 2D-режиме. Налицо грамотно реализованные в графическом процессоре G200 системы энергосбережения, чем пока не может похвастаться Radeon HD 4870 X2.

4. Тестовая конфигурация, инструментарий и методика тестирования, видеокарты для сравнения

Сначала об аппаратной части. Тестирование всех видеокарт было проведено в закрытом корпусе системного блока следующей конфигурации:

  • Материнская плата: Gigabyte GA-X38-DQ6 (Intel X38), LGA 775, BIOS F9f beta;
  • Процессор: Intel Core 2 Duo E8400, 3.0 ГГц, 1.3125 В, L2 6 Мбайт, FSB: 333 МГц x 4, (Wolfdale, C0);
  • Система охлаждения CPU: Thermalright SI-128 SE (Scythe SlipStream 120, ~860 об/мин);
  • Термоинтерфейс: Arctic Silver 5;
  • Оперативная память:
    • 2 x 1024 Мбайт DDR2 Corsair Dominator TWIN2X2048-9136C5D (Spec: 1 142 МГц / 5-5-5-18 / 2.1 В);
    • 2 x 1024 Мбайт DDR2 CSX DIABLO CSXO-XAC-1200-2GB-KIT (Spec: 1 200 МГц / 5-5-5-16 / 2.4 В);
  • Дисковая подсистема: SATA-II 300 Гбайт, Western Digital VelociRaptor, 10 000 об/мин, 16 Мбайт, NCQ;
  • Система охлаждения и звукоизоляции HDD: Scythe Quiet Drive for 3.5" HDD;
  • Привод: SATA-II DVD RAM & DVD±R/RW & CD±RW Samsung SH-S183L;
  • Корпус: ATX ASUS ASCOT 6AR2-B Black&Silver (на вдув и выдув установлены 120-мм корпусные вентиляторы Scythe Slip Stream на ~900 об/мин на силиконовых шпильках, на боковой стенке – такой же вентилятор на ~900 об/мин);
  • Панель управления и мониторинга: Zalman ZM-MFC2;
  • Блок питания: Enermax Galaxy DXX (EGA1000EWL) 1000 Ватт (штатные вентиляторы: 135-мм на вдув, 80-мм на выдув).
  • Монитор: 24" BenQ FP241W (Wide LCD, 1920 x 1200 / 60 Гц).

В целях снижения процессорозависимости тестируемых сегодня видеокарт, двухъядерный процессор был разогнан до 4.33 ГГц при напряжении в 1.55 В:

Оперативная память во время тестов функционировала на частоте , с пониженными с таймингами 5-4-4-12 (Perfomance Level = 9) при напряжении в 2.10 В.

Теперь о программной части. В связи с тем, что в некоторых играх в Windows Vista x64 SP1 видеокарта Radeon HD 4870 X2 , все тесты были проведены в операционной системе Windows Vista Ultimate Edition x86 SP1 (новая "чистая" установка). Дата начала проведения тестов – 26.08.2008, поэтому были использованы следующие доступные на тот момент драйверы:

  • чипсет материнской платы Intel Chipset Drivers – 9.1.0.1002 beta ;
  • библиотеки DirectX 9.0с, дата релиза – август 2008 года ;
  • драйверы видеокарт на графических процессорах ATi – (8.53.0);
  • драйверы видеокарт на графических процессорах NVIDIA – ForceWare 177.92 (29/08/08, Beta);
  • драйвер ускорения физики – PhysX 8.08.18 (26/08/08, WHQL).

Настройки качества графики в драйверах выставлены на "High Quality". Таким образом, все оптимизации, доступные в драйверах ForceWare и Catalyst, были отключены. По многочисленным просьбам, не влияющий на скорость Catalyst A.I. оставлен без изменений в положении "Standart". Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. В случае, если изменение данных настроек в самих играх не реализовано по каким-то причинам, то параметры юстировались в панелях управления драйверов ForceWare и Catalyst. Сглаживание прозрачных поверхностей (текстур) "Adaptive Antialiasing (multi-sampling)" для ATi Catalyst и "Transparency antialiasing (multi-sampling)" для NVIDIA ForceWare активировано.

Производительность видеокарт оценивалась в трёх разрешениях: 1280 x 1024, 1680 х 1050 и 1920/1900 х 1200, в следующем наборе приложений, состоящем из двух синтетических бенчмарков и восьми игр разных жанров:

  • 3DMark 2006 (Direct3D 9/10) – build 1.1.0, default settings и 1920 х 1200 + AF16x + AA4x;
  • 3DMark Vantage (Direct3D 10) – v1.0.1, профили “Perfomance” и "Extreme" (тестировались только основные тесты);
  • S.T.A.L.K.E.R.: Shadow of Chernobyl (Direct3D 9) – версия игры 1.006, включено полное динамическое освещение, анизотропная фильтрация x16 и прочие максимальные настройки качества графики, использовалась демо-запись “ixbt3” (тройной цикл теста);
  • World in Conflict (Direct3D 10) – версия игры 1.0.0.9(b89), профиль качества графики “Very High”, но UI texture quality = Compressed; Water reflection size = 512; DirectX 10 рендеринг активирован;
  • Enemy Territory: Quake Wars (OpenGL 2.0) – версия игры 1.5, максимальные настройки графики, демо “d5” на уровне "Salvage" Finland;
  • Call of Duty 4: Modern Warfare MP (Direct3D 9) – версия игры 1.7.568, настройки графики и текстур выставлены на уровень "Extra", демо "d3" на уровне “Bog”, методика тестирования подробно изложена ;
  • Unreal Tournament 3 (Direct3D 9) – версия игры 1.3, максимальные настройки графики в игре (5-й уровень), Motion Blur и Hardware Physics активированы, тестировалась “Fly By”-сцена на уровне “DM-ShangriLa” (два цикла), использовался бенчмарк HardwareOC UT3 Bench v1.3.0.0;
  • Crysis (Direct3D 10) – версия игры 1.2.1, профиль настроек “High”, двукратный цикл теста видеокарты из бенчмарка HardwareOC Crysis Bench v1.3.0.0;
  • Devil May Cry 4 (Direct3D 10) – версия игры 1.0, максимальные настройки качества графики (" "), за результат принималось среднее значение двойного последовательного прогона второй сцены бенчмарка ().
  • S.T.A.L.K.E.R.: Clear Sky (Direct3D 10) – версия игры 1.004, включено улучшенное полное освещение DX10, анизотропная фильтрация x16 и прочие максимальные настройки качества графики (подробнее – в разделе с результатами тестов), использовалась собственная демо-запись "s1" (тройной цикл теста).

Наконец, перейдём к результатам тестов и их анализу.

HIS RADEON HD 4870 512MB PCI-E

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max - по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max - по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос , с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться .

К сожалению, на настоящий момент утилита RivaTuner (автор А.Николайчук AKA Unwinder) не поддерживает новую серию, и потому мониторинга нет.

Комплектация.

Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами, переходник-адаптер DVI-to-VGA, мост CrossFire, DVI-to-HMDI адаптер, адаптер компонентного вывода (TV-out), а также разветвители внешнего питания. Далее мы покажем, что предлагается к карте дополнительно.

Упаковки.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra на чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 8.6; Nvidia версии 175.16 (9ххх серия) и 177.34 (GTX 2xx).

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка .
  • RightMark3D 2.0 с кратким описанием: ,

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 4870 HD4870 )
  • RADEON HD 4850 со стандартными параметрами (далее HD4850 )
  • RADEON HD 3870 X2 со стандартными параметрами (далее HD3870X2 )
  • RADEON HD 3870 со стандартными параметрами (далее HD3870 )
  • Nvidia Geforce GTX 260 со стандартными параметрами (далее GTX260 )
  • Nvidia Geforce 9800 GTX со стандартными параметрами (далее GF9800GTX )

Для сравнения результатов новой видеокарты RADEON HD 4870, были выбраны именно эти модели видеокарт по следующим причинам: с RADEON HD 3870 X2 её будет интересно сравнить, как с двухчиповым решением компании AMD на GPU предыдущей архитектуры, чтобы оценить влияние улучшений архитектуры и разницу в производительности. Сравнительная производительность RADEON HD 4850 интересна для того, чтобы узнать вклад повышенных частот GPU и применения нового типа памяти GDDR5. Geforce 9800 GTX хоть и не является прямым конкурентом, но интересен, как прыдущее поколение чипов Nvidia, да и цена HD 4870 не так далека от его ускоренной версии GTX+. А Geforce GTX 260 выступает уже как прямой конкурент RADEON HD 4870, это сравнение и будет главной битвой.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Ничего нового и интересного, всё соответствует разнице в частотах. Как обычно, видеокарты не достигают теоретических значений. Результаты синтетики не дотягивают до теории, ближе всего к ним подходит HD 3870, основанная на RV670. Но для всех новых видеокарт Nvidia и AMD, в данном тесте теоретический максимум не достигается. RV770 в нашем тесте выбирает около 26-27 текселей за один такт из 32-битных текстур при билинейной фильтрации, не дотягивая до 40 теоретических. У карт Nvidia эффективность даже ещё ниже — 35-37 текселей за такт при теоретических 64.

Что касается сравнения HD 4870 с прямым конкурентом GTX 260, то они весьма близки в этом тесте, а вот до Geforce 9800 GTX обе не дотягивают. Новая карта AMD значительно опережает старую, и обгоняет младшую модель линейки HD 4800 в соответствии с частотами. Интересно, что в тесте с одной текстурой HD 4870 немного отстаёт от HD 3870, это связано с теоретически большей производительностью блоков ROP у последнего при 32-битном фреймбуфере без антиалиасинга. В случае же с большим количеством текстур на пиксель, способности блоков ROP не мешают показывать более высокие результаты карте на основе RV770. Посмотрим на результаты в тесте филлрейта:

Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0 и 1 накладываемыми текстурами у RADEON HD 4870 получается всё тот же чуть более низкий результат, чем у HD 3870, что обусловлено рабочей частотой блоков ROP. Но, как и на предыдущей диаграмме, в ситуациях с большим количеством текстур на пиксель, новая видеоплата выходит вперёд.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:

Все современные чипы основаны на унифицированных архитектурах, их универсальные исполнительные блоки в этом тесте заняты только геометрической работой, и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Результаты это и показывают — RV670 и RV770 весьма близки при сходных частотах. Результаты решений AMD традиционно более высокие, чем у карт Nvidia. RADEON HD 4870 в этом тесте выигрывает и у обеих карт Nvidia, и у своих собратьев. Так как мы убрали из рассмотрения промежуточные тесты на скорость обработки геометрии с одним источником освещения, то переходим к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:

В этом варианте разница между решениями AMD и Nvidia видна лучше, разрыв немного увеличился, видеоплаты производства второй компании «просели». HD 4870 и HD 3870 примерно равны на схожих частотах, они снова ограничены чем-то вроде triangle setup, так как цифры почти не изменились с прошлого теста.

Снова все видеокарты AMD опережают и Geforce 9800 GTX и GTX 260. В реальных приложениях универсальные шейдерные процессоры заняты в основном пиксельными расчетами, к исследованию производительности которых мы и переходим.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.

Хоть тесты слишком просты для современных архитектур и не показывают их истинную силу, их интересно смотреть при смене архитектур. В простых тестах производительность ограничена скоростью текстурных выборок, а в чипе RV770 производительность текстурирования как раз улучшена. Это позволило добиться победы по всем фронтам, HD 4870 опережает обе карты Nvidia во всех рассмотренных задачах и быстрее HD 3870 иногда до двух раз.

В более сложных тестах RADEON HD 4870 также показывает отличные результаты, значительно опережая и предшественника и конкурентов. А вот Geforce GTX 260 из-за меньшей скорости текстурирования не впечатляет, немного выигрывая у 9800 GTX лишь в двух самых сложных тестах. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:

Великолепный результат для RADEON HD 4870! В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, новая модель значительно обгоняет обе карты Nvidia, а разница с HD 3870 просто поразительна.

Второй тест интенсивнее загружает вычислительные блоки, и он лучше подходит для архитектур AMD, обладающих большим количеством потоковых процессоров. В нём новое решение AMD снова показывает лучший результат, быстрее и Geforce GTX 260 и 9800 GTX в 1.5-2 раза! И снова, по сравнению с предыдущим поколением, новая плата ускорилась более чем в два раза. Разница с HD 4850 соответствует разнице в частотах GPU.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это математические тесты, зависящие от частоты шейдерных блоков и скорости текстурирования, тут важен баланс чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок, поэтому старые RADEON показывают самый слабый результат. А вот новые… Смотрите сами, они заметно быстрее предыдущего. А рассматриваемый сегодня HD 4870 вовсе опережает и Geforce 9800 GTX и GTX 260.

Во втором тесте «Parallax Mapping», новинки от AMD ещё сильнее. Если HD 4850 показывает результат чуть выше GTX 260, то HD 4870 значительно опережает обе модели от Nvidia. Улучшения в TMU значительно усилили результаты линейки HD 4800, в этих тестах они стали новыми лидерами. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там результаты могут получиться даже более интересными:

Результаты RADEON HD 4850 и Geforce 9800 GTX весьма близки, но HD 4870 ожидаемо обходит обоих за счёт более высокой частоты чипа. Взаимное положение карт немного изменилось, заметен упор в скорость текстурных блоков. И обе карты на RV770 обгоняют предыдущий одночиповый топ в два и более раза. А вот GTX 260 показал в этом случае весьма слабые результаты, отстав даже от предшественника.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье
  • Fur — процедурный шейдер, визуализирующий мех

Новая архитектура компании AMD в этих тестах показывает себя с лучшей стороны, в отличие от предыдущих решений, которые проигрывали картам Nvidia. HD 4870 с большим запасом опережает всех соперников, разница с HD 3870 просто огромна. Да и Geforce 9800 GTX с Geforce GTX 260 остаются далеко позади.

Снова мы видим отличные результаты переработанной архитектуры AMD в наших DirectX 9 тестах. Но что получится в DX10, ведь в прошлых исследованиях там дела были явно похуже. Сейчас узнаем, сравнив уже с двухчиповой картой предыдущего поколения, так как с одночиповыми RV670 всё давно понятно…

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Как мы и ожидали, в Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок ничего особенно не изменилось — всё такое же огромное преимущество решений Nvidia над AMD. Посмотрим, что будет дальше, этот тест карты AMD всегда проваливают.

Хотя HD 4870 и проиграл обеим картам Nvidia, относительно младшей модели линейки он показал преимущество, соответствующее разности частот. Да и двухчиповый RADEON HD 3870 X2 обогнал новое решение HD 4870 только в тяжелом режиме. Очень хороший результат, если не смотреть на цифры Nvidia. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, в этот раз подавляющее преимущество карт Nvidia также никуда не делось, хотя новые видеокарты AMD уже явно ближе к Geforce 9800 GTX. В остальном, с увеличением сложности шейдера и нагрузки на видеочип, разница между HD 4870 и двухчиповым HD 3870 X2 почти та же, они близки друг к другу.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Повторяется взаимное расположение карт из предыдущего теста. Хотя решения AMD были сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга они не могут справиться с нашей задачей на уровне видеокарт Geforce, ещё и включение самозатенения вызывает на продукции AMD слишком большое падение производительности. Рассматриваемый нами сегодня RADEON HD 4870 отстаёт от обеих видеокарт Geforce и очень близок к двухчиповому HD 3870 X2. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростью разных видеокарт уже другая, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD улучшают свои показатели относительно решений Nvidia. И новые HD 4800 хотя и продолжают отставать от Geforce, но HD 4870 близок к HD 3870 X2 и почти догнал хотя бы Geforce 9800 GTX. До прямого конкурента GTX 260 ему далеко, конечно же.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

При анализе результатов наших синтетических тестов, мы всегда отмечаем, что в вычислительно сложных задачах современные архитектуры AMD показывают себя лучше конкурирующих от Nvidia. Вот и сейчас в Mineral HD 4870 просто разорвал конкурентов. Топовая видеокарта на основе одного чипа RV770 обгоняет карту прошлого поколения на двух RV670, что близко к разнице в количестве и частоте потоковых процессоров. Также новая видеокарта почти в два раза опережает и прямого конкурента Geforce GTX 260, не говоря про Geforce 9800 GTX.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В данном тесте скорость рендеринга ограничена исключительно производительностью шейдерных блоков, и тест очень хорошо подходит архитектурам AMD, что хорошо заметно после исправления ошибки в драйверах AMD. Что тут можно сказать… Полный разгром решений Nvidia. Вдумайтесь, RADEON HD 4870 более чем в два раза быстрее Geforce GTX 260 и быстрее двухчипового HD 3870 X2. Потрясающий результат, в вычислениях RV770 явно сильнейший GPU вообще. Кстати, соотношение скоростей между HD 4870 и HD 4850 точно соответствует разнице в частотах.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и ПСП и филлрейтом.

Ну очень интересно получилось, крайне плотные результаты у двухчиповой HD 3870 X2, новой HD 4870 и конкурента GTX 260. Да и в паре HD 4850 с Geforce 9800 GTX очень тесно. Интересно… Возможно, при переносе части вычислений в геометрический шейдер ситуация будет ещё интереснее, посмотрим:

Но нет, разница между рассмотренными вариантами теста невелика, существенных изменений не произошло. Разве что двухчиповый HD 3870 X2 вышел в явные лидеры по достигнутой частоте кадров. Ему проще, алгоритм многочипового рендеринга AFR прощает многое. Видеокарты Nvidia показывают идентичные результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты некоторых видеоплат AMD немного выросли. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз скорость RADEON 4850 и HD 4870 больше, чем у двухчипового решения на GPU предыдущей архитектуры, но все карты производства AMD отстают от всех решений Nvidia, хотя HD 4870 близок к ним.

Похоже, что на результаты новых карт повлияли улучшенные возможности текстурирования. Впрочем, цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

В этот раз «провалился» только Geforce 9800 GTX, все остальные архитектуры выдержали удар. И в RV770, и в GT200 были сделаны некоторые оптимизации, направленные на улучшение исполнения геометрических шейдеров. И RADEON HD 4870 теперь догнал Geforce GTX 260, кроме самого простого режима. Предыдущее поколение чипов AMD значительно хуже показывает себя в этом тесте, даже двухчиповая видеокарта отстаёт.

Что касается сравнения результатов в разных режимах, тут всё как всегда, видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а старые видеокарты Nvidia теряют в производительности. Карта Geforce на основе чипа G92 может конкурировать только за счёт скорости в «Balanced» режиме, которая почти равна скорости в «Heavy» у RADEON HD 4850. При этом, получаемая в разных режимах картинка не отличается визуально.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Судя по предыдущим исследованиям, на результаты этого теста влияет не только скорость текстурирования, но и производительность ROP и пропускная способность памяти, и чем проще режим, тем большее влияние на скорость они оказывают. Во всех режимах, кроме простого, лидером является топовая модель серии HD 4800, которую мы сегодня рассматриваем. В простом влияет ПСП, да и многочиповый рендеринг показывает себя неплохо. GTX 260 показывает результат лишь на уровне HD 4850. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, но текстурирование влияет на скорость уже сильнее, что видно по паре Geforce. HD 4870 сдала позиции и не является лидером, хотя отстаёт в сложных режимах от Geforce 9800 GTX совсем чуть-чуть. В простом же лидирует GTX 260 с большой ПСП. Интересно, что с ростом сложности геометрии и разница между HD 4870 и HD 3870 X2 изменяется.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Второй тест этого раздела под названием «Waves» благосклоннее к продукции AMD, новая модель семейства RADEON HD 4800 смотрится очень хорошо, на уровне двухчипового предшественника. И также обгоняет видеокарты Nvidia, кроме самого простого, где GTX 260 чуть-чуть впереди. Похоже, что в таких условиях эффективность TMU у RV770 выше, чем у GPU производства Nvidia. Рассмотрим второй вариант этого же теста:

И снова видим совсем мало нового, хотя с увеличением сложности теста результаты видеоплат AMD относительно скорости карт Nvidia улучшились, последние потеряли несколько больше от изменения условий тестирования. В самом лёгком режиме впереди HD 3870 X2 и HD 4870, в остальных двухчиповому HD 3870 X2 нет равных. Ну а среди одночиповых карт лучшим является герой обзора, он опережает своего младшего брата HD 4850 соответственно разнице в частотах. Карты Nvidia остались в этот раз позади.

3DMark Vantage: Feature тесты

В обзор RADEON HD 4870 мы решили включить и синтетические тесты из 3DMark Vantage. Пакет новый, его feature тесты довольно интересны и отличаются от наших. Вероятно, при анализе результатов карт в этом пакете мы сделаем для себя какие-то новые и полезные выводы.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Соотношение результатов в целом схоже с тем, что показывают наши тесты, используются условия, в которых карты Nvidia не получают дополнительного преимущества от большого количества TMU. Старая одночиповая карта AMD сильно отстаёт от всех, зато и двухчиповый HD 3870 X2 и новая модель HD 4870 значительно обгоняют оба решения производства Nvidia. Geforce GTX 260 отстаёт от Geforce 9800 GTX, как и должно быть по теории. Но вот почему карта на основе RV770 обгоняет и G92 и GT200? Видимо, дело в той самой эффективности текстурных модулей, которая выше у карт AMD.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR рендеринг, поэтому такой тест очень своевременен.

Показания этого теста соответствуют тому, что мы получаем в своих синтетических тестах, с учетом того, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. Поэтому все цифры в два раза меньше наших.

Эти цифры скорее показывают не только производительность ROP, но и величину пропускной способности памяти (в случае мультичипов — умноженную на число чипов для AFR). Цифры соответствуют теоретическим и зависят, прежде всего, от ширины шины памяти и её частоты. В данном тесте новая модель HD 4870, пользуясь улучшенными возможностями блоков ROP и большой ПСП GDDR5 памяти, показывает лучший результат, выше, чем у двухчиповой HD 3870 X2 и GTX 260 с 448-битной шиной памяти.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест интересен тем, что он не зависит только от шейдерной мощности, эффективности исполнения ветвлений и скорости текстурных выборок, а от всего сразу. То есть, для достижения высокой скорости важен баланс чипа и карты. И больше всего важна эффективность выполнения ветвлений в шейдерах, так называемая гранулярность исполнения.

Старые карты от обоих производителей далеко позади, даже двухчиповый HD 3870 X2 не смог догнать HD 4870, хотя двухчиповый рендеринг этого теста весьма эффективен. И вот тут мы видим интересное расположение RADEON HD 4870 и Geforce GTX 260. Несмотря на то, что в тестах текстурных выборок и математических вычислений решение AMD обычно выигрывало, в тесте POM Geforce сильнее RADEON. И виновата в этом именно лучшая эффективность обработки ветвлений в шейдерах у GT200.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров, и скорость stream out.

В данном тесте традиционно получаются странные результаты у двухчиповых карт, HD 3870 X2 не получает ускорения от своего второго GPU. В остальном, снова видим отставание решений AMD, даже относительно быстрая HD 4870 не дотягивается до Geforce 9800 GTX, не говоря про GTX260. Похоже, что скорость не зависит от шейдерной производительности, а зависит от скорости stream out…

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Тут мы видим почти то же самое, что и в предыдущем случае, только отстал Geforce 9800 GTX, а карты AMD подтянулись повыше. Но всё равно, лидером остаётся Geforce GTX 260, близко к нему следует сегодняшний герой HD 4870. Двухчиповая карта AMD снова не ушла далеко от старой одночиповой и обе расположились в конце списка. И снова предположим, что на скорость влияет производительность stream out, ПСП и текстурная производительность одновременно.

Feature Test 6: Perlin Noise

Этот feature тест можно считать математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он очень сложен математически.

Последний feature тест в Vantage показывает чистую математическую производительность видеочипов. Показанная в нём производительность вполне соответствует тому, что мы видим в наших математических тестах из RightMark 2.0. Видеокарты AMD закономерно выигрывают у своих конкурентов от Nvidia, даже двухчиповый HD 3870 X2 опережает GTX 260. Ну а RADEON HD 4870 является лидером и опережает своего главного конкурента более чем на 25%.

Выводы по синтетическим тестам

На основе результатов проведённых синтетических тестов, мы подтверждаем выводы, сделанные в предыдущей статье. Новые решения компании AMD получились весьма удачными, в чипе RV770 было сделано много изменений, почти во всех синтетических тестах оно в разы опережает по скорости видеокарты предыдущего поколения. Благодаря улучшенной архитектуре RV770, в которой исправили главные недостатки, во многих тестах RADEON HD 4870 обгоняет своего основного конкурента Geforce GTX 260. RV770 стал более эффективным и сбалансированным, что важно для современных и будущих 3D приложений с большим количеством сложных шейдеров.

Чип RV770 обладает большим количеством исполнительных блоков, поддерживает новую память GDDR5, которая позволила выпустить RADEON HD 4870 с высокой ПСП на основе лишь 256-битной шины обмена с памятью. Небольшие вопросы возникают разве что по поводу меньшей эффективности исполнения ветвлений в шейдерных программах, что сказывается на производительности наиболее сложных алгоритмов parallax mapping. Ну и по скорости stream out новые решения AMD уступают конкурирующим от Nvidia. Всё остальное у новой линейки HD 4800 просто отлично! Особенно вычислительная производительность, по которой они далеко впереди.

Следующая часть статьи содержит тесты нового решения компании AMD и других видеокарт в современных игровых приложениях. Игровые результаты должны подтвердить наши выводы. Можно предположить, что в среднем скорость HD 4870 в играх будет примерно на одном уровне с Geforce GTX 260.

Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией

Лидерство в Hi-End классе графических ускорителей для компаний, их выпускающих, является вопросом престижа. Несмотря на сравнительно низкий спрос самые быстрые видеокарты, стоимость которых в последние два-три года практически всегда выше отметки в 600, а то и в 700 долларов США, именно они являются своеобразным ориентиром для большинства пользователей, в той или иной степени интересующихся играми. Именно видеокарты данного класса демонстрируют своего рода эталонную производительность в современных играх. И если продукты на графических процессорах от ATi или от NVIDIA занимают этот "трон", то и сама компания считается лидером в определённый период времени, что безусловно сказывается на росте продаж видеокарт всех ценовых сегментов и повышении рейтинга производителя.

На мой взгляд, с момента появления на рынке NVIDIA GeForce 8800 GTX/Ultra и включительно до выхода линейки GeForce GTX 260/280, лидерство в топовом классе видеокарт принадлежало как раз компании NVIDIA. Со своей стороны, компания ATi (а в последствии и AMD) предпринимала попытку вернуть себе первое место, выпустив двухчиповую Radeon HD 3870 X2. Однако, в полной мере сделать этого так и не удалось: проблемы с драйверами, уже порядком набивший оскомину безальтернативный для ATi AFR-режим рендеринга, присутствие на рынке GeForce 9800 GX2, да и новый GPU от NVIDIA G200, подоспевший очень быстро, не позволили HD 3870 X2 завоевать себе славу самой быстрой видеокарты.

Тем не менее, выпустив безусловно удачные видеокарты среднего класса Radeon HD 4850 и HD 4870, графическое подразделение ATi, теперь принадлежащее компании AMD, 12 августа 2008 года анонсирует двухчиповую видеокарту класса Hi-EndRadeon HD 4870 X2 с рекомендованной стоимостью в 549 долларов США и с явными претензиями на абсолютное лидерство. Немногим позже на рынке должна появиться и её младшая сестра – Radeon HD 4850 X2 с рекомендованной стоимостью до 400 долларов США, которую мы в последствии также изучим и протестируем. Ну а сегодня представляем вашему вниманию обзор и "проверку на скорость" Radeon HD 4870 X2, выпущенной под лейблом компании Hightech Information System Limited (HIS).

1. Обзор HIS Radeon HD 4870 X2 2х1 Гбайт

Стиль оформления и размеры коробки, в которой поставляется HIS Radeon HD 4870 X2, не изменился в сравнении с ранее рассмотренными нами Radeon HD 4850 и HD 4870 от этого же производителя. Разве что цветовая гамма теперь преимущественно зелёная:

На лицевой стороне коробки можно обнаружить информацию о модели видеокарты, её интерфейсе, объёме и типе установленной видеопамяти. Оборотная же сторона пестрит строками спецификаций платы, описанием системных требований, а также сведениями об особенностях графических технологий, заложенных в GPU. Здесь же приведены награды печатных и электронных изданий (коих уже более 600), полученных продуктами HIS. Производится видеокарта в Китае.

Внутри красочной картонной коробки находится ещё одна, теперь уже из толстого белого картона, а в ней пластиковая оболочка с отсеками под видеокарту и аксессуары комплекта поставки. В числе последних можно обнаружить следующие компоненты:

Перечислю их слева направо и сверху вниз:

  • переходник с S-Video выхода на компонентный кабель;
  • один переходник с DVI на HDTV;
  • один переходник 15 pin DVI / D-Sub;
  • адаптер-разветвитель DVI-to-HDMI;
  • гибкий соединительный мостик для CrossFire;
  • компакт-диск с драйверами видеокарты и фирменной утилитой для разгона;
  • инструкция пользователя;
  • голографическая наклейка HIS;
  • купон на бесплатное скачивание игр серии Half-Life 2.

В отдельной коробочке находится фирменная универсальная отвёртка-уровень-фонарик от HIS – незаменимая для оверклокера вещь ;) .

Размеры видеокарты составляют 269 х 109 х 37 мм, но в принципе они уже вряд ли кого смущают, так как линейка GeForce GTX 260/280, да и Radeon HD 3870 X2 ничуть не меньше. Удивление вызывает вес видеокарты (более полутора килограмм). Пожалуй, это самый тяжёлый графический ускоритель в истории. Если так пойдёт и дальше, то скоро с использованием backplate мы с вами будем крепить не только процессорные кулеры, но и видеокарты ;) .

Практически вся лицевая сторона HIS Radeon HD 4870 X2 закрыта системой охлаждения:

Конечно же, перед нами референсный дизайн видеокарты и PCB и вряд ли в ближайшей перспективе мы с вами увидим нереференсные Radeon HD 4870 X2. О принадлежности продукта к компании HIS можно судить разве что по наклейке на турбине системы охлаждения, да по идентификационным стикерам на оборотной стороне видеокарты:

Как вы видите, на задней части PCB также установлена алюминиевая пластина, являющаяся своеобразным радиатором для микросхем памяти видеокарты, расположенным на оборотной стороне платы.

HIS Radeon HD 4870 X2 оснащена PCI-Express x16 интерфейсом версии 2.0, двумя портами DVI-I (dual-link) с поддержкой высоких разрешений, а также S-Video выходом, совмещёнными с решёткой для выброса нагретого воздуха из корпуса системного блока:

В верхней части платы можно обнаружить два разъёма для подключения дополнительного питания – шести- и восьмипиновый, интерфейс для CrossFireX, а также игольчатый радиатор на микросхемах видеопамяти с лицевой стороны PCB:

Силовая часть платы выглядит следующим образом:

Требования по питанию Radeon HD 4870 X2 могут отпугнуть владельцев не слишком мощных блоков питания, так как пиковая потребляемая мощность данной видеокарты может достигать 260 Ватт, для чего требуется блок питания мощностью не менее 550 Ватт. Если подключить к видеокарте два шестипиновых разъёма, то она не стартует, ругаясь на неправильно поданное питание. Для системы с двумя видеокартами Radeon HD 4870 X2 необходимо блок питания мощностью не менее 750~800 Ватт.

Посмотрим на Radeon HD 4870 X2 без системы охлаждения:

Особо интересна центральная часть лицевой стороны платы, где уместились два графических процессора и чип-коммутатор:

Хорошо видно, что оба GPU повернуты по направлению к чипу, а микросхемы памяти установлены по двум сторонам от процессоров с оборотной и с лицевой сторон PCB.

На Radeon HD 4870 X2 установлены два графических процессора RV770, идентичных по функциональности тем, что устанавливаются на обычные Radeon HD 4870:

Оба GPU выпущены на Тайване на 27 неделе 2008 года и не имеют защитных крышек. Площадь каждого из кристаллов составляет 256 кв.мм., а число транзисторов около 956 млн. Каждый из графических процессоров оснащён 800 унифицированными шейдерными процессорами, 40 текстурными блоками и 16 блоками растеризации. Частоты работы обоих GPU в 3D-режиме одинаковы и составляют 750 МГц. Что интересно, по данным мониторинга, полученным с помощью утилиты GPU-Z и последней версии RivaTuner, в 2D-режиме до 500 МГц снижается частота только одного графического процессора из двух, а второй продолжает функционировать на полных 750 МГц. Возможно, в новых драйверах Catalyst или и вовсе в "свежих" версиях BIOS для Radeon HD 4870 X2 эта довольно странная особенность будет исправлена.

В отличие от Radeon HD 3870 X2, новая видеокарта оснащена чипом-коммутатором PEX8647 от компании PLX Technology :

Данная микросхема, второго поколения, обладает возможностью организации прямого обмена данными между двумя графическими процессорами и теперь с поддержкой вдвое большей пропускной способности, нежели микросхема, устанавливаемая на Radeon HD 3870 X2 (PEX85 47). Кроме того, в Radeon HD 4870 X2 появился канал передачи данных, именуемый как "Sideport", с пропускной способностью в 5 Гбайт в секунду. Однако, в настоящее время он отключён в драйверах Catalyst (либо ещё и вовсе не реализован разработчиками драйверов).

На каждый из графических процессоров приходится по восемь микросхем памяти стандарта GDDR5 суммарным объемом в 1 Гбайт. Таким образом, хоть и общий, но разделяемый, объём памяти видеокарты составляет 2 Гбайта. На HIS Radeon HD 4870 X2 установлены микросхемы производства компании Hynix:

Маркировка чипов - H5GQ1H24MJR-T0C, а их номинальное время доступа равно 1.0 нс при теоретической эффективной пропускной способности для стандарта GDDR5 равной 4000 МГц. Между тем, видеопамять HIS Radeon HD 4870 X2 функционирует на частоте в 3600 МГц, что полностью соответствует спецификациям Radeon HD 4870 X2 и HD 4870.

Вот что показывает утилита GPU-Z по первому и второму графическому процессору видеокарты:

Теперь о системе охлаждения видеокарты. Референсный кулер Radeon HD 4870 X2 фактически состоит из двух половинок: алюминиевой пластины с термопрокладками с оборотной стороны платы, и, собственно, основной системы охлаждения с лицевой стороны PCB:

Последняя состоит из металлического радиатора (судя по весу это не алюминий), выкрашенного в чёрный цвет, с установленной на нём турбиной, и двух медный радиаторов, предназначенных для охлаждения графических процессоров:

Сверху вся конструкция закрыта пластиковым кожухом, который служит своеобразным воздуховодом.

Радиаторы графических процессоров не блещут техническими изысками и представляют собой донельзя простой прямоугольник с толстым медным основанием в ~5 мм, и тонких медных рёбер высотой в ~25 мм:

Ровное и хорошо отполированное основание радиаторов контактирует с поверхностью кристалла GPU посредством густой серой термопасты.

Оба радиатора охлаждаются одной выпущенной в Китае турбиной, производства компании NTK Technologies Inc :

Модель турбины CF1275-B30H-C005, и, судя по данным на наклейке, потребляет она до 12 Ватт электроэнергии. Скорость вращения турбины регулируется автоматически в зависимости от температуры графического чипа в диапазоне от ~1150 до ~2900 об/мин (по данным мониторинга). Турбину не слышно только на её минимальной скорости вращения (примерно до ~1300 об/мин включительно). Жаль, конечно, но это плата за высокую скорость видеокарты.

Проверим температурный режим видеокарты. Методика тестирования заключалась в десятикратном прогоне бенчмарка Firefly Forest из синтетического графического бенчмарка 3DMark 2006 в разрешении 1920 х 1200 с активированным полноэкранным сглаживанием степени 4х и анизотропной фильтрацией уровня 16х. Все тесты проводились в закрытом корпусе ASUS Ascot 6AR2-B системного блока (конфигурацию вентиляторов в нём вы можете найти ниже в разделе с методикой тестирования):

Комнатная температура во время тестирования была равна 22 градусам Цельсия. Мониторинг частоты и температуры видеокарты осуществлялся с помощью RivaTuner v2.10 (автор - Алексей Николайчук AKA ). В связи с тем, что видеокарта разбиралась до проведения тестов, то стандартный термоинтерфейс на GPU был заменён на высокоэффективную термопасту Arctic Silver 5, нанесённую тончайшим слоем на оба графических процессора.

Посмотрим на температурный режим Radeon HD 4870 X2 при автоматической работе турбины системы охлаждения:

На графиках мониторинга приведена температура самого горячего GPU видеокарты. Второй процессор, по всей видимости расположенный ближе к турбине, прогревается только до 67 градусов Цельсия. Такая разница между температурами объясняется довольно просто, так как второму медному радиатору достается уже порядком нагретый воздух от ближнего к турбине радиатора GPU. Тем не менее, на мой взгляд, для топовой видеокарты температура в 91 градус Цельсия в пике нагрузки не является чем-то экстраординарным. А вот элементы цепей питания видеокарты прогреваются до 110 градусов Цельсия, что хоть и укладывается в допустимый предел, но, субъективно, с психологической точки зрения несколько настораживает.

Теперь о разгоне видеокарты. Так как альтернативной системой охлаждения для Radeon HD 4870 X2 мы пока не располагаем, то проверка оверклокерского потенциала видеокарты проводилась с использованием референсного кулера в его автоматическом режиме работы (на момент подготовки материала программного обеспечения для ручного управления скоростью вращения турбины видеокарты не было). Разгон видеокарты осуществлялся с помощью утилиты AMD GPU Clock Tool версии . Нам на тестирование было предоставлено сразу же две таких видеокарты от HIS. Первая из них без потери в стабильности и в качестве картинки смогла стабильно функционировать на частотах в 800/3800 МГц, а на второй удалось достичь частот в 820/3800 МГц (+9.3/+5.6 %):

Что интересно, температура самого горячего ядра видеокарты возросла только на 1 градус Цельсия, но произошло это, скорее всего, ввиду того, что турбина системы охлаждения раскрутилась на ~150 об/мин сильнее, чем в номинальном режиме работы видеокарты:

Об уровне шума турбины мы поговорим в разделе с результатами его измерения.

BIOS видеокарты HIS Radeon HD 4870 X2 2х1 Гбайт вы можете скачать из файлового архива (WinRAR архив, 46.2 Кбайт). Рекомендованная стоимость на новинку составляет 549 долларов США.

Всего пару недель тому назад в мире nVidia всё было тихо и спокойно. Крупнейший производитель видеокарт только что выпустил новые модели GeForce GTX 260 и 280 , которые, несмотря на задержку в шесть месяцев, дальше продвинули унифицированную архитектуру, введённую с GeForce 8, до самых пределов 65-нм техпроцесса с гигантским количеством транзисторов. Производительность по сравнению с предыдущим (теперь уже старым) поколением видеокарт не особо впечатляла (прирост 59% в среднем относительно 9800 GTX), но появление приложений CUDA стало интересным шагом вперёд, да и реального конкурента у nVidia не было. Между тем AMD, казалось, всё больше разочаровывалась в графическом подразделении, которое было не способно конкурировать на high-end сегменте рынка, как когда-то, а существующие high-end видеокарты быстро устаревали. Затем последовал громкий выпуск видеокарты Radeon HD 4850 , которая появилась в тестовых лабораториях раньше анонса, а розничная цена была заявлена на уровне $199.


Да, в лагере AMD случилось чудо. Производительность Radeon HD 4850 удивила всех, включая nVidia. Несмотря на поспешный выпуск видеокарты GeForce 9800 GTX+, которая не появится в розничных каналах раньше середины июля, nVidia всё равно не могла получить такое же великолепное соотношение цена/производительность, как у новинки Radeon, что мы уже демонстрировали в тестах Radeon HD 4850 . Обычно маркетинговые доводы, такие как оптимизация эффективности и выход годных кристаллов, всегда звучавшие неубедительно, получили новое значение, учитывая результаты тестов Radeon HD 4850. Новинка пробудила надежды на ещё более высокую производительность в будущем. Получив (наверное, даже к собственному удивлению) хорошую возможность увеличить число потоковых процессоров с 320 до 800, несмотря на 43% повышение числа транзисторов и прежний техпроцесс, AMD решила не оставаться "на дне", и к лучшему. Был объявлен GPU Radeon HD 4870, основанный на такой же архитектуре, но обеспечивающий более высокую производительность (понятно, что по большей цене), однако появлялся он в тестовых лабораториях весьма неспешно, да и не всё было понятно до последнего момента. По крайней мере, на бумаге эта видеокарта являлась прямым конкурентом новым high-end моделям nVidia, но по существенно меньшей цене. Но что мы получили на деле?

Долгое время nVidia была пионером по внедрению новейших технологий памяти. После использования памяти DDR для GeForce в 2000 году, компания из Санта-Клары оказалась первой, представившей память GDDR2 с видеокартой GeForce FX, затем GDDR3 с моделью GeForce 5700. Но затем лидерство перехватила ATI: GDDR4 впервые появилась вместе с моделью Radeon X1950 XT, а сегодня, два года спустя, ATI представила первую видеокарту с памятью GDDR5: Radeon HD 4870.

С повышением пропускной способности памяти всё понятно: есть два пути. Первый заключается в расширении шины памяти, а второй - в увеличении частоты работы. Первый способ имеет несколько препятствий. Более широкую шину сложно разводить на печатной плате, да и упаковка требует больше контактов. Все эти контакты необходимо подвести к чипу, которому необходимо большее число интерконнектов по периферии кристалла. Поэтому широкая шина требует, чтобы ядро было определённого размера - именно по этой причине долгое время GPU начального уровня были ограничены 128-битной шиной, в то время как их high-end варианты использовали 256- или 384-битную шину. Ещё один недостаток заключается в увеличении энергопотребления чипа.

Поэтому к подобному способу прибегали очень осмотрительно. На самом деле, долгое время для high-end GPU использовалась 128-битная шина, от Riva 128 до Matrox Parhelia, да и ATI Radeon 9700 четыре года назад тоже её использовал. Точно так же 256-битная шина не становилась шире до появления nVidia GeForce 8800 в конце 2006 года. Да, требования по пропускной способности памяти у GPU постоянно увеличиваются, несмотря на технологии экономии пропускной способности, которые оптимизируются с каждым поколением.

Второе решение заключается в ускорении работы памяти. Но это легче сказать, чем сделать, поскольку, как и в случае с любой микросхемой, существует ограничение по тактовой частоте, на которой могут работать чипы памяти. Чтобы обойти эти ограничения, производители прибегают к разным ухищрениям. Память DDR позволяет передавать данные по нарастанию и спаду тактового импульса, удваивая эффективную пропускную способность памяти для прежней частоты. Для этого память DDR использует так называемый двухбитовый prefetch - при каждом обращении к памяти вместо передачи одного бита из prefetch-буферов, память DDR передаёт два. Последующие разработки технологии DDR предусматривали передачу всё большего числа данных на прежней физической частоте памяти, увеличивая ширину prefetch. DDR2 использует 4-битовый prefetch, как и GDDR3. С GDDR4 появился 8-битовый prefetch.

GDDR5

GDDR5 использует 8-битовый prefetch, как и GDDR4, однако отличается несколькими инновациями. Впервые GDDR5 использует две тактовые частоты, CK и WCK, последняя в два раза больше первой. Команды передаются в режиме SDR (стандартная тактовая частота) на частоте CK; адресная информация передаётся в режиме DDR на частоте CK; а данные передаются в режиме DDR на частоте WCK. В случае Radeon HD 4870, который использует память GDDR5 на частоте 900 МГц, команды передаются на частоте 900 МГц SDR, адреса на 900 МГц DDR (эффективная частота 1 800 МГц), а данные - на 1 800 МГц DDR (эффективная частота 3 600 МГц).

Этот подход снижает проблемы, связанные с качеством сигнала во время передачи команд и адресов, обеспечивая очень высокие частоты передачи данных. К сожалению, более высокие частоты также означают более высокую вероятность ошибки. Поэтому, чтобы обеспечить надёжную передачу данных, GDDR5 использует механизм обнаружения ошибок, который применяется в сетях. Если контроллер памяти определит ошибку, то команда, с которой она появилась, будет выполнена повторно.

Итак, AMD и nVidia выбрали весьма разные пути для увеличения пропускной способности памяти для своих GPU, и эти выборы связаны с разным взглядом на графические процессоры. nVidia, приверженная принципу огромного монолитного кристалла, может себе позволить 512-битовую шину памяти, избегая проблем с поставкой чипов, которой неизбежно сопровождается внедрение передовой технологии памяти. Напротив, с появлением RV770 AMD концентрирует свои усилия на GPU со сниженным размером кристалла для high-end видеокарт. Как нам сообщили инженеры AMD, первую версию RV770 предполагалась оснастить не более 480 потоковыми процессорами (АЛУ), но GPU при этом ограничивал число интерконнектов для интерфейсов памяти.

Поэтому AMD смогла предложить GPU, с которым все уже знакомы, с 800 потоковыми процессорами, которые почти что "бесплатны" в отношении площади ядра. У предыдущего поколения GPU nVidia пришлось забыть о 384-битовой шине при переходе с G80 (80 нм) на G92 (65 нм). Поэтому есть все шансы, что такой же шаг произойдёт и с 512-битовой шиной. Однако на этот раз nVidia может опереться на GDDR5, чтобы компенсировать потерю пропускной способности.



СОДЕРЖАНИЕ


Рекомендуем почитать

Наверх