Sandy bridge какое поколение. Intel Sandy Bridge: в новый год с новой процессорной микроархитектурой

Авто 21.10.2019
Авто

В начале января компания Intel официально представила процессоры семейства Intel Core второго поколения, известные под кодовым наименованием Sandy Bridge, а также чипсеты Intel 6-й серии для них.

Новые процессоры семейства Intel Core второго поколения (2 nd Generation Intel Core Processor Family), известные также под кодовым наименованием Sandy Bridge, без преувеличения можно назвать одним из наиболее долгожданных продуктов. Без сомнения, они станут самыми популярными процессорами в 2011 году. Компания AMD готовит свой ответ в виде процессоров на базе новой микроархитектуры Bulldozer, но, во-первых, пока не понятно, когда эти процессоры появятся, а во-вторых, уже сейчас можно утверждать, что они не смогут конкурировать с процессорами Sandy Bridge ни по производительности, ни по соотношению «цена/производительность». Вообще, забегая вперед, отметим, что новые процессоры Intel получились настолько удачными, что продукция конкурентов в сравнении с ними просто меркнет.

О новой процессорной микроархитектуре Sandy Bridge мы уже подробно рассказывали на страницах нашего журнала, поэтому в данной статье не станем повторяться, а ознакомим читателей с модельным рядом новых процессоров и чипсетов, а также расскажем об их разгонных возможностях и результатах тестирования их производительности.

Прежде всего напомним, что процессоры Intel Core второго поколения, как и процессоры Intel Core первого поколения, составят три семейства: Intel Core i7, Core i5 и Core i3. Чтобы отличать процессоры Intel Core второго поколения от процессоров первого поколения, изменена система их маркировки. Если процессоры первого поколения маркировались трехзначным числом (например, Intel Core i5-650), то процессоры второго поколения маркируются четырехзначным числом, причем первая цифра - 2 - указывает на второе поколение.

Итак, всего компания Intel одновременно анонсировала 29 новых моделей процессоров семейства Sandy Bridge для настольных ПК и ноутбуков, а также десять новых чипсетов. Среди 29 новых моделей процессоров 15 моделей - это мобильные процессоры, а остальные 14 моделей предназначены для настольных компьютеров. Среди десяти новых чипсетов пять ориентированы на ноутбуки, а остальные пять - на ПК.

Прежде чем более детально ознакомиться с модельным рядом мобильных и десктопных процессоров Sandy Bridge, приведем общие сведения о них.

Особенности процессоров Sandy Bridge

Все процессоры Sandy Bridge первоначально будут производиться по 32-нм техпроцессу. В дальнейшем, когда состоится переход на 22-нм техпроцесс, процессоры на базе микроархитектуры Sandy Bridge получат кодовое на-именование Ivy Bridge.

Отличительной особенностью всех процессоров Sandy Bridge станет наличие в них интегрированного графического ядра нового поколения (Intel HD Graphics 2000/3000). Причем если в процессорах предыдущего поколения (Clarkdale и Arrandale) вычислительные ядра процессора и графическое ядро размещались на разных кристаллах и, более того, производились по разным техпроцессам, то в процессорах Sandy Bridge все компоненты процессора изготавливаются по 32-нм техпроцессу и располагаются на одном кристалле.

Важно подчеркнуть, что идеологически графическое ядро процессора Sandy Bridge можно рассматривать как пятое ядро процессора (в случае четырехъядерных процессоров). Причем графическое ядро, так же как и вычислительные ядра процессора, имеет доступ к кэшу L3.

Точно так же, как и процессоры предыдущего поколения (Clarkdale и Arrandale), процессоры Sandy Bridge будут иметь интегрированный интерфейс PCI Express 2.0 для использования дискретных видеокарт. Причем все процессоры поддерживают 16 линий PCI Express 2.0, которые могут быть сгруппированы либо как один порт PCI Express x16, либо как два порта PCI Express x8.

Также нужно отметить, что все процессоры Sandy Bridge будут иметь интегрированный двухканальный контроллер памяти DDR3. Выпуск вариантов с трехканальным контроллером памяти пока не планируется.

Еще одна особенность процессоров на базе микроархитектуры Sandy Bridge заключается в том, что вместо шины QPI (Intel QuickPath Interconnect), которая раньше использовалась для связи отдельных компонентов процессора друг с другом, теперь применяется принципиально иной интерфейс, называемый кольцевой шиной (Ring Bus).

Архитектура процессора Sandy Bridge вообще подразумевает модульную, легко масштабируемую структуру.

Еще одна особенность микроархитектуры Sandy Bridge заключается в том, что в ней реализована поддержка набора инструкций Intel AVX (Intel Advanced Vector Extension).

Intel AVX представляет собой новый набор расширений для архитектуры Intel, предусматривающий 256-битные векторные вычисления с плавающей запятой на базе SIMD (Single Instruction, Multiple Data).

Говоря о процессорной микроархитектуре Sandy Bridge, нужно отметить, что она является развитием микроархитектуры Nehalem или Intel Core (поскольку сама микроархитектура Nehalem является развитием микроархитектуры Intel Core). Различия между Nehalem и Sandy Bridge довольно существенные, но всё же назвать эту микроархитектуру принципиально новой, какой в свое время была микроархитектура Intel Core, нельзя. Это именно модифицированная микроархитектура Nehalem.

Модельный ряд мобильных процессоров Intel Core второго поколения

В семействе мобильных процессоров было представлено 15 моделей: десять моделей семейства Core i7, четыре модели семейства Core i5 и одна модель - Core i3.

В семействе мобильных процессоров присутствуют как четырех­, так и двухъядерные модели. Причем все мобильные процессоры имеют встроенное графическое ядро Intel HD Graphics 3000 и поддерживают режим Hyper-Threading. Разница между отдельными моделями заключается в энергопотреблении, штатной тактовой частоте и максимальной частоте в режиме Turbo Boost, размере кэша L3, частоте поддерживаемой памяти, частоте графического ядра в штатном режиме и в режиме Turbo Boost.

Так, из десяти моделей в семействе Core i7 пять являются четырехъядерными (в обозначении четырехъядерных процессов присутствует буква Q или X). Причем одна модель - Intel Core i7-2920XM - относится к серии Extreme Edition. Это топовая и самая дорогая модель в сегменте мобильных процессоров. Вряд ли производители будут в массовом порядке выпус­кать ноутбуки на процессоре Core i7-2920XM, поскольку его стоимость превышает 1000 долл. Скорее всего, на нем будут основаны только эксклюзивные модели ноутбуков под заказ.

Следующая по стоимости и по производительности модель процессора - Core i7-2820QM. Ее отличие от модели Core i7-2920XM заключается лишь в том, что в ней штатная тактовая частота на две ступени ниже (в процессорах Sandy Bridge частота системной шины составляет 100 МГц, соответственно одна ступень изменения тактовой частоты равна 100 МГц). Так, для процессора Core i7-2920XM штатная тактовая частота равна 2,5 ГГц, а для модели Core i7-2820QM - 2,3 ГГц. В режиме Turbo Boost максимальная частота процессора Core i7-2920XM может равняться 3,5 ГГц, а процессора Core i7-2820QM - 3,4 ГГц. Еще одно различие между процессорами Core i7-2920XM и Core i7-2820QM заключается в том, что TDP модели Core i7-2920XM составляет 55 Вт, а модели Core i7-2820QM - 45 Вт. Все остальные характеристики процессоров Core i7-2920XM и Core i7-2820QM совпадают. Это четырехъядерные модели с L3-кэшем 8 Мбайт. Обе модели поддерживают память DDR3-1600 и имеют графический контроллер Intel HD Graphics 3000 с частотой 650 МГц в штатном режиме и 1300 МГц в режиме Turbo Boost.

Как видите, процессоры Core i7-2920XM и Core i7-2820QM по своим характеристикам, в том числе по производительности, мало чем отличаются друг от друга. А вот по стоимости - почти в два раза. Именно поэтому мы предполагаем, что именно модель Core i7-2820QM будет топовым решением, а Core i7-2920XM останется неким эксклюзивом, который, скорее всего, продаваться не будет.

Все остальные четырехъядерные модели мобильных процессоров (Core i7-2720QM, i7-2635QM, i7-2630QM) наделены L3-кэшем 6 Мбайт. Модель Core i7-2720QM поддерживает память DDR3-1600, а остальные процессоры - память DDR3-1333. Модели i7-2635QM и i7-2630QM вообще практически не отличаются друг от друга - разница лишь в максимальной частоте графического ядра в режиме Turbo Boost. Однако, на наш взгляд, обращать внимание на характеристики интегрированного графического ядра в случае четырехъядерных моделей процессоров вообще не имеет смысла, поскольку ноутбуки на базе таких мощных процессоров без дискретной графики вряд ли будут выпускаться (это было бы просто нелогично).

Теперь рассмотрим двухъядерные модели мобильных процессоров Sandy Bridge. Все двухъядерные модели семейства Core i7 имеют кэш L3 размером 4 Мбайт и поддерживают память DDR3-1333. Собственно, разница между отдельными двухъядерными моделями процессоров семейства Core i7 заключается в их энергопотреблении (различное значение TDP), штатной тактовой частоте и максимальной тактовой частоте ядер процессора и графического ядра в режиме Turbo Boost.

Двухъядерные модели мобильных процессоров семейства Core i5 (всего их четыре) имеют кэш L3 размером уже 3 Мбайт. Все эти процессоры поддерживают память DDR3-1333 и отличаются друг от друга энергопотреблением, штатной тактовой частотой и максимальной тактовой частотой ядер процессора и графического ядра в режиме Turbo Boost.

Как уже отмечалось, младшее семейство процессоров Core i3 представлено всего одной моделью - Core i3-2310M. Отличительной особенностью процессоров семейства Core i3 является то обстоятельство, что они не поддерживают режим Turbo Boost для ядер процессора (режим Turbo Boost поддерживается для графического ядра). Во всем остальном эти процессоры схожи с моделями семейства Core i5. Так, в модели Core i3-2310M размер кэша L3 составляет 3 Мбайт и он поддерживает память DDR3-1333.

Технические характеристики мобильных процессоров Sandy Bridge представлены в табл. 1 .

Модельный ряд десктопных процессоров Intel Core второго поколения

Модельный ряд десктопных процессоров Sandy Bridge также представлен тремя семействами: Core i7, Core i5 и Core i3.

Все десктопные процессоры семейства Core i7 являются четырехъядерными, поддерживают режим Hyper-Threading и память DDR3-1333 и имеют кэш L3 размером 8 Мбайт. Собственно, в настоящее время семейство Core i7 представлено всего одной моделью, но в трех вариантах: Core i7-2600K, Core i7-2600 и Core i7-2600S. Базовая модель - Core i7-2600. Этот четырехъядерный процессор имеет TDP 95 Вт и базовую тактовую частоту 3,4 ГГц. Максимальная тактовая частота в режиме Turbo Boost составляет 3,8 ГГц. Процессор Core i7-2600 имеет встроенное графическое ядро Intel HD Graphics 2000 с максимальной тактовой частотой до 1350 МГц в режиме Turbo Boost.

Модель Core i7-2600K отличается от Core i7-2600 прежде всего тем, что она разблокирована. Все процессоры с буквой «К» в маркировке имеют разблокированный коэффициент умножения и ориентированы на разгон. О разгонных особенностях десктопных процессоров Sandy Bridge мы еще расскажем, а пока заметим, что процессор Core i7-2600K имеет интегрированное графическое ядро Intel HD Graphics 3000 с максимальной тактовой частотой до 1350 МГц в режиме Turbo Boost.

Вообще, нужно отметить, что если во всех мобильных процессорах интегрировано графическое ядро Intel HD Graphics 3000, то в десктопных процессорах может быть интегрировано графическое ядро как Intel HD Graphics 3000, так и Intel HD Graphics 2000. Во всех разблокированных процессорах (с буквой «К» в маркировке) интегрировано графическое ядро Intel HD Graphics 3000, а во всех остальных процессорах - ядро Intel HD Graphics 2000. Различия между ядрами Intel HD Graphics 3000 и 2000 мы еще обсудим, но, забегая вперед, скажем, что ядро Intel HD Graphics 3000 более производительное и решение интегрировать более производительное графическое ядро в разблокированные процессоры кажется нам абсолютно нелогичным. Дело в том, что разгон процессоров возможен только на материнских платах на базе чипсета Intel P67 Express. Но именно эти платы как раз не поддерживают встроенного в процессор графического ядра (то есть в платах на базе чипсета Intel P67 Express нет возможности воспользоваться встроенным графическим ядром). Использовать интегрированное графическое ядро можно только на платах с чипсетом Intel H67 Express, однако они не позволяют осуществлять разгон ядер процессора (об особенностях чипсетов мы расскажем чуть позже). Естественно, разблокированные процессоры K-серии имеет смысл применять только с платами на базе чипсета Intel P67 Express, но в этом случае нельзя использовать встроенное в них графическое ядро, и какой смысл оснащать более производительным графическим ядром именно разблокированные процессоры - совершенно непонятно.

Процессор Core i7-2600S отличается от двух других моделей семейства Core i7 пониженным энергопотреблением. Его TDP составляет 65 Вт. Ну и, кроме того, в этой модели процессора меньше базовая тактовая частота (2,8 ГГц), однако в режиме Turbo Boost тактовая частота может быть такой же, как и в моделях Core i7-2600 и Core i7-2600K, то есть 3,8 ГГц. Попутно отметим, что если в маркировке процессора присутствует буква «S», то это означает, что речь идет о процессоре с пониженным энергопотреблением.

Теперь рассмотрим семейство десктопных процессоров Core i5. Оно довольно странное, поскольку в него входят как двух-, так и четырехъядерные процессоры как с поддержкой Hyper-Threading, так и без нее. Точнее, если бы не модель Core i5-2390T, то всё было бы логично и Intel Core i5 можно было бы охарактеризовать как семейство четырехъядерных процессоров без поддержки технологии Hyper-Threading с L3-кэшем 6 Мбайт. Однако модель Core i5-2390T портит всю систему классификации, поскольку это двухъядерный процессор с поддержкой технологии Hyper-Threading и кэшем L3 размером 3 Мбайт. Возникает впечатление, что этот процессор попал в семейство Core i5 просто по ошибке - ему место в семействе Core i3. Однако отличительным признаком всех процессоров Core i3 является отсутствие поддержки режима Turbo Boost для ядер процессора, а модель Core i5-2390T поддерживает Turbo Boost. Одним словом, модель процессора Core i5-2390T просто не вписывается ни в одно семейство. Поэтому охарактеризуем Core i5 как семейство четырехъядерных процессоров без поддержки технологии Hyper-Threading с L3-кэшем 6 Мбайт, но с одним исключением в виде модели Core i5-2390T.

В семейство Core i5 сегодня входят три базовые модели в различных вариациях. Так, базовая модель Core i5-2500 представлена в четырех видах: Core i5-2500K, Core i5-2500, Core i5-2500S и Core i5-2500T. Модель Core i5-2500K - это разблокированный вариант процессора Core i5-2500, да еще с графикой Intel HD Graphics 3000.

Модель Core i5-2500S - это вариант процессора Core i5-2500 с пониженным энергопотреблением. Так, если для модели Core i5-2500 TDP составляет 95 Вт, то для модели Core i5-2500S - 65 Вт.

Модель Core i5-2500T - это процессор с еще более сниженным энергопотреблением. TDP этого процессора составляет 45 Вт, а кроме того, у него снижена частота ядер в штатном режиме и в режиме Turbo Boost.

Процессор Core i5-2400 представлен в двух вариантах: Core i5-2400 и i5-2400S. Разница между ними заключается в энергопотреблении и тактовой частоте.

А вот процессор Core i5-2300 вариаций пока не имеет.

Семейство процессоров Core i3 представлено в настоящее время тремя моделями. Все процессоры этого семейства являются двухъядерными, поддерживают режим Hyper-Threading, имеют кэш L3 размером 3 Мбайт и, как уже отмечалось, не поддерживают режим Turbo Boost для ядер процессора. Встроенное графическое ядро HD Graphics 2000 имеет максимальную частоту (в режиме Turbo Boost) 1100 МГц.

Технические характеристики всех десктопных процессоров Sandy Bridge представлены в табл. 2 .

Особенности графических ядер Intel HD Graphics 2000/3000

Как уже отмечалось, все процессоры Sandy Bridge имеют встроенное графическое ядро нового поколения, которое идеологически можно рассматривать как еще одно ядро процессора. Во всех мобильных процессорах, а также в десктопных процессорах K-серии (с разблокированным коэффициентом умножения) интегрируется графическое ядро Intel HD Graphics 3000, а в остальных процессорах - графическое ядро Intel HD Graphics 2000.

Конечно, графическое ядро в процессорах Sandy Bridge не может сравниться по производительности с дискретной графикой (кстати, поддержка DirectX 11 для нового ядра даже не заявлена), но справедливости ради отметим, что это ядро и не позиционируется как игровое.

Разница между ядрами Intel HD Graphics 3000 и Intel HD Graphics 2000 заключается в количестве исполнительных блоков (Execution Unit, EU). Так, в ядре Intel HD Graphics 3000 насчитывается 12 исполнительных блоков, а в ядре Intel HD Graphics 2000 - только 6.

Отметим, что исполнительные блоки в графических ядрах Intel HD Graphics 3000/2000 нельзя сравнивать с унифицированными шейдерными процессорами в графических процессорах NVIDIA или AMD, где их насчитываются сотни. Графическое ядро Intel ориентировано прежде всего не на 3D-игры, а на аппаратное декодирование и кодирование видео (включая HD-видео). То есть в конфигурацию графического ядра входят аппаратные декодеры. Их дополняют средства изменения разрешения (scaling), шумоподавления (denoise filtering), обнаружения и удаления чередования строк (deinterlace/film-mode detection) и фильтры улучшения детализации. Постобработка, позволяющая улучшить изображение при воспроизведении, включает функции STE (улучшение передачи телесных тонов), ACE (адаптивное повышение контраста) и TCC (общее управление цветом).

Мультиформатный аппаратный кодек поддерживает форматы MPEG-2, VC1 и AVC, выполняя все этапы декодирования с помощью специализированных аппаратных средств, тогда как в интегрированных графических процессорах текущего поколения за эту функцию отвечают универсальные исполнительные блоки EU (рис. 1).

Рис. 1. Сравнение возможностей по аппаратному декодированию графических
контроллеров нового и предыдущего поколений

Вообще, если сравнивать графические контроллеры Intel предыдущего поколения, интегрированные в процессоры Clarkdale/Arrandale, и графические контроллеры, интегрированные в процессоры Sandy Bridge, то нужно отметить, что разница между ними не только в поддержке аппаратного декодирования. Сравнение технических характеристик и функциональных возможностей графических контроллеров нового и предыдущего поколений представлено на рис. 2 и 3.

Рис. 2. Сравнение функциональных возможностей графических контроллеров нового
и предыдущего поколений

Рис. 3. Сравнение технических характеристик графических контроллеров нового и предыдущего поколений

Разгонные возможности декстопных процессоров Sandy Bridge

В семействе десктопных процессоров Sandy Bridge имеются как разблокированные процессоры, ориентированные на разгон, так и обычные процессоры. Однако обычные процессоры также можно (и нужно) разгонять. Вообще, все десктопные процессоры Sandy Bridge более правильно делить не на обычные и разблокированные, а на полностью разблокированные (Fully Unlocked) и ограниченно разблокированные (Limited Unlocked). Собственно, это одна из интереснейших особенностей процессоров Sandy Bridge - все они являются разблокированными в той или иной степени.

Прежде всего, во всех процессорах полностью разблокирована возможность по разгону памяти. В BIOS платы можно выбрать коэффициент умножения для памяти (8,00; 10,66; 13,33; 16,00; 18,66; 21,33). С учетом того, что штатная частота системной шины составляет 100 МГц, выбирая, к примеру, множитель 16,00, мы получим частоту памяти 1600 МГц.

Естественно, полностью разблокированной на всех процессорах является возможность устанавливать напряжение питания памяти и ядер процессора. Собственно, так было всегда.

Ну а теперь о главном. В полностью разблокированных процессорах (процессоры K-серии) можно устанавливать любой коэффициент умножения для тактовой частоты ядер процессора. Точнее, максимальный коэффициент умножения может быть равным 57, соответственно максимальная тактовая частота ядер процессора может достигать 5,7 ГГц (теоретически). В частично разблокированных процессорах (то есть в процессорах не К-серии) также можно менять коэффициент умножения, однако в меньшем диапазоне. Правило здесь работает такое. Максимальный коэффициент умножения для частично разблокированных процессоров может быть на четыре единицы выше, чем коэффициент умножения для максимальной частоты процессора в режиме Turbo Boost в штатном режиме.

Рассмотрим, к примеру, частично разблокированный процессор Core i5-2400. Его штатная тактовая частота составляет 3,1 ГГц, а в режиме Turbo Boost максимальная тактовая частота может быть равна 3,4 ГГц (при одном активном ядре). Соответственно для этого процессора коэффициент умножения для максимальной частоты в режиме Turbo Boost составляет 34. Значит, максимальный коэффициент умножения, который можно задать, равен 38.

И полностью разблокированные, и частично разблокированные процессоры Sandy Bridge позволяют настраивать режим Turbo Boost. То есть для процессоров Sandy Bridge можно задавать коэффициенты умножения для ядер процессора в режиме Turbo Boost. В случае четырехъядерных процессоров имеется возможность задавать коэффициенты умножения для четырех, трех, двух и одного активного ядра. Для полностью разблокированных процессоров коэффициенты умножения могут быть любыми (но менее 57), а для частично разблокированных процессоров действует то же правило: максимальный коэффициент умножения на четыре единицы выше, чем коэффициент умножения для максимальной частоты процессора в режиме Turbo Boost в штатном режиме (рис. 4).

Рис. 4. Сравнение разгонных возможностей полностью
и частично разблокированных процессоров Sandy Bridge

Рассмотрим для примера всё тот же частично разблокированный процессор Core i5-2400. По умолчанию (в штатном режиме) режим Turbo Boost для этого процессора настроен следующим образом. Если активны все четыре ядра, то коэффициент умножения может быть равным 32 (если не превышены ограничения по максимальному току и TDP процессора). Если активны три или два ядра процессора, то коэффициент умножения может быть равным 33, а если активно только одно ядро, то коэффициент умножения может достигать значения 34.

Поскольку максимальный коэффициент умножения для этого процессора на 4 единицы выше 34, то есть равен 38, режим Turbo Boost можно настроить так, чтобы для всех случаев активности ядер коэффициент умножения был не выше 38. К примеру, для одного активного ядра - 38, для двух - 37, для трех - 36 и для четырех - 35. А можно и так, чтобы для случаев одного, двух, трех и четырех активных ядер коэффициент умножения был равен 38.

Еще одна особенность настройки режима Turbo Boost заключается в том, что и для полностью разблокированных, и для частично разблокированных процессоров можно устанавливать значения максимального тока и энергопотребления. Напомним, что режим динамического разгона Turbo Boost реализуется лишь в том случае, если не превышен предел по максимальному току и энергопотреблению процессора. Так вот, значения максимального тока и энергопотребления можно устанавливать самостоятельно.

Говоря о разгонных возможностях процессоров Sandy Bridge, нужно отметить, что они действительно впечатляют. У нас была возможность протестировать три десктопных процессора: Core i7-2600K, Core i5-2500K и Core i5-2400, и нужно сказать, что все они отлично разгонялись. К примеру, процессор Core i7-2600K прекрасно работал на частоте 4,6 ГГц (при штатной частоте 3,4 ГГц), а час­тично разблокированный процессор Core i5-2400 при штатной частоте 3,1 ГГц отлично работал на частоте 3,8 ГГц. Более подробно о производительности и разгонных возможностях указанных процессоров мы расскажем в следующем номере нашего журнала. Напомним, что разгонять десктопные процессоры Sandy Bridge можно лишь в том случае, если используется материнская плата на базе чипсета Intel P67 Express. Платы на базе остальных чипсетов не позволяют разгонять процессоры.

Теперь самое время подробнее ознакомиться с новыми чипсетами для процессоров Sandy Bridge.

Чипсеты Intel 6-й серии

Компания Intel представила сразу десять чипсетов 6-й серии, из которых пять моделей - это чипсеты для ПК (P67, H67, Q65, Q67, B65), а еще пять (QS67, QM67, HM67, HM65, UM67) для ноутбуков.

Все новые чипсеты, или, в терминологии компании Intel, платформенные хабы (Platform Controller Hub, PCH), представляют собой однокристальные решения, которые заменяют собой традиционные северный и южный мосты.

В процессорах Sandy Bridge взаимодействие между процессором и чипсетом реализуется по шине DMI. Соответственно в чипсетах Intel 6-й серии имеется контроллер DMI.

Чипсеты для настольных ПК

Если говорить о чипсетах для настольных ПК, то наиболее широкое распространение получат чипсеты Intel P67 Express (P67) и Intel H67 Express (H67). Именно они ориентированы на домашние компьютеры. Остальные чипсеты (Q65, Q67, B65) предназначены для корпоративного сегмента рынка и не представляют интереса для конечных пользователей, а потому мы сосредоточимся прежде всего на рассмотрении чипсетов P67 и H67.

Как уже неоднократно упоминалось, ключевая разница между чипсетами P67 и H67 заключается в том, что чипсет P67, во-первых, позволяет разгонять процессоры, а во-вторых, не дает использовать встроенный в процессор графический контроллер. Чипсет H67, наоборот, не обеспечивает разгона процессоров, но позволяет применять встроенный в процессор графический контроллер. Для этого в чипсете H67 предусмотрена шина Intel FDI (Flexible Display Interface), по которой чипсет взаимодействует с процессором. А вот в чипсете P67 такой шины нет, и именно по этой причине воспользоваться встроенным графическим ядром процессора Sandy Bridge на платах с чипсетом P67 не удастся.

Остальные функциональные возможности чипсетов P67 и H67 практически совпадают. Оба чипсета поддерживают 14 портов USB 2.0. Кроме того, в них встроен 6-портовый SATA-контроллер, который поддерживает два порта SATA 6 Гбит/с (SATA III) и четыре порта SATA 3 Гбит/с (SATA II). Этот контроллер поддерживает технологию Intel RST с возможностью создания RAID-массивов уровня 0, 1, 5, 10 или JBOD.

Чипсеты P67 и H67 поддерживают восемь полноскоростных линий PCI Express 2.0, которые могут использоваться интегрированными на материнскую плату контроллерами и для организации слотов PCI Express 2.0 x1 и PCI Express 2.0 x4. А вот традиционную шину PCI чипсеты P67 и H67 не поддерживают.

Отметим также, что в чипсеты P67 и H67 уже встроен MAC-уровень гигабитного сетевого контроллера.

Структурные схемы чипсетов P67 и H67 показаны на рис. 5 и 6. В табл. 3 приведены технические характеристики чипсетов P67 и H67, а также чипсетов Q67 и B65.

Рис. 5. Структурная схема чипсета Intel P67 Express

Рис. 6. Структурная схема чипсета Intel H67 Express

Чипсеты для мобильных ПК

Из пяти чипсетов для мобильных ПК модели QM67 иQS67 ориентированы на корпоративный сегмент рынка и в ноутбуках для домашних пользователей встречаться не будут. А вот чипсеты HM67, HM65 и UM67 будут использоваться как раз в ноутбуках для домашних пользователей.

Вообще, если посмотреть на характеристики всех мобильных чипсетов (см. табл. 3), то можно заметить, что их характеристики различаются весьма незначительно. К примеру, чипсеты HM67 и UM67 отличаются друг от друга лишь разницей в энергопотреблении в 0,5 Вт, а их функциональные возможности полностью совпадают.

Все мобильные чипсеты имеют шину Intel FDI (Flexible Display Interface) и поддерживают интегрированный в процессор графический контроллер. Кроме того, эти чипсеты поддерживают выходы DVI, VGA, Display Port, HDMI 1.4 и LVD. Кроме того, поддерживаются технологии Intel Wireless Display, PAVP и SDVO.

Чипсеты QM67, QS67, HM67 и UM67 поддерживают 14 портов USB 2.0, а чипсет HM65 - только 12 портов. Однако напомним, что речь идет о ноутбуках и физически реализовать более четырех портов USB весьма проблематично. Так что разницу в количестве поддерживаемых портов USB в данном случае можно не принимать во внимание.

Кроме того, все мобильные чипсеты имеют встроенный 6-портовый SATA-контроллер, который поддерживает два порта SATA 6 Гбит/с (SATA III) и четыре порта SATA 3 Гбит/с (SATA II). В чипсетах QM67, QS67 и HM67 поддерживается технология Intel RST с возможностью создания RAID-массивов уровней 0 и 1, а чипсеты QM67 и HM67 поддерживают также создание RAID-массивов уровней 5 и 10, правда не очень понятно, зачем это нужно в ноутбуках.

Все мобильные чипсеты поддерживают восемь полноскоростных линий PCI Express 2.0, которые могут использоваться интегрированными контроллерами. Отметим также, что в мобильные чипсеты встроен MAC-уровень гигабитного сетевого контроллера.

Технические характеристики всех мобильных чипсетов представлены в

Сравнение с мобильными и десктопными процессорами

В середине января мы провели первое исследование системы на новой платформе Intel Sandy Bridge. В том тесте участвовал прототип ноутбука Toshiba A665-3D с новым видеоадаптером NVIDIA и технологией NVIDIA Optimus. Однако, что называется, перемудрили: на ноутбуке не включалась внешняя графика. Поэтому приложения, задействующие графику (в первую очередь, игры), тестировать просто не было смысла. Да и вообще, некоторые вещи невозможно адекватно протестировать на раннем и плохо работающем семпле.

Поэтому решено было провести повторное тестирование уже другой системы, и случай не заставил себя ждать. На тестирование попал другой ноутбук, Hewlett-Packard DV7, на новой платформе и с новым поколением графики от AMD. Правда, когда тесты уже были закончены, появилась информация о печально знаменитой ошибке в южном мосту, из-за которой проданные устройства (в том числе и мобильные) подлежат отзыву. Так что и здесь результаты в строгом смысле слова не совсем официальные (по крайней мере, компания Hewlett-Packard просила вернуть ноутбук), но мы-то понимаем, что ошибка (да еще и настолько «теоретическая») не может повлиять на результаты тестов.

Тем не менее, не стоило выпускать отдельный материал только для того, чтобы еще раз повторить измерения и назвать их финальными. Поэтому в настоящем обзоре мы поставили перед собой несколько задач:

  • проверить результаты новой системы в «мобильной» методике;
  • проверить работу системы разгона Intel Turbo Boost на другой системе с другим охлаждением;
  • сравнить между собой мобильную и настольные версии процессора Sandy Bridge в настольной методике тестирования компьютерных систем.

Ну что же, переходим к тестированию.

Конфигурация участников тестирования по методике для мобильных систем

Как уже отмечалось, сравнивать производительность подсистем мобильных компьютеров гораздо сложнее, т. к. они предоставляются на тест в виде готовых изделий. Сложно делать выводы, ведь на разницу в производительности может влиять более одного компонента.

Посмотрим на конкурентов, точнее на изменение их состава по сравнению с предыдущим тестированием. Во-первых, мы решили убрать из сравнения модель Core i5-540M. Она относится к более слабой двухъядерной линейке, да и в линейке Sandy Bridge ей будут соответствовать другие модели. Если результаты этого процессора так важны, их можно взять из предыдущей статьи. Вместо него в сравнение включен Hewlett-Packard Elitebook 8740w, тоже на процессоре Core i7-720QM, ну и добавлена основная тестовая система на сегодня - Hewlett-Packard Pavillon DV7 на процессоре Sandy Bridge 2630QM.

Таким образом, в тесте участвуют две модели на процессоре Core i7-720QM и две модели на процессоре Core i7 2630QM. Это позволит не только сравнить между собой производительность систем на более старом и более новом процессоре, но и убедиться, что уровень производительности одинаков для двух систем на одинаковом процессоре.

Ну а мы переходим к анализу конфигураций ноутбуков, участвующих в тестировании.

Название ноутбука HP 8740w ASUS N53Jq Toshiba A665-3D HP DV7
Процессор Core i7-720QM Core i7-720QM Core i7-2630QM Core i7-2630QM
Количество ядер 4 (8 потоков) 4 (8 потоков) 4 (8 потоков) 4 (8 потоков)
Номинальная частота 1,6 ГГц 1,6 ГГц 2 ГГц 2 ГГц
Макс. частота Turbo Boost 2,6* ГГц 2,6* ГГц 2,9* ГГц 2,9* ГГц
Объем кэша LLC 6 МБ 6 МБ 6 МБ 6 МБ
Оперативная память 10 ГБ 10 ГБ 4 ГБ 4 ГБ
Видеоподсистема NVIDIA QUADRO FX 2800M NVIDIA GT 425M Intel интегр. ATI 6570

* указана частота автоматического разгона в том случае, если у процессора под нагрузкой находятся все четыре ядра. Если под нагрузкой находится два ядра, то частота может еще вырасти (с 2,6 ГГц до 2,8 ГГц), а если одно - то подняться до максимальной отметки (с 2,6 ГГц до 2,9 ГГц).

Анализируем необходимые для сравнения данные о процессорах. Во-первых, производитель утверждает, что в линейке Sandy Bridge оптимизирована внутренняя архитектура процессора, это должно приносить какой-то прирост общей производительности.

Количество ядер и потоков гипертрейдинга одинаковое у всех участников. Однако отличается тактовая частота: у 720QM она всего лишь 1,6 ГГц, тогда как новые процессоры работают на 2 ГГц. Предельная тактовая частота, правда, отличается не так сильно. Дело в том, что для 720QM указана частота, когда задействованы четыре ядра, а для 2630QM - когда задействовано одно. Если же у него загружены четыре ядра, то максимальная частота составляет те же 2,6 ГГц. Другими словами, в «разоганном» состоянии процессоры должны работать на одинаковой частоте (пока не сработает контроль температуры). Вот только в Sandy Bridge более продвинутая технология разгона Intel Turbo Boost, которая может дольше держать повышенную частоту, так что у него может быть преимущество. Но точно предсказать, как поведет себя разгон, невозможно, т. к. слишком много зависимостей от внешних факторов.

Давайте переходить непосредственно к тестам.

Сравнение производительности процессора линейки Sandy Bridge с предыдущим поколением в наборе приложений методики исследования производительности мобильных систем. Определение повторяемости результатов

Для тестов мы использовали методику тестирования ноутбуков в реальных приложениях образца 2010 года. По сравнению с настольной, в ней урезан набор приложений, однако оставшиеся запускаются с теми же настройками (кроме игр, в этой группе настройки были серьезно изменены, и параметров тестовой задачи для программы Photoshop). Поэтому результаты отдельных тестов можно сравнивать с результатами настольных процессоров.

Результаты рейтинга отдельных групп приложений из этого материала нельзя сравнивать напрямую с данными рейтинга настольных систем. При тестировании производительности ноутбуков запускаются не все приложения методики, соответственно, рейтинг считается по-другому. Результаты рейтингов настольных систем, участвующих в тестировании, пересчитаны.

Сразу оговорюсь, что для каждой системы тесты проводились дважды, причем между прогонами система переустанавливалась и настраивалась снова. Иначе говоря, если результаты тестов и кажутся странными, то они, по крайней мере, повторяемы: на двух разных свежеустановленных системах с актуальным набором драйверов.

Начнем с профессиональных приложений.

3D-визуализация

В этой группе собраны приложения, требовательные и к производительности процессора, и графики.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Lightwave - работа 20,53 22,97 24,87 16,17
Solidworks - работа 52,5 58,83 133,12 60,45
Lightwave - рейтинг 122 109 101 155
Solidworks - рейтинг 129 115 51 112
Группа - рейтинг 126 112 76 134

Что интересно, обе системы «второй волны» значительно обходят по производительности системы, протестированные полтора месяца назад. Интересно, что это - влияние драйверов? Другой, значительно более мощной графики в обоих случаях? Даже если не обращать внимание на старые результаты процессора Sandy Bridge, в сравнении двух Core i7 наблюдается та же зависимость.

Теперь можно с уверенностью сказать, что новое поколение быстрее. За исключением странных результатов SolidWorks, но к ним мы еще вернемся в обсуждении результатов настольной методики.

3D-рендеринг

Посмотрим, как обстоит дело в рендеринге финальной сцены. Такой рендеринг выполняется силами центрального процессора.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Lightwave 138,58 131,56 269,89 90,22
3Ds MAX 0:10:04 0:10:06 00:21:56 0:07:45
Lightwave - рейтинг 95 101 49 146
3Ds MAX - рейтинг 113 112 52 147
Группа - рейтинг 104 107 51 147

Напомню, семпл компании Toshiba показывал в этом тесте очень слабые результаты. Зато в полностью работоспособной системе процессор Sandy Bridge позволяет добиться существенного превосходства в обоих графических пакетах. В Lightwave, как вы видите, есть разница и между двумя Core i7-720QM, а в 3Ds MAX разницы почти нет.

Зато в обоих тестах видно, что процессор Core i7-2630QM существенно быстрее, значительно обгоняет представителей предыдущего поколения.

Вычисления

Посмотрим на производительность процессоров в приложениях, связанных с математическими вычислениями.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Solidworks 46,36 45,88 44,02 38,42
MATLAB 0,0494 0,0494 0,0352 0,0365
Solidworks - рейтинг 111 112 117 134
MATLAB - рейтинг 113 113 159 153
Группа - рейтинг 112 113 138 144

Ну что же, а вот математические тесты не чувствуют разницы между двумя Core i7-720QM. Из этого можно сделать предварительный вывод, что эти приложения в минимальной степени реагируют на другие компоненты системы и программную часть.

Процессор нового поколения быстрее, но здесь отрыв не настолько большой, особенно это очевидно по цифрам рейтинга. Почему-то производительность DV7 в тесте MATLAB немного ниже, чем A660.

Посмотрим, будет ли в других тестах сохраняться примерно такой же отрыв нового поколения от старого.

Компиляция

Тест на скорость компиляции программы с помощью компилятора Microsoft Visual Studio 2008. Этот тест хорошо реагирует на скорость процессора и кэш, да и многоядерность умеет задействовать.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Compile 0:06:29 0:06:24 0:04:56 0:04:54
Compile - рейтинг 123 125 162 163

Разница в результатах небольшая, думаю, ее можно списать на погрешность. Разница в производительности между двумя поколениями значительная.

Производительность приложений Java

Этот бенчмарк представляет собой скорость выполнения набора приложений Java. Тест критичен к быстродействию процессора и очень положительно реагирует на дополнительные ядра.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Java 79,32 83,64 111,8 105,45
Java - рейтинг 90 94 126 119

А вот здесь результаты немного, но заметно снизились для более новых протестированных ноутбуков. Не будем гадать, почему так получилось, однако подчеркну, что результаты повторялись два раза. Разница между процессорами разных поколений примерно такая же, как и в предыдущем тесте.

Перейдем к производительным домашним задачам: работе с видео, звуком и фотографиями.

2D-графика

Напомню, в этой группе остались всего два теста, достаточно разноплановых. ACDSee конвертирует набор фотографий из формата RAW в JPEG, а Photoshop проводит серию операций по обработке картинки - накладку фильтров и т. д. Приложения зависят от скорости процессора, а вот многоядерность задействуют постольку-поскольку.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
ACDSee 0:07:01 0:06:55 0:05:11 0:04:52
Photoshop 0:01:17 0:01:17 0:00:49 0:00:51
ACDSee - рейтинг 108 110 146 156
Photoshop - рейтинг 426 426 669 643
Группа - рейтинг 267 268 408 400

ACDSee демонстрирует некоторую нестабильность результатов, но в целом разница между поколениями соответствует тенденции, она даже чуть больше.

На рейтинги Photoshop не стоит обращать внимание из-за измененного тестового задания. Эти же рейтинги портят и общий рейтинг группы. Но если посмотреть на время выполнения, то видно, что преимущество примерно такое же.

Кодирование аудио в различные форматы

Кодирование аудио в различные аудиоформаты - задача для современных процессоров достаточно простая. Для кодирования используется оболочка dBPowerAmp. Она умеет использовать многоядерность (запускаются дополнительные потокие кодирования). Результат теста - ее же баллы, они обратны затраченному на кодирование время, т. е. чем больше, тем лучше результат.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
apple 148 159 241 238
flac 199 214 340 343
monkey 143 155 239 235
mp3 89 96 150 152
nero 85 91 135 142
ogg 60 65 92 90
apple - рейтинг 90 97 147 145
flac - рейтинг 99 106 169 171
monkey - рейтинг 97 105 163 160
mp3 - рейтинг 103 112 174 177
nero - рейтинг 104 111 165 173
ogg - рейтинг 103 112 159 155
Группа - рейтинг 99 107 163 164

Тест достаточно простой, но в то же время наглядный. Совершенно неожиданно здесь появилась разница между двумя процессорами Core i7-720QM, причем не в пользу недавно протестированной системы. Процессоры Sandy Bridge показали почти одинаковую производительность. Как видите, преимущество новых процессоров очень существенное, больше, чем в предыдущих группах тестов.

Видеокодирование

Три теста из четырех - это кодирование видеоролика в определенный видеоформат. Особняком стоит тест Premiere, в этом приложении сценарий предусматривает создание ролика, включая наложение эффектов, а не просто кодирование. К сожалению, Sony Vegas на некоторых системах не отработал, поэтому для этой статьи мы убрали его результаты.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
DivX 0:05:02 0:05:23 0:04:26 0:04:18
Premiere 0:05:04 0:04:47 0:03:38 0:03:35
x264 0:10:29 0:10:01 0:07:45 0:07:35
XviD 0:03:31 0:03:34 0:02:34 0:02:30
DivX - рейтинг 86 80 98 101
Premiere - рейтинг 101 107 140 142
x264 - рейтинг 100 105 135 138
XviD - рейтинг 87 86 119 123
Группа - рейтинг 94 95 123 126

Особняком стоят результаты кодирования в DivX. Почему-то в этом тесте очень большая разница у систем с 720QM и очень маленькая разница между старым и новым поколением.

В остальных тестах разница существенна, а разница между поколениями примерно соответствует общей тенденции. Интересно, что в Premiere разница примерно такая же, как и в простом кодировании. Кстати, в этом тесте тоже обращает на себя внимание большая разница между двумя системами на 720QM.

Ну и, наконец, несколько типов домашних задач.

Архивирование

Архивирование представляет собой достаточно простую математическую задачу, в которой активно работают все компоненты процессора. 7z более продвинутый, т. к. может задействовать любое количество ядер, да и вообще более эффективно работает с процессором. Winrar задействует до двух ядер.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
7-zip 0:01:57 0:01:55 0:01:30 0:01:27
WinRAR 0:01:50 0:01:48 0:01:25 0:01:25
Unpack (RAR) 0:00:50 0:00:49 0:00:42 0:00:41
7-zip - рейтинг 115 117 149 154
WinRAR - рейтинг 135 138 175 175
Unpack (RAR) - рейтинг 140 143 167 171
Группа - рейтинг 130 133 164 167

Разница между одинаковыми процессорами очень невелика. Опять видно, что в сравнении двух систем на 720QM ноутбук 8740 не намного, но стабильно быстрее. Процессоры нового поколения существенно быстрее, разница между двумя поколениями в целом такая же, как в большинстве других групп.

Производительность в тестах браузеров

Тоже достаточно простые тесты. Оба замеряют производительность в Javascript, это, пожалуй, наиболее требовательная к производительности часть движка браузера. Фокус в том, что у теста V8 результат в баллах, а у Sunspider - в миллисекундах. Соответственно, в первом случае чем выше цифра, тем лучше, во втором - наоборот.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Googlev8-chrome 6216 6262 7414 7366
Googlev8-firefox 556 555 662 654
Googlev8-ie 122 123 152 147
Googlev8-opera 3753 3729 4680 4552
Googlev8-safari 2608 2580 3129 3103
Sunspider-firefox 760 747 627 646
Sunspider-ie 4989 5237 4167 4087
Sunspider-opera 321 322 275 275
Sunspider-safari 422 421 353 354
Googlev8 - рейтинг 134 134 162 160
Sunspider - рейтинг 144 143 172 172
Группа - рейтинг 139 139 167 166

Сравнение в HD Play

Этот тест был убран из зачета для настольных систем, однако для мобильных он по-прежнему актуален. Даже если система и справляется с декодированием сложного ролика, в ноутбуке еще очень важно, насколько много ресурсов требуется для выполнения этой задачи, ведь от этого зависит и нагрев системы, и время автономной работы…

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
H.264 hardware 2,6 2,5 2,3 1,2
H.264 software 19,7 18,9 13,4 14
H.264 hardware - рейтинг 631 656 713 1367
H.264 software - рейтинг 173 180 254 243

В абсолютных цифрах разница между двумя 720QM не очень велика, хотя в рейтингах она может показаться существенной. Интересно посмотреть на разницу между двумя процессорами Core i7-2630QM в режиме с использованием аппаратного ускорения. Система с графикой AMD показывает более низкую загрузку, но и при использовании адаптера Intel результаты были очень хорошие. В программном режиме обе системы хорошо справляются с декодированием, загрузка процессора невелика. У процессоров Sandy Bridge загрузка системы прогнозируемо ниже.

Посмотрим на средний балл систем, участвовавших в тестах.

HP 8740w
Core i7-720QM
ASUS N53Jq
Core i7-720QM
Toshiba A665-3D
Core i7-2630QM
HP DV7
Core i7-2630QM
Общий рейтинг системы 128 129 158 173

Хотя в некоторых тестах разница между двумя системами с процессорами Intel Core i7-720QM была ощутимой, в целом они показали практически идентичный результат.

Производительность полностью исправной и работоспособной системы с процессором Core i7-2630QM гораздо выше, чем у протестированного нами ранее семпла. По этим результатам уже можно делать выводы о производительности платформы.

И эти выводы состоят в том, что производительность новой платформы Sandy Bridge где-то на 35% (в зависимости используемых приложений) выше, чем используемой платформы предыдущего поколения. Конечно, выводы все равно не окончательные. Как минимум, у чипов разная частота. Да и вообще, применительно к новым процессорам Intel такое понятие, как «тактовая частота», стало достаточно иллюзорным, потому что у нас появилась технология Intel Turbo Boost.

Проверка работы системы Intel Turbo Boost

В процессорах серии Sandy Bridge реализована новая версия технологии Intel Turbo Boost, обладающая гораздо более широкими возможностями по управлению тактовой частотой процессора. Система контроля и управления стала гораздо более сложной и интеллектуальной. Теперь она может брать в расчет много параметров: какие ядра и насколько загружены, температура процессора и отдельных компонентов (т. е. система может отслеживать и предупреждать локальный перегрев).

Поскольку контроль за температурным режимом и нагрузкой стал более эффективным, процессору нужен меньший запас прочности, чтобы стабильно и эффективно работать при любых внешних условиях (в первую очередь - температурных). Это позволяет более эффективно использовать его возможности. Фактически, эта система представляет собой контролируемый разгон: частота работы повышается, а контроль не дает процессору выйти за рамки условий безопасной работы и потерять стабильность или сломаться. В случае если процессор, работающий на повышенной частоте, слишком сильно нагреется, система мониторинга сама понизит частоту и напряжение питания до безопасных пределов.

Более того, новая система управления разгоном способна учитывать «эффект инерции». Когда процессор холодный, на короткое время частота может подняться очень высоко, процессор может даже выходить за определенный производителем предел рассеивания тепла. Если нагрузка краткосрочная, процессор не успеет нагреться до предельных температур, а если нагрузка продлится дольше - процессор нагреется и система снизит температуру до безопасных пределов.

Таким образом, у процессора Sandy Bridge есть три рабочих положения:

Активированы механизмы энергосбережения, процессор работает на низкой частоте и пониженном напряжении питания. Активируется система Intel Turbo Boost, процессор разгоняется до максимально разрешенной разгонной частоты (она зависит в т. ч. от того, сколько ядер и как загружены), повышается напряжение питания. Процессор работает на этой тактовой частоте, пока позволяет нагрев ядра. Процессор при превышении порогов по нагрузке или нагреву возвращается к тактовой частоте, на которой он гарантированно стабильно работает. Например, для 2630QM эта частота указана как 2 ГГц, эта частота указана в спецификациях и производитель гарантирует, что процессор сможет поддерживать эту частоту сколь угодно долго при условии соблюдения оговоренных внешних условий. Intel Turbo Boost позволяет поднять частоту работы, но параметры его работы и частота работы зависят от внешних условий, поэтому производитель не может гарантировать, что эта система всегда будет работать одинаково.

Впрочем, эту информацию можно почерпнуть из первого обзора. Напомнию, в первом тестировании процессор в простое работал со следующими параметрами:

  • Простой: 800 МГц, напряжение питания 0,771 В.
  • Нагрузка (все ядра, максимум): частота 2594 МГц (множитель 26), напряжение питания 1,231 В.
  • Нагрузка (спустя порядка 5 минут работы) - либо 2594 МГц (множитель 26), либо 2494 МГц (множитель 25).
  • Нагрузка (спустя где-то 7-8 минут работы) - 1995 МГц (множитель 20). Напряжение 1,071 В. Система вернулась к стабильным, заложенным производетелем параметрам работы.

Посмотрим, сколько продержится в разогнанном положении Hewlett-Packard DV7.

Запускаем программы мониторинга состояния процессора.

Частота работы и напряжение те же, что и в предыдущем тестировании. Посмотрим на показания температуры.

Все тихо, температуры относительно невысокие - 49 градусов. Для высокопроизводительного процессора это немного. Обратите внимание на разницу в температуре первого и четвертого ядер.

Запускаем нагрузочный тест. Напомню, он грузит все ядра сразу, так что максимальных цифр (2,9 ГГц) в Intel Turbo Boost мы не увидим.

Как видите, напряжение поднялось до 1,211 Вольт, частота стала 2594 МГц из-за изменившегося множителя, теперь он составляет 26. Процессор начинает стремительно набирать температуру, все громче начинает звучать вентилятор системы охлаждения.

Ну что же, посмотрим, насколько хватит процессора, когда он перейдет на штатную частоту.

Прошла минута, видно, что температуры начинают стабилизироваться.

Прошло пять минут, температуры стабилизировались. По каким-то причинам температура первого и четвертого ядра различается на 10 градусов. Разница в температурах присутствует во всех тестах, даже в простое она заметна. Не берусь сказать, почему это происходит.

Прошло 15 минут с начала тестирования. Температуры стабильны, система охлаждения справляется. Тактовая частота остается на уровне 2,6 ГГц.

Прошло 48 минут. Ноутбук продолжает работать под нагрузкой, температуры стабильны (ну, выросли на градус). Тактовая частота та же:

Ну что же, по крайней мере зимой и в не очень горячем помещении DV7 может работать с максимальной доступной частотой неограниченно долго. Мощности системы охлаждения вполне хватает, чтобы Intel Turbo Boost без проблем держала максимально доступную «разгонную» частоту. Теоретически можно было бы разогнать процессор еще немножко.

Этот вывод отличается от предыдущих результатов. Теперь видно, что стоит покупать качественный ноутбук: если конструкторы хорошо поработали над созданием системы охлаждения, вы получите дивиденды не только в виде качественного и крепкого корпуса, но и в производительности!

Ну что же, а мы переходим ко второй очень интересной части статьи: сравнение мобильного процессора Core i7-2630QM с настольными процессорами серии Sandy Bridge в настольной методике тестирования.

Сравнение производительности мобильного процессора Core i7-2630QM с настольными процессорами серии Sandy Bridge

Для сравнения мы используем результаты из нашего исследования настольных процессоров Core i7 и Core i5 на ядре Sandy Bridge.

Сравним конфигурации участников, включив в таблицу информацию о Core i7-2630QM.

Процессор Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Название ядра Sandy Bridge Sandy Bridge Sandy Bridge Sandy Bridge Sandy Bridge
Технология пр-ва 32 нм 32 нм 32 нм 32 нм 32 нм
Частота ядра (std/max), ГГц 2,8/3,1 3,1/3,4 3,3/3,7 3,4/3,8 2,0/2,9
Стартовый коэффициент умножения 28 31 33 34 20
Схема работы Turbo Boost 3-2-2-1 3-2-2-1 4-3-2-1 4-3-2-1 н/д
Кол-во ядер/потоков вычисления 4/4 4/4 4/4 4/8 4/8
Кэш L1, I/D, КБ 32/32 32/32 32/32 32/32 н/д
Кэш L2, КБ 4×256 4×256 4×256 4×256 н/д
Кэш L3, МиБ 6 6 6 8 6
Оперативная память 2×DDR3-1333
Графическое ядро GMA HD 2000 2000 2000/3000 2000/3000 3000
Частота графического ядра (max), МГц 1100 1100 1100 1350 1100
Сокет LGA1155 LGA1155 LGA1155 LGA1155 н/д
TDP 95 Вт 95 Вт 95 Вт 95 Вт 45 Вт

Тактовая частота у мобильного процессора ниже, что очевидно. В максимальном режиме Turbo Boost он чуть-чуть обгоняет по тактовой частоте младший настольный Core i5, работающий без Turbo Boost, но не более того. Зато значительно ниже тепловой пакет - более чем вдвое. Кроме того, у него меньше объем кэша последнего уровня, всего 6 МБ. Из плюсов стоит отметить, что у мобильного процессора четыре ядра и восемь потоков вычислений, т. к. это Core i7. Хоть какое-то преимущество над младшими настольными Core i5. Посмотрим, во что оно выльется на практике.

К сожалению, полноценного сравнения все равно не получилось. Некоторые пакеты из настольной методики не запустились (например, Pro/Engineer стабильно зависал на нашей тестовой системе), в результате пришлось выкинуть их результаты из рейтинга, а значит, и сам рейтинг поменялся по сравнению с рейтингами из основного материала.

Перейдем к тестам. Фраза «тест не запустился» означает, что тест не запустился именно на нашем ноутбуке, поэтому убраны результаты всех участников тестирования. Рейтинги в этом случае пересчитываются.

По результатам сразу видно, что мобильный процессор проигрывает настольным довольно серьезно - не может достичь уровня производительности даже младшего процессора новой настольной линейки. Результаты настольного процессора Core i7, на мой взгляд, слабоваты, все же он должен быть намного мощнее линейки Core i5, по результатам же зависимость кажется линейной. Результаты Solidworks вообще практически одинаковые для всех настольных систем. Этому тесту все равно, какая тактовая частота у процессора?

Посмотрим на скорость рендеринга трехмерных сцен.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
3ds max 181 195 207 233 157
Lightwave 153 168 180 234 161
Maya 142 170 181 240 165
Rendering 159 178 189 236 161

Здесь ситуация немного повеселее - мобильная система все-таки достигла уровня младшей настольной. Однако настольный Core i7 далеко впереди во всех тестах. Для сравнения, вот абсолютные результаты одного из тестов, Maya. Результатом этого теста является затраченное на выполнение проекта время, что более наглядно, чем очки в других тестах.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Maya 00:08:47 00:07:20 00:06:52 00:05:11 00:07:34

Как видите, даже при не очень большом времени просчета проекта разница существенна. В случае более сложных проектов она должна быть еще больше.

Переходим к следующем тесту.

Практически все приложения используют сложные математические вычисления, поэтому настольная линейка с более высокой частотой очевидно будет впереди. В то же время, меня очень смущает слишком маленькая разница между настольными Core i5-2500 и Core i7-2600, в некоторых приложениях более мощный процессор даже проигрывает. Неужели в этих приложениях гипердрединг действительно настолько неэффективен, что даже разница в тактовых частотах не может компенсировать вызыванное им замедление? Это тем более интересно, ведь в мобильном процессоре конфигурация ядер такая же, как в серии 2600, а он в общем-то не так уж и сильно и отстает от младшего настольного процессора, учитывая разницу в рабочих частотах между ними.

А мы переходим к менее профессиональным и более распространенным тестам. И начнем с растровой графики. К сожалению, не запустился один из тестов, что опять повлияло на картину тестов.

И снова мобильная система стабильно оказывается на уровне чуть ниже самого младшего настольного решения. И то за счет неожиданно высокого результата в Photoimpact, иначе картина была бы еще печальнее. Для наглядности приведу результаты для двух пакетов в абсолютных цифрах.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
ACDSee 00:04:20 00:03:59 00:03:46 00:03:34 00:04:57
Photoshop 00:03:36 00:03:15 00:03:07 00:02:58 00:04:00

Так можно оценить конкретную разницу во времени выполнения задания.

Переходим к тестам на архивирование. Это простые вычисления, хорошо чувствующие и скорость, и наличие дополнительных ядер процессора (хотя с этим есть вопросы).

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
7-zip 140 151 156 213 137
RAR 191 207 216 229 173
Unpack (RAR) 179 194 206 219 167
Archivers 170 184 193 220 159

И опять, и снова… Если смотреть на результаты 7-zip, то можно видеть, что многоядерность (даже в виде гипертрединга) дает существенные дивиденды. Но, видимо, тактовая частота тоже дает существенные дивиденды, потому что мобильный Core i7 с восемью ядрами опять не дотянул даже до младшего настольного процессора. И такая же ситуация сохранилась и в тестах Winrar. Зато настольный Core i7-2600 в тесте 7-zip уходит очень далеко вперед.

Тест компиляции, опять же задействующий математические возможности процессора…

В тесте на производительность приложений Java тенденция в принципе подтверждается. Но отставание мобильного процессора еще больше.

Посмотим на производительность Javascript в современных браузерах.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Google V8 161 176 190 191 148
Sun Spider 156 162 167 170 198
Browser 159 169 179 181 173

Если результаты теста от Google примерно соответствуют тому, что мы видели раньше, то в Sunspider явно что-то не так. Хотя в принципе во всех браузерах этот тест отработал на мобильном процессоре быстрее, чем на всех настольных, включая и настольный Core i7 (который, правда, по результатам очень несильно отличается от старшего Core i5).

В общем, весьма неожиданный результат второго теста, который я объяснить не могу. Возможно, что-то по-разному сработало именно в ПО?

Оставим интернет-приложения и перейдем к работе с видео и аудио. Тоже достаточно востребованный вид деятельности, в том числе и для мобильных компьютеров.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Apple Lossless 135 149 154 206 126
FLAC 145 159 171 233 144
Monkey"s Audio 150 165 174 230 139
MP3 (LAME) 162 179 191 258 152
Nero AAC 154 171 179 250 148
Ogg Vorbis 164 179 191 252 147
Audio 152 167 177 238 143

Аудиокодирование не преподносит нам никаких сюрпризов. Мобильный Core i7-2630QM немного слабее всех протестированных настольных процессоров, настольный Core i7 уходит в серьезный отрыв. А что будет в видеокодировании?

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
DivX 146 160 170 157 96
Mainconcept (VC-1) 153 167 175 187 133
Premiere 155 169 178 222 132
Vegas 164 177 185 204 131
x264 152 165 174 225 136
XviD 166 180 190 196 133
Video 156 170 179 199 127

Отставание мобильного процессора увеличилось, настольный Core i7 по-прежнему сильно опережает все остальные процессоры, хотя разрыв и уменьшился.

Ну и одно из самых «реальных» тестирований: игры!

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Batman 131 134 135 134 40
Borderlands 142 149 157 160 234
DiRT 2 109 110 110 110 36
Far Cry 2 200 218 232 237 84
Fritz Chess 142 156 166 215 149
GTA IV 162 164 167 167 144
Resident Evil 125 125 125 125 119
S.T.A.L.K.E.R. 104 104 104 104 28
UT3 150 152 157 156 48
Crysis: Warhead 127 128 128 128 40
World in Conflict 163 166 168 170 0
Games 141 146 150 155 84

Так и хочется сказать «ой». Все игры четко разделяются на зависящие от процессора и зависящие от графики. Установкой более мощного процессора можно здорово повысить скорость в Borderlands, Far Cry 2 и Fritz Chess. Некоторые игры реагируют на более мощные процессоры совсем чуть-чуть, некоторые не реагируют вообще. Если убрать из рассмотрения World in Confict, где мобильный Core i7 получил 0, то общий рейтинг выглядит так.

Результаты получились нерадостные для мобильной системы, причем по большей части как раз процессор в этом не виноват. Перед тем, как делать выводы, посмотрим на абсолютные цифры производительности в играх.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Batman 205 209 210 209 63
Borderlands 75 79 83 85 124
DiRT 2 76 77 77 77 25
Far Cry 2 76 83 88 90 32
Fritz Chess 8524 9368 9982 12956 8936
GTA IV 63 64 65 65 56
Resident Evil 128 128 128 128 121,6
S.T.A.L.K.E.R. 62,9 62,9 63 62,9 17,2
UT3 166 169 174 173 53
Crysis: Warhead 57,4 57,6 57,7 57,7 18,1
World in Conflict 62,6 63,5 64,3 65

Как видите, если настольные процессоры практически всегда показывают вполне неплохие результаты, то мобильная система много где находится на пороге играбельности или ниже него.

Практически для всех игр процессоры слишком быстрые, финальный результат зависит в основном от производительности видеокарты. При этом уровень производительности мобильной системы значительно ниже, что позволяет сделать некоторые выводы об очень большой разнице между настольными и мобильными видеорешениями. Разница на примере наших тестов составляет в среднем три раза. Особняком стоят GTA IV и Resident Evil, которые показывают на всех системах, включая мобильную, близкие результаты.

В шахматной программе, где нагружен процессор, мобильный Core i7 выступает хорошо, между бюджетными настольными моделями.

Ну что же, подведем итог.

Core i5-2300 Core i5-2400 Core i5-2500/2500K Core i7-2600/2600K Core i7-2630QM
Общая оценка 157 170 180 203 141

Общий результат подтверждает тенденцию: один из самых мощных мобильных процессоров Core i7-2360QM не может достичь уровня производительности младшего настольного процессора в более слабой линейке Core i5. Настольный процессор Core i7 по производительности сильно отрывается даже от настольных процессоров из младшей линейки, что уж говорить о мобильной версии.

Вывод

Итак, время переходить к выводам. Напомню некоторые итоги из предыдущего материала.

На первый взгляд, Sandy Bridge - действительно, весьма удачный процессор. Во-первых, он сильно доработан, убраны нелогичные решения (те же два отдельных кристалла, выполненных по разным техпроцессам), структура чипа стала логичной и хорошо оптимизированной. Улучшилась шина связи компонентов внутри процессора (куда теперь входит и видеоядро!). Во-вторых, оптимизирована структура ядер процессора, что тоже должно повлиять в лучшую сторону на производительность. Практика подтверждает теорию: тот процессор, который был у нас на тесте, по производительности уходит далеко вперед по сравнению с текущей платформой.

И действительно, в практическом тестировании Core i7-2630QM, который должен быть самым младшим в новой мобильной линейке Core i7, серьезно обходит по уровню производительности Core i7-720QM, самый распространенный из производительных (или самый производительный из распространенных) процессоров мобильной линейки Intel Core первого поколения. Судя по всему, 2630QM должен занять его место, т. е. стать мейнстримовым производительным процессором в линейке Core 2-го поколения.

В целом можно сделать вывод, что второе поколение мобильных процессоров Core в смысле производительности представляет собой неплохой шаг вперед. Что касается других достоинств линейки, то, думаю, стоит подождать выхода младших линеек, да и просто большого количества моделей на новых процессорах, и уже тогда оценить такие качества новой линейки как нагрев, энергоэффективность и пр.

Однако в сравнении с новыми настольными процессорами Sandy Bridge Core i5 и i7 новый мобильный Core i7-2630QM все-таки проигрывает. Причем мобильная платформа слабее стабильно и во всех группах тестов. Это нормальная ситуация, т. к. при создании мобильных линеек приоритетами являются не только производительность, но и малое энергопотребление (для обеспечения большего времени работы от батарей), и низкое энергопотребление (из-за более компактных и слабых систем охлаждения). Стоит посмотреть хотя бы на термопакет нового мобильного процессора, который больше, чем в два раза (!) ниже, чем у настольных версий. За это приходится расплачиваться, в т. ч. более низкой штатной частотой и производительностью в целом.

Кстати, если говорить о частотах. Hewlett-Packard DV7 преподнес в этом плане приятный сюрприз (хотя возможно, что жарким летом все будет не столь радужно). Процессор, при условии хорошей системы охлаждения, может неограниченно долгое время работать на максимальной частоте Turbo Boost 2,6 ГГц, так что он вполне способен продемострировать более высокий уровень производительности, чем в соответствии со стандартными спецификациями. Конечно, нет никаких гарантий, что летом система охлаждения будет справляться, а если нет, то уровень реальной производительности относительно настольных систем может оказаться существенно ниже, чем в наших тестах. Поэтому наличие грамотной системы охлаждения в ноутбуке с новым мобильным процессором Core i7 выходит на первый план.

Мы открываем цикл статей про новую процессорную микроархитектуру Intel Sandy Bridge. В первом материале мы коснемся теории ― расскажем про изменения и нововведения. В недалеком будущем на страницах блогов появятся результаты тестов новой платформы и много чего интересного.

Придуманная в недрах Intel концепция Tick-Tock продолжает работать ― каждый год производитель представляет измененную процессорную микроархитектуру. Фаза «Tick» подразумевает совершенствование предыдущих наработок (уменьшение техпроцесса, внедрение не слишком революционных новых технологий и так далее). Примерно через год после «Tick» случается «Tock» ― релиз процессоров на основе полностью новой микроархитектуры.

В начале 2010 года Intel представила линейку чипов под кодовым именем Westmere/Clarkdale ― технологическое совершенствование самых первых моделей Core i3/i5/i7 (Nehalem). Настала очередь Tock. Встречайте революционную микроархитектуру Sandy Bridge, на основе которой построены процессоры под общим названием Core 2011 ― полностью новые модели Core i3, Core i5, Core i7, а также бюджетные модели Pentium и Celeron.

На этот раз производитель решил не мелочиться и сходу анонсировал множество моделей для мобильных и настольных компьютеров во всех ценовых диапазонов. Правда, в продажу поступили лишь некоторые, далеко не самые доступные версии, но об этом чуть позже.

Пресса называет Sandy Bridge одной из самых существенных микроархитектур Intel за последние годы ― производитель сделал все возможное, чтобы вывести свои процессоры на новый уровень производительности, довел до ума представленные ранее технологии, предложил невероятную интеграцию вычислительных блоков и контроллеров. По сравнению с Sandy Bridge представленные ранее модели кажутся детским лепетом. Давайте рассмотрим изменения Core 2011 более подробно.

Особенности новой микроархитектуры

Блок-схема, изображающая микроархитектуру Sandy Bridge, вряд ли расскажет много о внедренных технологиях и общих изменениях. Однако стоит знать, что все компоненты новых процессоров существенно отличаются от компонентов тех же Westmere/Clarkdale. Главное, что нужно понимать перед изучением особенностей Sandy Bridge ― архитектурные доработки позволяют новым процессорам работать на 10-50% быстрее по сравнению с поколением Core 2010.

Инженеры Intel переработали блок предсказывания ветвлений, изменили препроцессор, внедрили продвинутый декодированный кэш, скоростную кольцевую шину, блок продвинутых векторных расширений AVX, переработали интегрированный контроллер оперативной памяти и линки с шиной PCI Express, изменили интегрированный графический чип до неузнаваемости, ввели фиксированный блок для аппаратного ускорения транскодирования видео, довели до ума технологию авторазгона Turbo Boost и так далее. Теперь вы, вероятно, поверили в то, что изменений действительно очень и очень много? Мы попробуем вкратце пробежаться по каждому из них, чтобы составить определенную картину перед тем, как в наших блогах появится полноценное тестирование.

Для начала, 4-ядерные модели Sandy Bridge состоят из 995 миллионов транзисторов, произведенных по отлаженному 32-нанометровому техпроцессу. Около 114 миллионов отведено под нужды графического чипа, каждое ядро занимает по 55 миллионов транзисторов, остальное уходит под дополнительные контроллеры. Для сравнения, полноценный 4-ядерный процессор AMD Phenom II X4 содержит 758 миллионов транзисторов, а 4-ядерные Nehalem использовали 731 миллион транзисторов. При всем при этом, полноценный процессорный кристалл Sandy Bridge занимает площадь 216 квадратных миллиметров ― кристалл одного из первых 4-ядерных процессоров Intel (Core 2 Quad) занимал аналогичную площадь при намного меньшем числе транзисторов и, соответственно, предлагал несоизмеримо меньшую производительность.

Теперь, позвольте рассказать о ключевых нововведениях микроархитектуры по порядку.

Кэш декодированных инструкций (micro-op cache) ― представленный в Sandy Bridge механизм micro-op cache сохраняет инструкции по мере их декодирования. При выполнении расчетов процессор определяет, попадала ли очередная инструкция в кэш. Если да, то препроцессор и вычислительный конвейер обесточиваются, что позволяет экономить электроэнергию. При этом 1,5 Кб декодированной кэш-памяти полностью интегрированы с кэшем первого уровня (L1).

Переработанный блок предсказания ветвлений может похвастаться увеличенной точностью работы. Все это стало возможным благодаря нескольким существенным инновациям в дизайне.

Кольцевая шина ― для объединения многочисленных архитектурных блоков в процессорах Sandy Bridge используется продвинутая и очень скоростная кольцевая шина. Своим появлением интерфейс обязан интегрированному графическому ядру и транскодеру видео ― необходимость общаться с кэшем третьего уровня сделала предыдущую схему соединения (около 1000 контактов для каждого ядра) неэффективной. К переработанной шине подключены все важные компоненты процессора ― графика, х86-совместимые ядра, транскодер, Системный Агент, кэш-память L3.

Под названием «Системный Агент» (System Agent) скрывается блок, ранее известный, как un-core ― здесь объединены контроллеры, которые раньше были вынесены в северный мост на материнской плате. В состав агента входят 16 линков для соединения с шиной PCI Express 2.0, двухканальный контроллер оперативной памяти DDR3, интерфейс для соединения с общей системной шиной DMI, блок управления питанием и графический блок, ответственный за вывод картинки.

Одним из самых важных нововведений Sandy Bridge принято считать переработанный с нуля графический чип. Начнем с того, что теперь графика интегрирована с другими блоками в едином кристалле (ранее под металлической крышкой процессоров Clarkdale скрывалось два разрозненных чипа). Инженеры Intel хвастаются двойным увеличением пропускной способности компонентов графического чипа по сравнению с предыдущим поколением Intel HD Graphics благодаря изменению архитектуры унифицированных шейдерных процессоров, появлению доступа к кэш-памяти L3 и другим улучшениям. При этом в новых процессорах можно будет обнаружить сразу две существенно отличающиеся модели графического ядра ― HD Graphics 2000 и HD Graphics 3000. Первая предлагает шесть унифицированных шейдерных процессоров, вторая ― двенадцать. По заявлениям Intel и профильной прессы, новая графика делает самые дешевые дискретные видеокарты излишними, но в этом нам еще предстоит убедиться в рамках отдельного обзора. Чуть не забыли сказать, новые модели HD Graphics поддерживают DirectX 10, переход к более современным графическим технологиям состоится уже в следующих поколениях процессоров.

Кроме того, в новом графическом чипе предусмотрен отдельный блок Media Engine, состоящий из двух частей для транскодирования и декодирования видео. Инженеры Intel решили не испытывать судьбу ― раньше декодированием и кодированием видео занимались унифицированные шейдерные процессоры и, частично, маломощные фиксированные блоки. По словам очевидцев, фиксированный Media Engine справляется со своей задачей быстрее и качественнее, чем даже монструозные видеокарты высшего ценового диапазона.

Измененные алгоритмы авторазгона Turbo Boost теперь позволяют процессору слегка переваливать за нормы прописанного энергопотребления на короткое время ― на практике это означает, что процессор сможет совершать скоростные забеги на малые дистанции. Разумеется, автоматика не даст перейти рубеж надежности. Напомним, Turbo Boost автоматически увеличивает частоту одного, двух, трех или четырех ядер при необходимости. Так, самая мощная модель Intel Core i7 2600 умеет увеличивать частоту одного ядра до 3,8 ГГц при работе с неоптимизированными под многоядерную архитектуру приложениями.
Заблокированный разгон

Со времен Pentium II компания Intel начала продавать процессоры с заблокированными множителями, чтобы пользователи не могли играть с частотой, а сама компания всегда имела возможность продавать одни и те же модели в разных ценовых диапазонах. Но оверклокеры всегда имели возможность регулировать частоту FSB. К сожалению, с приходом Sandy Bridge все снова меняется ― множитель в большинстве моделей наглухо заблокирован, а генератор частоты шины интегрирован в единственный мост чипсетов 6-й серии и заблокирован на частоте 100 МГц.

Единственной оверклокерской отдушиной остаются модификации с разблокированными множителями ― таких моделей в новой линейке немного, но они есть и стоят вполне адекватных денег.

Линейка

Настало время рассказать о процессорах, которые были представлены в первую очередь ― разобраться в новых названиях и понять, какой именно процессор стоит выбрать для своих целей.
Во время релиза Sandy Bridge компания Intel представила 29 (двадцать девять!) новых моделей Core iX ― четырнадцать для настольных и пятнадцать для мобильных компьютеров.

Производитель перешел на новую, еще более замутненную схему обозначениях процессоров, в которой и предстоит покопаться.
Итак, название каждого нового процессора настольной линейки состоит из обозначения бренда (Intel Core), названия конкретной линейки (i3, i5, i7), индекса (2600) и суффикса (K). Для настольной линейки предусмотрено всего три суффикса ― К (разблокированный множитель), S (энергопотребление 65 Вт) и T (энергопотребление 34-45 Вт). Теперь, самое странное ― мощный графический чип HD Graphics 3000 входит только в состав моделей с разблокированным множителем (К), остальные процессоры довольствуются заметно более слабым HD Graphics 2000.

Изначальная линейка Core 2011 для настольных компьютеров достаточно красиво разбивается по названию линейки. Так, процессоры Core i7 ― это четырехъядерные чипы с поддержкой Hyper Threading (4 ядра, 8 потоков), Core i3 ― простенькие двухъядерные чипы без поддержки Turbo Boost, но с поддержкой Hyper Threading (2 ядра, 4 потока), Core i5 ― в первую очередь четырехъядерные модели с поддержкой Turbo Boost, но без Hyper Threading. К сожалению, в будущем в рамках линейки Core i5 появятся и двухъядерные модели, однако они будут доступны в первую очередь для сборщиков готовых систем.

Еще один повод для дальнейшей дифференциации линейки ― авторазгон встроенного графического ядра. Изначально обе модели графики работают на частоте 850 МГц, однако процессоры Core i5 и Core i3 могут разгонять его до частоты 1100 МГц. Старшие Core i7 ― до 1350 МГц. Подумайте сами, каким образом подобное скажется на конечной производительности.

С мобильными модификациями Sandy Bridge все немного сложнее. Для начала, абсолютно все мобильные процессоры в новой линейке задействуют мощный графический чип HD Graphics 3000 (даже самые экономичные модели). По непонятным причинам компания Intel решила нарушить негласный закон маркетинга и разгуляться в индексах ― как мы будем разбираться в моделях с индексами 2657, 2537, 2410 и 2720 мы пока не решили. С точки зрения индексов здесь есть обозначения XM, QM, M, указывающие на ноутбуки для разных задач. Соответственно, ХМ ― это экстремальные модели для геймерских систем, М ― двухъядерные процессоры для экономичных ноутбуков, QM ― четырехъядерные процессоры для мэйнстримовых ноутбуков.

Разумеется, это далеко не все модели на ближайший год ― Intel продолжит экспериментировать и будет изредка радовать поклонников новыми модификациями. Главное, чтобы не нарушали придуманную собственными силами логику линеек.

Платформа

Вместе с Sandy Bridge были представлены чипсеты 6-й серии с необходимым процессорным разъемом LGA1155 ― первыми ласточками стали Intel P67 и Intel H67. Разобраться в двух модификациях проще простого. Intel P67 подходит для конфигураций, где будет использоваться дискретная видеокарта, при этом платформа поддерживает средства разгона. Плюс, платы на основе P67 предлагают 2х8 линий PCI Express 2.0 для конфигураций с несколькими видеокартами в режима AMD CrossFire или NVIDIA SLI. Intel H67, напротив, малопригодна для разгона, поддерживает только один порт PCI Express x16, зато умеет выводить видеосигнал.

Всем тем, кто мечтает получить все возможности на одной плате, придется немного подождать ― где-то во втором квартале 2011 года разработчики представят чипсет Intel Z68. Материнки на основе этого чипсета будут поддерживать встроенное в процессор графическое ядро, а также все особенности Intel P67.

Пару слов о новом процессорном разъеме ― Intel переделала схематику и структуру гнезда, так что старые модели Core 2010 для LGA 1156 использовать уже не получится. К счастью, размер сокета остался прежним, сюда можно установить многочисленные кулеры для LGA 1156 и не мучиться с поиском самых новых моделей.

В чипсетах все еще не появилась врожденная поддержка интерфейса USB 3.0, хотя рынок, вроде бы, вполне готов к подобным «инновациям». Поклонникам всего самого лучше придется ориентироваться на продвинутые материнские платы, куда производители встраивают сторонние контроллеры USB 3.0.

Благо, про новую версию интерфейса SATA компания Intel не забыла ― новые платформы поддерживают SATA3 с пропускной способностью до 6 Гбит/с. Понятно, что для классических шпиндельных винчестеров все эти скоростные прибавки не нужно, но накопители на основе флэш-памяти оценят скоростное окно по достоинству. К примеру, один из представленных на выставке CES флэш-винчестер раскроет свои скоростные способности только в паре с SATA3 ― в рамках SATA2 ему тесно (речь о Crucial RealSSD C300). Что важно, порты SATA3 на новых материнских платах соседствуют с SATA2, хотя новый интерфейс и предлагает полную обратную совместимость с предыдущим поколением ― при подключении своего супер-дорогого SSD будьте внимательнее.

В новых чипсетах производители наконец-то начинают избавляться от главного архаизма ― интерфейса BIOS. На замену топорному синему экрану из прошлого приходит UEFI ― новая оболочка поддерживает управление мышью (или тачпадом), предлагает заметно более современный и удобный интерфейс. Из других особенностей UEFI можно отметить врожденную поддержку жестких дисков объемом свыше 2,2 Тб.

Что мы имеем в итоге?

Среди экспертов распространено мнение, что Sandy Bridge ― это всего лишь эволюция предыдущих микроархитектур и ничего кардинально нового компания не представила. Мы же сходимся во мнении с другой частью аналитиков. Несмотря на то, что новая линейка не предлагает по-настоящему революционных возможностей, проделанная компанией Intel работа достойна всяческих похвал. Производитель довел все свои начинания до идеала ― провел полную интеграцию всех компонентов, улучшил графический чип до приемлемого уровня, доделал кольцевую шину, переработал функции препроцессора, пересмотрел возможности авторазгона Turbo Boost, внедрил фиксированный блок для обработки видео и так далее. В итоге перед нами совершенно новые процессоры, которые на голову опережают предыдущие поколения с точки зрения технических характеристик.

В скорейшем будущем в блогах DNS появится тестирование нового процессора в играх и популярных программах, обзор возможностей разгона с использованием воздушного охлаждения, тест графического чипа против бюджетных дискретных видеокарт. Не пропустите.

Однако эти два материала, как нам кажется, все еще недостаточны для полного раскрытия темы. Первым «тонким моментом» являются тактовые частоты - все-таки при выпуске Haswell Refresh компания уже разделила жестко линейку «обычных» Core i7 и «оверклокерских», фабрично разогнав последние (что было не так уж и сложно, поскольку таких процессоров вообще говоря требуется немного, так что отобрать необходимое количество нужных кристаллов несложно). Появление же Skylake положение дел не только сохранило, но и усугубило: Core i7-6700 и i7-6700K это вообще очень разные процессоры, различающиеся и уровнем TDP. Таким образом, даже при одинаковых частотах эти модели могли бы работать по-разному с точки зрения производительности, а ведь и частоты совсем не одинаковые. В общем, делать выводы по старшей модели опасно, но в основном-то как раз везде изучалась она и только она. «Младшая» (и более востребованная) до последнего времени вниманием тестовых лабораторий избалована не была.

А для чего это может быть нужно? Как раз для сравнения с «верхушками» предыдущих семейств, тем более что там обычно такого большого разброса частот не было. Иногда и вообще не было - например, пары 2600/2600K и 4771/4770К в плане процессорной части в штатном режиме идентичны. Понятно, что 6700 в большей степени является аналогом не названных моделей, а 2600S, 3770S, 4770S и 4790S, но... Важно это лишь с технической точки зрения, которая, в общем-то, мало кого интересует. В плане распространенности, легкости приобретения и других значимых (в отличие от технических деталей) характеристик это как раз «регулярное» семейство, к которому и будет присматриваться большинство владельцев «старых» Core i7. Или потенциальных владельцев - пока еще апгрейд временами остается чем-то полезным, большинство пользователей процессоров младших семейств процессоров при необходимости увеличения производительности присматривается в первую очередь к устройствам для уже имеющейся «на руках» платформы, а только потом уже рассматривает (или не рассматривает) идею ее замены. Правильный это подход или не очень - покажут тесты.

Конфигурация тестовых стендов

Процессор Intel Core i7-2700K Intel Core i7-3770 Intel Core i7-4770K Intel Core i7-5775C Intel Core i7-6700
Название ядра Sandy Bridge Ivy Bridge Haswell Broadwell Skylake
Технология пр-ва 32 нм 22 нм 22 нм 14 нм 14 нм
Частота ядра std/max, ГГц 3,5/3,9 3,4/3,9 3,5/3,9 3,3/3,7 3,4/4,0
Кол-во ядер/потоков 4/8 4/8 4/8 4/8 4/8
Кэш L1 (сумм.), I/D, КБ 128/128 128/128 128/128 128/128 128/128
Кэш L2, КБ 4×256 4×256 4×256 4×256 4×256
Кэш L3 (L4), МиБ 8 8 8 6 (128) 8
Оперативная память 2×DDR3-1333 2×DDR3-1600 2×DDR3-1600 2×DDR3-1600 2×DDR4-2133
TDP, Вт 95 77 84 65 65
Графика HDG 3000 HDG 4000 HDG 4600 IPG 6200 HDG 530
Кол-во EU 12 16 20 48 24
Частота std/max, МГц 850/1350 650/1150 350/1250 300/1150 350/1150
Цена T-7762352 T-7959318 T-10384297 T-12645073 T-12874268

Для пущей академичности имело бы смысл тестировать Core i7-2600 и i7-4790, а вовсе не 2700К и 4770К, но первый в наше время найти уже сложно, в то время как 2700К у нас под рукой в свое время нашелся и был протестирован. Равно как и 4770К тоже изучался, причем в «обычном» семействе он имеет полный (4771) и близкий (4770) аналоги, и вся упомянутая троица от 4790 отличается несущественно, так что возможностью минимизировать количество работы мы решили не пренебрегать. В итоге, кстати, процессоры Core второго, третьего и четвертого поколений оказались максимально близки друг к другу по официальному диапазону тактовых частот, да и 6700 отличается от них незначительно. Broadwell тоже можно было «подтянуть» к этому уровню, взяв результаты не i7-5775C, а Xeon E3-1285 v4, но только лишь подтянуть, а не полностью устранить различие. Именно поэтому мы решили воспользоваться более массовым (благо и большинство других участников такие же), а не экзотическим процессором.

Что касается прочих условий тестирования, то они были равными, но не одинаковыми: частота работы оперативной памяти была максимальной поддерживаемой по спецификациям. А вот ее объем (8 ГБ) и системный накопитель (Toshiba THNSNH256GMCT емкостью 256 ГБ) были одинаковыми для всех испытуемых.

Методика тестирования

Для оценки производительности мы использовали нашу методику измерения производительности с применением бенчмарков и iXBT Game Benchmark 2015 . Все результаты тестирования в первом бенчмарке мы нормировали относительно результатов референсной системы, которая в этом году будет одинаковой и для ноутбуков, и для всех остальных компьютеров, что призвано облегчить читателям нелегкий труд сравнения и выбора:

iXBT Application Benchmark 2015

Как мы уже не раз писали, в этой группе немалое значение имеет видеоядро. Однако далеко не все так просто, как можно было бы предположить только лишь по техническим характеристикам - например, i7-5775C все же медленнее, чем i7-6700, хотя у первого как раз GPU намного мощнее. Впрочем, еще более показательно тут сравнение 2700К и 3770, которые в плане исполнения OpenCL-кода различаются принципиально - первый задействовать для этого GPU вообще не способен. Второй - способен. Но делает это настолько медленно, что никаких преимуществ перед предшественником не имеет. С другой стороны, наделение такими способностями «самого массового GPU на рынке» привело к тому, что их начали понемногу использовать производители программного обеспечения, что проявилось уже к моменту выхода на рынок следующих поколений Core. И наряду с небольшими улучшениями и процессорных ядер способно привести к достаточно заметному эффекту.

Однако не везде - вот как раз случай, когда прирост от поколения к поколению совсем незаметен. Впрочем, он есть, но такой, что проще не обращать на него внимания. Интересным тут является разве что то, что прошедший год позволил совместить такое увеличение производительности с существенно менее жесткими требованиями к системе охлаждения (что открывает обычным настольным Core i7 и сегмент компактных систем), однако не во всех случаях это актуально.

А вот пример, когда на GPU уже удалось переложить немалую часть нагрузки. Единственное, что может «спасти» в этом случае старые Core i7 это дискретная видеокарта, однако пересылки данных по шине эффект портят, так что i7-2700K и в этом случае не обязательно догонит i7-6700, а 3770 на это способен , но вот угнаться ни за 4790К или 6700К, ни за 5775С с любым видео уже не может . Собственно, ответ на иногда возникающий у части пользователей недоуменный вопрос - зачем в Intel уделяют столько внимания интегрированной графике, если для игр ее все равно мало, а для других целей давно достаточно? Как видим, не слишком-то и «достаточно», если самым быстрым иногда способен (как здесь) оказаться процессор с далеко не самой мощной «процессорной» частью. И уже заранее интересно - что мы сможем получить от Skylake в модификации GT4e ;)

Поразительное единодушье, обеспеченное тем, что этой программе не требуются ни новые наборы инструкций, ни какие-то чудеса на ниве увеличения многопоточной производительности. Небольшая разница между поколениями процессоров, все же, есть. Но выискивать ее можно разве что при в точности идентичной тактовой частоте. А когда таковая различается существенно (что мы имеем в исполнении i7-5775С, в однопоточном режиме отстающем от всех на 10%) - можно и не искать:)

Audition «умеет» более-менее все. Разве что к дополнительным потокам вычисления довольно равнодушен, но использовать их умеет. Причем, судя по результатам, на Skylake делает это лучше, чем было свойственно предыдущим архитектурам: преимущество 4770К над 4690К составляет порядка 15%, а вот 6700 обходит 6600К уже на 20% (при том, что частоты у всех примерно равные). В общем, скорее всего, в новой архитектуре будет ждать нас еще немало открытий. Небольших, но иногда дающих кумулятивный эффект.

Как и в случае распознавания текста, где именно 6700 отрывается от предшественников наиболее «резво». Хоть в абсолютном итоге и незначительно, но ждать на относительно старых и хорошо «вылизанных» алгоритмах такого прироста при учете того, что, по сути, перед нами энергоэффективный процессор (кстати - 6700К действительно намного быстрее справляется с этой задачей) априори было бы слишком оптимистично. Мы и не ждали. А практика оказалась интереснее априорных предположений:)

С архиваторами все топовые процессоры справляются очень хорошо независимо от поколения. Во многом, как нам кажется, потому, что для них-то эта задача уж очень уже простая. Собственно, счет уже идет на секунды, так что что-то здесь радикально улучшить практически невозможно. Если только ускорить работу системы памяти, но DDR4 имеет более высокие задержки, нежели DDR3, так что гарантированный результат дает разве что увеличение кэшей. Поэтому самым быстрым оказался единственный среди протестированных процессор с GPU GT3e - кэш-память четвертого уровня используется не только видеоядром. С другой стороны, не так уж и велик прирост от дополнительного кристалла, так что архиваторы просто та нагрузка, на которую в случае заведомо быстрых систем (а не каких-нибудь мини-ПК) можно уже не обращать внимания.

Плюс-минус пол-лаптя от Солнца, что, в общем, тоже подтверждает, что все топовые процессоры справляются с такими задачами одинаково, контроллеры в чипсетах трех серий примерно идентичные, так что существенная разница может быть обусловлена только накопителем.

А вот в таком банальном сценарии, как простое копирование файлов, еще и теплопакетом: модели с пониженным «разгоняются» достаточно вяло (благо формально и не за чем), что приводит к чуть более низким результатам, чем могло бы. Но в целом тоже не тот случай, ради которого может возникнуть желание менять платформу.

Что получаем в итоге? Все процессоры примерно идентичны друг другу. Да, конечно, разница между лучшим и худшим превышает 10%, но не стоит забывать о том, что это различия, накопившиеся за три с лишним года (а возьми мы i7-2600, так было бы 15% почти за пять). Таким образом, практического смысла в замене одной платформы на другую нет, пока старая работает. Естественно, если речь идет о LGA1155 и ее последователях - как мы уже убедились «перепад» между LGA1156 и LGA1155 куда более заметный, причем не только в плане производительности. На последних на данный момент платформах Intel что-то можно «выжать» использованием «стероидных» Core i7 (если уж все равно ориентироваться именно на это недешевое семейство), но не так и много: по интегральной производительности i7-6700K обгоняет i7-6700 на 15%, так что и его отрыв от какого-нибудь i7-2700K увеличивается почти до 30%, что уже более весомо, но все равно еще не принципиально.

Игровые приложения

По понятным причинам, для компьютерных систем такого уровня мы ограничиваемся режимом минимального качества, причем не только в «полном» разрешении, но и с его уменьшением до 1366×768: Несмотря на очевидный прогресс в области интегрированной графики, она пока не способна удовлетворить требовательного к качеству картинки геймера. А 2700К мы решили и вовсе на стандартном игровом наборе не проверять: очевидно, что тех его владельцев, кто использует именно интегрированное видеоядро, игры не интересуют от слова совсем. Кого интересуют хоть как-то, те уж точно как минимум какую-нибудь «затычку для слота» в закромах нашли и установили, благо наше тестирование по предыдущей версии методики показало, что HD Graphics 3000 не лучше, чем даже Radeon HD 6450, причем обоих практически ни на что не хватает. Вот HDG 4000 и более новые IGP уже какой-никакой интерес собой представляют.

Вот, например, в Aliens vs. Predator можно поиграть на любом из изучаемых процессоре, но только снизив разрешение. Для FHD же подходит только GT3e, причем неважно какой - просто в сокетном исполнении такая конфигурация на данный момент доступна лишь для Broadwell со всеми вытекающими.

Зато «танчики» на минималках уже на всем «бегают» столь хорошо, что стройная картина только в высоком разрешении и «вытанцовывается»: в низком даже непонятно - кто лучше, а кто хуже.

Grid2 при всей своей слабой требовательности к видеочасти все еще ставит процессоры строго по ранжиру. Но особенно хорошо это видно опять в FHD, где и пропускная способность памяти уже имеет значение. В итоге на i7-6700 уже можно разрешение не снижать. На i7-5775C тем более, причем и абсолютные результаты намного выше, так что если данная сфера применения интересует, а использование дискретной видеокарты по каким-либо причинам нежелательно, альтернатив этой линейке процессоров по-прежнему нет. В чем нет и ничего нового.

Лишь старшие Haswell «вытягивают» игру хотя бы в низком разрешении, а Skylake делает это уже без оговорок. Broadwell не комментируем - это не архитектурное, а, скажем так, количественное превосходство.

Более старая игра серии на первый взгляд аналогична, но тут уже и между Haswell и Skylake даже количественных отличий не наблюдается.

В Hitman - наблюдаются и заметные, но перехода количества в качество по-прежнему нет.

Как и здесь, где даже режим низкого разрешения может «вытянуть» только процессор с GT3e. У остальных - весомый, но все еще недостаточный даже для таких «подвигов» прогресс.

Минимальный режим настроек в этой игре относится очень щадящим образом ко всем слабосильным GPU, хотя HDG 4000 еще «хватало» лишь на HD, но не FHD.

И снова тяжелый случай. Менее «тяжелый», чем Thief, но достаточный для того, чтобы продемонстрировать наглядно, что никакая интегрированная графика не может считаться игровым решением.

Хотя в некоторые игры может позволить поиграть и с относительным комфортом. Впрочем, ощутимым только если усложнять IGP и количественно наращивать все функциональные блоки. Собственно, как раз в легких режимах прогресс в области GPU Intel наиболее заметен - примерно два раза за три года (более старые-то разработки вообще уже нет смысла рассматривать серьезно). Но из этого не следует, что со временем интегрированная графика сможет легко и непринужденно догнать дискретную сравнимого возраста. Скорее всего, «паритет» будет установлен с другой стороны - имея в виду огромную базу инсталлированных решений невысокой производительности, производители тех же игр на нее и будут ориентироваться. Почему раньше этого не делали? Вообще говоря, делали - если рассматривать не только 3D-игры, а вообще рынок, огромное количество весьма популярных игровых проектов было предназначено как раз для того, чтобы нормально работать и на достаточно архаичных платформах. Но определенный сегмент программ, «двигавших рынок» был всегда, причем именно он и привлекал максимум внимания со стороны прессы и не только. Сейчас же процесс явно близок к точке насыщения, поскольку, во-первых, парк разнообразной компьютерной техники уже очень велик, и желающих заниматься перманентным апгрейдом все меньше. А во-вторых, «мультиплатформенность» нынче подразумевает под собой не только специализированные игровые консоли, но и разнообразные планшеты-смартфоны, где, очевидно, с производительностью все еще хуже, чем у «взрослых» компьютеров, независимо от степени интегрированности платформ последних. Но для того, чтобы данная тенденция стала преобладающей, нужно, все же, как нам кажется достигнуть определенного уровня гарантированной производительности. Чего пока нет. Но над проблемой все производители работают более чем активно и Intel тут исключением не является.

Итого

Что же мы видим в конечном итоге? В принципе, как не раз было сказано, последнее существенное изменение в процессорных ядрах семейства Core состоялось почти пять лет назад. На этом этапе уже удалось достичь такого уровня, «атаковать» который напрямую никто из конкурентов не может. Поэтому основной задачей Intel является улучшение положения в, скажем так, сопутствующих областях, а также наращивание количественных (но не качественных) показателей там, где это имеет смысл. Тем более, что серьезное влияние на массовый рынок оказывает растущая популярность портативных компьютеров, давно обогнавших по этому показателю настольные и становящихся все более портативными (несколько лет назад, например, ноутбук массой 2 кг еще считался «условно легким», а сейчас активно растут продажи трансформеров, в случае которых большая масса убивает весь смысл их существования). В общем, разработка компьютерных платформ давно идет не по пути наилучшего удовлетворения потребностей покупателей больших настольных компьютеров. В лучшем случае - не в ущерб им. Поэтому то, что в целом в этом сегменте производительность систем не снижается, а даже немного растет, уже повод для радости - могло быть и хуже:) Плохо только то, что из-за изменений в периферийной функциональности приходится постоянно менять и сами платформы: это сильно подкашивает такое традиционное преимущество модульных компьютеров, как ремонтопригодность, но здесь ничего не попишешь - попытки сохранять совместимость любой ценой до добра тем более не доводят (сомневающиеся могут посмотреть на, к примеру, AMD AM3+).

Общие сведения

То, что Intel намеревается планомерно переносить в процессор функции, реализуемые ранее в наборах логики, стало понятно ещё два с лишним года назад. Первые процессоры с микроархитектурой Nehalem – Bloomfield – обзавелись встроенным контроллером памяти. В следующем поколении, Lynnfield, к контроллеру памяти добавился и контроллер шины PCI Express. Затем, в Clarkdale, в процессоре появилось и встроенное графическое ядро, правда, реализованное отдельным полупроводниковым кристаллом. Sandy Bridge в этой последовательной интеграции ставит финальную точку – в процессорах с новой микроархитектурой в едином чипе будет присутствовать всё сразу: процессорные ядра, графическое ядро, контроллер памяти и контроллер шины PCI Express.



Площадь полупроводниковых кристаллов Sandy Bridge составит примерно 225 кв. мм, то есть, благодаря современному 32-нм технологическому процессу данный кристалл окажется даже меньше, чем кристалл четырёхъядерных процессоров Bloomfield и Lynnfield или шестиядерного Gulftown.

Никаких компромиссов с точки зрения характеристик в Sandy Bridge при этом нет. Общее строение процессоров предполагает наличие двух или четырёх процессорных ядер с поддержкой технологии Hyper-Threading, кэш-памяти третьего уровня объёмом до 8 Мбайт, двухканального контроллера DDR3 памяти, поддержку 16 линий PCI Express 2.0 и присутствие современного DirectX 10.1 графического ядра. То есть, процессоры нового поколения имеют всё необходимое для выступления в разных рыночных сегментах, включая и верхние.

На фоне произошедшей интеграции в Sandy Bridge сделаны значительные улучшения и на более низком уровне. Микроархитектура вычислительных ядер подверглась значительной переработке, они получили целый ряд улучшений, благодаря которым новые процессоры окажутся заметно быстрее своих предшественников даже при работе на одинаковых тактовых частотах. Параллельно были сделаны и усовершенствования, направленные на снижение тепловыделения, так что Sandy Bridge смогут работать и просто на более высоких частотах. Кроме того, на микроархитектурном уровне в процессорах добавились поддержка нового набора векторных инструкций AVX (Advanced Vector Extensions), которые будут полезны для реализации целого ряда мультимедийных, финансовых или научных алгоритмов. Принципиальное отличие AVX от предыдущих наборов векторных инструкций семейства SSE заключается в увеличении разрядности операндов со 128 до 256 бит, так что для многих задач они дадут возможность обрабатывать большие объёмы данных с меньшими затратами. Таким образом, Sandy Bridge можно охарактеризовать как существенный шаг вперёд сразу по нескольким направлениям, что и даёт основания для самых лестных высказываний в адрес этого перспективного продукта.



Запуская в начале следующего года Sandy Bridge, Intel рассчитывает быстро покорить этими процессорами большинство ценовых сегментов. Так, уже в самом начале года будет предложен широкий ассортимент Core i3, Core i5 и Core i7 с новой микроархитектурой, стоимости различных вариантов которых будут лежат в интервале от $100 до $300. А позднее в 2011 году будут представлены и более дешёвые модификации.



По имеющимся данным анонс первой группы представителей семейства Sandy Bridge назначен на 5 января, а начало их продаж – на 9 января. В этот день прайс-лист компании пополнится следующими четырёхъядерными моделями, рассчитанными на десктопы:



Следует заметить, что в дополнение к перечисленным моделям Intel предложит и целый класс мобильных и десктопных энергоэффективных процессоров Sandy Bridge. Акцентируясь на версиях, ориентированных на настольные компьютеры, мы также можем сообщить о нескольких выходящих 5 января Sandy Bridge с типичным тепловыделением 65, 45 и 35 Вт.



Таким образом, единственная ценовая категория, которая пока останется во власти процессоров Nehalem ещё долгое время – это дорогие CPU, где в течение всего следующего года будут продолжать котироваться LGA1366 процессоры Bloomfiled и Gulftown. Их замена может произойти не ранее конца 2011 года, когда Intel подготовит и адаптирует для десктопов свою перспективную серверную платформу LGA2011. Специальные «заряженные» вариации процессоров Sandy Bridge-E, которые будут предлагаться в составе этой платформы, смогут предложить энтузиастам до 8 вычислительных ядер, 16-мегабайтный L3 кэш, четырёхканальный контроллер памяти, 32 линии PCI Express 2.0 и прочие «вкусности», о которых сегодня приходится только мечтать. Однако это – отдалённая перспектива, первая же версия Sandy Bridge станет основой более приземлённой, но всё-таки новой платформы.

Хотя в Sandy Bridge по сравнению с Clarkdale и не появилось никаких принципиально новых узлов, процессоры нового поколения придут на рынок вместе с платформой LGA1155. К сожалению, она не обладает совместимостью с LGA1156, то есть, новые процессоры потребуют использования специальных материнских плат с особенным процессорным гнездом.



Вместе с Sandy Bridge в употребление войдёт и семейство свежих наборов логики, костяком которого станет общеупотребительный чипсет Intel P67 и набор системной логики с поддержкой графики Intel H67. Также как и чипсеты для LGA1156 процессоров, P67 и H67 – предельно просты: после переноса функций северного моста в процессор они состоят из единственной микросхемы – южного моста с достаточно типичным набором характеристик. Помимо совместимости с Sandy Bridge главной особенностью этих новинок станет поддержка двух SATA портов с пропускной способностью 6 Гбит/с.


К сожалению, поддержки USB3 в новых чипсетах нет, но вне всяких сомнений подавляющее большинство LGA1155 материнских плат будет иметь соответствующие порты, реализованные через дополнительные контроллеры. Это же касается и шины PCI – отсутствие соответствующего штатного контроллера в составе новых наборов системной логики вовсе не означает, что традиционные PCI разъёмы исчезнут на материнских платах.

Несмотря на то, что до анонса реальных процессоров с микроархитектурой Sandy Bridge и платформы LGA1155 остаётся ещё некоторое время, имеющаяся информация позволяет сделать и вполне конкретные прогнозы о производительности будущих систем. Так, при сопоставлении между собой процессоров Sandy Bridge и Lynnfield, имеющих одинаковое количество ядер и работающих на одинаковой тактовой частоте, новая микроархитектура выдаёт на 5-10 % более высокое реальное быстродействие.



Производительность по данным inpai.com.cn . Сравнивались
четырёхъядерные процессоры на частоте 3.4 ГГц


При этом энергопотребление процессоров Sandy Bridge оказывается примерно на 20 % ниже, то есть по соотношению «производительность на ватт» новые CPU шагнули далеко вперёд. И, кстати, если учесть, что тактовые частоты моделей Sandy Bridge превосходят частоты равноценных процессоров Lynnfield примерно на 10 %, то можно обобщённо говорить о том, что вся платформа LGA1155 будет быстрее предшествующей платформы LGA1156 как минимум на 25 %. На это число и можно ориентироваться при поверхностной оценке практической ценности новой микроархитектуры, если закрыть глаза на более глубокие усовершенствования типа улучшенного графического ядра и поддержку новых наборов инструкций AES-NI и AVX.

Истоки высокой производительности

Многие микроархитектурные изменения, посредством которых инженерам компании Intel удалось добиться повышения производительности процессоров при снижении их энергопотребления и тепловыделения, по меньшей мере, неожиданны. Дело в том, что Sandy Bridge стал не просто дальнейшим эволюционным развитием Nehalem – в нём нашёл применение целый ряд идей, позаимствованных из, казалось бы, провального проекта Pentium 4. Да-да, хотя микроархитектура NetBurst давно отвергнута Intel из-за её неэкономичности, некоторые функциональные элементы процессоров Pentium 4 теперь можно обнаружить в составе будущих Core i3, Core i5 и Core i7. И особенно иронично, что заимствования из микроархитектуры десятилетней давности, сделанные в Sandy Bridge, служат не только повышению производительности, но и уменьшению тепловыделения.

Существенные изменения в микроархитектуре Sandy Bridge начинаются уже на начальных стадиях конвейера – на этапе декодирования x86 инструкций в более простые процессорные микрооперации. Сам блок декодирования входного потока команд остался таким же, как и в Nehalem – он обеспечивает обработку до 4 инструкций за такт и поддерживает технологии Micro-Fusion и Macro-Fusion, делающие выходной поток инструкций более равномерным с точки зрения сложности его выполнения. Однако в новой микроархитектуре декодированные в процессорные микрокоманды инструкции не просто перенаправляются на следующий этап обработки, они к тому же и кэшируются. Иными словами, в дополнение к обычному 32-килобайтному кэшу инструкций первого уровня, являющемуся атрибутом практически любого x86 процессора, в Sandy Bridge добавлен ещё один добавочный кэш «нулевого уровня» – кэш результатов декодирования. Этот кэш – первая отсылка к микроархитектуре NetBurst, ведь он с точки зрения общих принципов работы – прямой аналог приснопамятного Execution Trace Cache.



Кэш результатов декодирования имеет объём порядка 6 Кбайт и вмещает до полутора тысяч микрокоманд благодаря чему служит существенным подспорьем для декодера. Дело в том, что теперь, если декодер обнаруживает во входном потоке команд находящиеся в кэше уже перетранслированные ранее инструкции, он сразу заменяет их на внутренние микрокоманды без нового декодирования. Наличие кэша результатов декодирования позволяет существенно разгрузить декодер, который является достаточно энергоёмкой частью процессора. Согласно данным Intel, этот дополнительный кэш оказывается полезен примерно в 80 % случаев, что перечёркивает всякие подозрения о его неэффективности. К тому же в образующиеся моменты простоя декодер в Sandy Bridge отключается, что вносит существенный вклад в снижение у этих процессоров энергопотребления.

Второе важное усовершенствование начальных стадий конвейера заключается в улучшении блока предсказания ветвлений. Значение правильной работы этого узла сложно переоценить, ведь каждое неправильное прогнозирование ветвления приводит к необходимости остановки и полного сброса конвейера. В результате, ошибки предсказателя влекут за собой не только снижение производительности, но и необходимость дополнительных затрат энергии для повторного заполнения конвейера. Надо сказать, что в своих последних процессорах Intel сумел добиться очень высокой эффективности данного блока. Однако в Sandy Bridge все буферы, хранящие адреса переходов и их историю, были перепроектированы с целью уплотнения содержащейся в них информации. В результате, без увеличения размеров структур данных, которыми оперирует блок предсказания переходов, Intel удалось добиться сохранения более глубокой истории ветвлений. И это положительным образом сказалось на результативности работы предсказателя, чья результативность напрямую связана с объёмом используемой им статистической информации о выполняемых условных переходах. По имеющимся оценкам, количество правильно прогнозируемых ветвлений выросло в Sandy Bridge по сравнению с предшественником более чем на 5 %.



Но самые интересные изменения затронули блок переупорядочивания инструкций, являющийся ключевым узлом всех Out-of-Order процессоров. Именно тут наиболее сильно прослеживается родство микроархитектуры Sandy Bridge с NetBurst – инженеры Intel вернули в свой новый процессор физический регистровый файл, который в Core и Nehalem был упразднён в пользу централизованного обособленного регистрового файла. Суть произошедших изменений в том, что если ранее при переупорядочивании микрокоманд в буфере сохранялись полные копии используемых ими регистров для каждой обрабатываемой команды, то теперь используются лишь ссылки на значения регистров, хранящиеся в физическом регистровом файле. Этот подход ликвидирует не только лишние пересылки данных, но и устраняет многократное дублирование содержимого регистров, что позволяет сэкономить место в регистровом файле.



В результате, блок внеочередного выполнения команд процессоров Sandy Bridge может держать «в поле зрения» до 168 микроинструкций, в то время как в процессорах Nehalem в буфер переупорядочивания помещалось лишь 128 микрокоманд. Кроме того, достигается и некоторая экономия энергии. Однако замена значений регистров на ссылки на эти значения имеет и отрицательную сторону – исполнительный конвейер приобретает дополнительные стадии, необходимые для разыменования указателей.

Но в случае с Sandy Bridge, по большому счёту, у разработчиков и не было другого выбора. В этом процессоре в обиход вводятся новые AVX-инструкции, оперирующие 256-битными регистрами, многократные пересылки значений которых создавали бы серьёзные накладные расходы. А над тем, чтобы новые команды исполнялись в микроархитектуре Sandy Bridge с хорошей скоростью, инженеры позаботились отдельно. Высокая производительность при работе с ними – это залог их принятия разработчиками программного обеспечения, так как только в этом случае они могут реально увеличить степень параллелизма и пропускную способность в векторных вычислениях.

Сами по себе инструкции AVX – это дальнейшее развитие SSE, расширяющие разрядность типовых векторных SIMD операций на 256-битные операнды. Кроме того, новый набор позволяет проводить операции в недеструктивной форме, то есть, без потери исходных данных в регистрах. Благодаря этим своим свойствам набор инструкций AVX наравне с микроархитектурными улучшениями также можно отнести к нововведениям, направленным на повышение производительности и на экономию энергии, так как их внедрение позволит упростить многие алгоритмы и совершать большее количество работы с использованием меньшего числа команд. Инструкции AVX хорошо подходят для интенсивных вычислений с плавающей точкой в мультимедиа, научных и финансовых задачах.

Для эффективного исполнения 256-битных инструкций исполнительные устройства процессора были подвергнуты специальному редизайну. Суть изменений сводится к тому, что для работы с 256-битными данными 128-битные исполнительные устройства объединяются попарно. А учитывая то, что каждый из трёх исполнительных портов Sandy Bridge (как и Nehalem) имеет устройства для работы одновременно с тремя видами данных – 64-битными, 128-битными целыми или 128-битными вещественными – попарное объединение SIMD устройств в рамках одного порта выглядит вполне естественным и разумным решением. И, что немаловажно, такое перераспределение ресурсов не наносит ущербу общей пропускной способности исполнительного блока процессора.



Ориентация Sandy Bridge на работу с 256-битными векторными инструкциями заставила разработчиков процессора задуматься и над повышением производительности работы функциональных устройств загрузки и выгрузки данных. Три порта для работы с данными, которые были реализованы в Nehalem, перекочевали и в Sandy Bridge. Но для увеличения их коэффициента полезного действия инженеры унифицировали два порта, которые ранее были предназначены для сохранения адресов и загрузки данных. Теперь они стали равноценными и оба могут либо загружать адреса и данные, либо выгружать адреса. Третий же порт остался в неизменном виде и предназначается для сохранения данных. Учитывая, что каждый порт способен пропускать до 16 байт за цикл, суммарная пропускная способность кэша данных первого уровня в новой микроархитектуре возросла на 50 %. В результате, процессоры с микроархитектурой Sandy Bridge могут загружать до 32 байт данных и сохранять 16 байт данных за такт.



Сопоставляя все описанные нововведения, получаем, что микроархитектура вычислительных ядер в процессорах Sandy Bridge изменилась более чем существенно. Привнесённые нововведения, вне всяких сомнений, вполне тянут на то, чтобы эти процессоры действительно можно было отнести не к простой доработке «узких мест» Nehalem, а к достаточно серьёзной переработке.


Новые подходы к интеграции

С разработкой архитектуры Nehalem Intel начал предпринимать реальные шаги в сторону увеличения уровня интеграции своих процессоров. В них стали последовательно переноситься функциональные узлы, ранее являвшиеся прерогативой набора логики: контроллер памяти, контроллер PCI Express, графическое ядро. Также, в процессоре добавился и кэш третьего уровня. Иными словами, процессор стал не просто локальным «вычислительным центром», а сосредоточением большой группы разнородных сложных блоков.



Конечно, такое объединение имеет множество положительных сторон и позволяет поднять производительность за счёт уменьшения задержек при обмене данными. Однако чем больше различных блоков присутствует в процессоре, тем сложнее становится реализация взаимосвязей между ними на электрическом уровне. И наиболее серьёзную проблему в этом ключе представляет соединение разделяемого L3 кэша с процессорными ядрами, особенно в свете перспективы дальнейшего увеличения их количества. Иными словами, работая над микроархитектурой процессоров Sandy Bridge, разработчики были вынуждены серьёзно задуматься об организации удобной схемы взаимодействия между функциональными узлами, находящимися в процессоре. Применявшееся ранее обычное перекрёстное соединение смогло послужить в двух- четырёх- и шестиядерных Nehalem, но для модульного процессорного дизайна с большим количеством различных ядер оно уже не подходит.

Собственно, это уже было учтено в восьмиядерных серверных процессорах Nehalem-EX, где для соединения вычислительных ядер и L3 кэша была использована принципиально новая технология. Эта технология, которая успешно перекочевала и в Sandy Bridge, – кольцевая шина. В перспективных процессорах вычислительные ядра, кэш, графическое ядро и элементы северного моста объединены специальной кольцевой шиной с QPI-подобным протоколом, которая позволила существенно сократить количество внутрипроцессорных соединений, необходимых для маршрутизации сигналов.



Для эффективной реализации взаимодействия функциональных блоков процессора с кэшем третьего уровня посредством кольцевой шины он в процессорах Sandy Bridge делится на равноправные банки объёмом по 2 Мбайта. Исходный дизайн предполагает, что число этих банков соответствует числу процессорных ядер. Но в маркетинговых целях без ущерба для целостности кэша банки могут отключаться от шины, сокращая таким образом общий объём кэш-памяти. Каждый из банков кэш-памяти управляется собственным арбитром, но при этом все они работают в тесном взаимодействии – информация в них не дублируется. Разделение на банки не означает дробления L3 кэша, оно просто позволяет увеличить его пропускную способность, которая в результате масштабируется с ростом количества ядер и, соответственно, банков. Например, учитывая, что ширина «кольца», используемого для пересылок данных, составляет 32 байта, пиковая пропускная способность L3 кэша четырёхъядерного процессора, работающего с частотой 3.4 ГГц составляет 435.2 Гбайт/с.

Кольцевая шина хороша не только своей масштабируемостью при росте количества процессорных ядер. Учитывая, что при обменах информации по «кольцу» используется кратчайший маршрут, снизилась и латентность L3 кэша. Теперь она составляет 26-31 цикл, в то время как L3 кэш Nehalem предлагал латентность 35-40 циклов. Правда, при этом следует учитывать, что вся кэш-память в Sandy Bridge работает на частоте процессора, то есть она стала быстрее и за счёт этого тоже.

Ещё одно преимущество, привнесённое кольцевой шиной, заключается в том, что она позволила подключить к общим путям пересылок данных и интегрированное в процессор графическое ядро. То есть графика в Sandy Bridge работает с памятью не напрямую, а аналогично процессорным ядрам – через кэш-память третьего уровня. Это увеличивает её производительность, а также уменьшает тот ущерб, который встроенная графика способна нанести общей производительности системы, борясь за шину памяти с вычислительными ядрами.

Графическое ядро приобретает новые функции

Появление в процессоре встроенного графического ядра – это не новость, процессоры семейства Clarkdale, обладающие встроенным GPU Intel HD Graphics присутствуют на рынке почти год. Но в Sandy Bridge графическое и вычислительные ядра наконец-то «подружились» окончательно, они находятся на одном полупроводниковом кристалле и соединены общей кольцевой шиной через которую равноправно используют все остальные ресурсы процессора. Такая перестройка архитектуры, приблизившая графическое ядро к контроллеру памяти и отдавшая в его распоряжение все возможности кэша третьего уровня, положительным образом сказалась на производительности. Однако, как и вычислительные ядра, графическое ядро получило и другие важные усовершенствования, благодаря которым оно формально относится к следующему поколению.



В целом, архитектура графического ядра не стала принципиально иной: в его основе лежат всё также 12 исполнительных (шейдерных) процессоров. Однако разработчики смогли почти в два раза увеличить их быстродействие на целом ряде операций, а кроме того, добились улучшения параллелизма в их работе. Благодаря внесённым изменениям к числу характеристик нового графического ядра добавилась и поддержка Shader Model 4.1 и DirectX 10.1.



Так как графическое ядро перебралось на 32-нм полупроводниковый кристалл, появилась возможность и безболезненно увеличить его тактовую частоту, которая сможет доходить до 1.35 ГГц. В результате всех этих действий графика Sandy Bridge в реальных приложениях станет сопоставима по скорости с дискретными видеокартами начального уровня. Intel даже задумался о реализации силами своего перспективного графического ядра полноэкранного сглаживания! Иными словами, Sandy Bridge имеет все шансы стать самым производительным интегрированным графическим решением, которое будет способно попрать позиции дискретных видеокарт в нижнем ценовом диапазоне. Хотя, конечно, AMD и NVIDIA в качестве контраргумента наверняка будут напирать на отсутствие поддержки DirectX 11, которая может пригодиться не только новейшим играм, но и, например, приложениям, задействующим DirectCompute, например, интернет-браузерам завтрашнего дня.

Однако одним лишь совершенствованием имеющейся архитектуры графического ядра дело не ограничилось. В графическую часть Sandy Bridge были добавлены новые специализированные блоки, предназначенные для декодирования и кодирования видеопотока в популярных форматах MPEG2, VC1 и AVC.



Конечно, аппаратным декодированием видео сегодня никого не удивишь, его умеет делать и графическое ядро Clarkdale. Однако раньше эта операция возлагалась на шейдерные процессоры, теперь же ей занимается отдельный функциональный узел. Смысл такого перераспределения ролей – в появившейся совместимости с 3D видео, для нового графического ядра аппаратное декодирование стерео 3D Blu-ray или MVC потока не представляет никакой проблемы.

Ещё более интересным дополнением стал аппаратный кодек, способный кодировать видеопоток в AVC формат. С практической точки зрения это означает, что в графическом ядре Sandy Bridge есть все необходимые ресурсы для выполнения транскодирования видео с высокой производительностью и без загрузки традиционных вычислительных процессорных мощностей. Что, собственно, учитывая широкую распространённость процессоров Intel, наверняка будет с успехом использоваться разработчиками программного обеспечения. Тем более что блоки аппаратного кодирования и декодирования можно будет задействовать и в системах на базе набора логики Intel P67, то есть, использующих внешнюю дискретную графическую карту.



За конкретными примерами далеко ходить не надо: известно, что поддержка новых медийных возможностей Sandy Bridge будет присутствовать в таких популярных продуктах как ArcSoft MediaConverter, Corel DVD Factory, CyberLink MediaEspresso, Movavi Video Converter, Roxio Creator и проч. И, кстати, при использовании мультимедийных блоков графического ядра Sandy Bridge для перекодирования видео остаются свободными от нагрузки шейдерные процессоры, которые никто не мешает подключить к процессу дополнительной обработки видео или к наложению спецэффектов.

В различных моделях процессоров с микроархитектурой Sandy Bridge графическое ядро будет присутствовать в двух вариантах: Intel HD Graphics 2000 и Intel HD Graphics 3000. Разница – в количестве активных исполнительных (шейдерных) процессоров. Старшая модель графического ядра, которая предназначается для мобильных решений и старших процессоров для «настольного» сегмента будет обладать всеми 12 исполнительными блоками, в то время как упрощённая вариация этого ядра, Intel HD Graphics 2000, довольствуется лишь шестью такими блоками. Также, немного ниже у Intel HD Graphics 2000 будет и частота. Но наиболее интересные элементы GPU – аппаратный кодер и декодер – в обеих версиях будут присутствовать в полном объёме.

Северный мост по-новому – системный агент

Нерассмотренным остался лишь один функциональный узел процессоров Sandy Bridge – так называемый системный агент, который объединяет в себе контроллеры внешних интерфейсов процессора: PCI Express, DMI, памяти и дисплейные интерфейсы. Фактически, в лице системного агента мы имеем примерно тоже самое, что в процессорах Nehalem называлось Uncore. Однако системный агент в Sandy Bridge всё же не полный аналог Uncore. Он не включает в себя L3 кэш, который в новой микроархитектуре выступает отдельным функциональным блоком, работающим на частоте процессора. Ещё одно отличие системного агента состоит в том, что обмен данными между ним и процессорными и графическим ядрами, а также с кэшем третьего уровня происходит посредством всё той же кольцевой шины, объединяющей в Sandy Bridge все сущности.



Говоря о нововведениях, имеющихся в системном агенте, в первую очередь хочется сказать о давно желанном усовершенствовании контроллера памяти. В процессорах Westmere (Clarkdale) контроллер памяти, объединённый с графическим ядром, показал себя не с лучшей стороны. В Sandy Bridge этот регресс наконец-то ликвидирован, новый контроллер памяти работает, по меньшей мере, не медленнее, чем контроллер памяти процессоров Lynnfield. При этом контроллером поддерживается двухканальная DDR3 SDRAM: формально – DDR3-1067 или DDR3-1333, но фактически процессоры Sandy Bridge обладают набором множителей, позволяющим тактовать память также и на частотах 1600, 1866 и 2133 МГц.

Представить себе примерный уровень производительности контроллера памяти Sandy Bridge можно, например, по имеющимся результатам теста Aida64.



По данным xfastest.com . Тестирование проводилось на Core i7-2400 с
двухканальной DDR3-1600 памятью с таймингами 7-7-7-21-1T


Латентность подсистемы памяти в системе с процессором Sandy Bridge оказывается сопоставима с латентностью аналогичной платформы с LGA1156 процессорами Core i7. При этом новые CPU однозначно выигрывают по пропускной способности подсистемы памяти.

Контроллер шины PCIE в Sandy Bridge подобен аналогичному контроллеру LGA1156 процессоров. Он поддерживает 16 линий PCI Express 2.0, которые могут группироваться либо в одну шину PCIE 16x, либо в две PCIE 8x. Именно поэтому старая платформа LGA1366 своей актуальности с выходом LGA1155 систем не утратит: она продолжит оставаться единственным вариантом, позволяющим собирать полноскоростные видеоподсистемы, объединяющие по несколько GPU, соединённых шиной PCIE с максимальной пропускной способностью.

Важное изменение произошло и в части поддерживаемых дисплейных интерфейсов. Графическое ядро новых процессоров получит возможность использования HDMI версии 1.4, ключевой особенностью которого является поддержка передачи 3D-изображения.

Управление питанием и разгон

Ещё одна важная часть системного агента Sandy Bridge, помимо контроллеров внешних интерфейсов, это – блок управления питанием PCU (Power Control Unit). Также как и в процессорах Nehalem этот блок представляет собой программируемый микроконтроллер, который собирает информацию о температурах и потребляемом токе различных узлов процессора и имеет возможность интерактивно управлять их частотой и напряжением питания. Силами PCU реализуются как энергосберегающие функции, так и турбо-режим, который в Sandy Bridge получил дальнейшее развитие.

Все функциональные модули, составляющие процессоры Sandy Bridge, разделены в нём на три домена, использующие независимую схему тактования частоты и подключения питания. Первый и основной домен объединяет процессорные ядра и L3 кэш, которые работают на единой частоте и напряжении. Второй домен – это графическое ядро, которое использует собственную частоту. Третий домен – это сам системный агент.



Такое разделение позволило инженерам реализовать работу технологий Enhanced Intel SpeedStep и Turbo Boost одновременно и независимо для графического и процессорных ядер. Подобный подход уже был применён в мобильных процессорах Arrandale, однако там он работал по-простому, через драйвер. В Sandy Bridge же реализовано полностью аппаратное решение, которое управляет частотами вычислительных и графических ядер взаимосвязано, учитывая их текущее потребление. Это позволяет получить более серьёзный реализуемый через турбо-режим разгон процессорных ядер во время простоя графического ядра и наоборот – существенный разгон графического ядра во время неполной загрузки вычислительных ядер. Агрессивность турбо-режима в Sandy Bridge нетрудно оценить по тому, что частота процессора может увеличиваться на четыре шага относительно номинальной частоты, а вариация в частоте графического ядра может достигать и шести-семи шагов.



Однако это далеко не все нововведения в технологии Turbo Boost. Преимущество её новой реализации заключается ещё и в том, что PCU получил возможность управлять частотами более интеллектуально, ориентируясь на реальные температуры процессорных составляющих, а не только на их энергопотребление. Это означает, что в тех случаях, когда процессор работает в благоприятных температурных условиях, его энергопотреблению разрешается выходить за границу, задаваемую TDP.

При типичной повседневной работе процессорная нагрузка носит скачкообразный характер. Большинство времени процессор проводит в энергосберегающих состояниях, а высокая производительность требуется лишь в небольшие промежутки времени. За такие промежутки нагрев процессора не успевает достигнуть сколь-нибудь серьёзных величин – сказывается инерционность, обеспечиваемая теплопроводностью кулера. Управляющий частотами в Sandy Bridge блок PCU справедливо считает, что ничего страшного не произойдёт, если в такие моменты процессор будет разогнан сильнее, чем в теории может позволить величина расчётного тепловыделения. Когда же температура процессора начнёт приближаться к критическим значениям, частота будет снижена до безопасных значений.



Это автоматически выливается в выгодность с точки зрения достижения максимальной производительности использования в системах на базе Sandy Bridge качественного охлаждения. Но не следует обольщаться – максимальная продолжительность работы в состоянии «за гранью TDP» аппаратно ограничена 25 секундами.

Что же касается разгона обычного, выполняемого традиционными методами, то и тут нас ожидают кардинальные перемены, которые вряд ли будут восприняты оверклокерами с энтузиазмом. Корень зла кроется все в том же стремлении к интеграции – в LGA1155 платформах Intel перенёс генератор базовой частоты в набор системной логики. Однако фатальные для традиционного разгона последствия вызвало не это, а то, что генератор частоты стал единственным и он используется для формирования всех частот в системе. Хорошо же переносят разгон, как известно, далеко не все шины и контроллеры. Например, при увеличении частоты шины PCI Express или скорости работы USB или SATA контроллеров нестабильность может наступать очень быстро. И именно этот фактор станет серьёзным препятствием при попытках увеличения частоты центрального процессора посредством разгона генератора базовой частоты.



Фактические данные таковы. Используемая в процессорах Sandy Bridge частота базового тактового генератора установлена в 100 МГц. Генератор сам по себе позволяет варьировать значения этой частоты в очень широких пределах и даже с шагом 0.1 МГц. Однако попытки её повышения очень быстро упираются в нестабильность или неработоспособность системы. Так, нам не известно ни об одном удачном опыте увеличения базовой частоты выше 105 МГц. Иными словами, традиционный и проверенный годами способ разгона через увеличение частоты тактового генератора в системах на базе Sandy Bridge даёт сбой и не позволяет получить разгон, превышающий несерьёзные 5 %.

Так что единственным реально имеющим смысл вариантом разгона перспективных LGA1155-процессоров остаётся увеличение их коэффициента умножения. Среди моделей Sandy Bridge, которые Intel собирается предлагать покупателям, будут выделены специальные продукты, не имеющие заблокированного множителя и способные в теории разгоняться до 5.7 ГГц (57 – это максимальное значение множителя, заложенное в микроархитектуре). Однако такие процессоры, которые будут обозначаться суффиксом «K» в процессорном номере, будут отнесены к верхней ценовой категории и при этом будут стоить немного дороже своих обычных собратьев.

Для пользователей же ординарных моделей CPU будет предложен искусственно ограниченный разгон – такие процессоры также позволят увеличение коэффициента умножения, но не более чем на 4 шага относительно штатного значения. Причём, речь идёт именно о разгоне, изменение множителя никак не повлияет на технологию Turbo Boost, которая в дополнение к такому ручному повышению частоты добавит ещё и своё, автоматическое. Кроме того, во всех своих процессорах Intel не будет ограничивать множители, формирующие частоту работы графического ядра и памяти. То есть, разгон графического ядра и памяти будет доступен в системах с любыми модификациями Sandy Bridge – как оверклокерскими, так и обычными.

Впрочем, оверклокеры вряд ли сочтут это достаточной компенсацией, так что скорее всего их будут интересовать исключительно разблокированные процессоры – Core i5-2500K и Core i7-2600K. Тем более что имеющаяся информация об их частотном потенциале выглядит очень обнадёживающе. Например, существуют подтверждения стабильной работоспособности Core i7-2600K при разгоне и до 5.0 ГГц с воздушным охлаждением.



Данные windwithme , http://itbbs.pconline.com.cn/diy/12120702.html


Описанный результат был достигнут при использовании кулера Prolimatech Mega Shadow Deluxe Edition и повышении напряжения процессорного ядра до 1.45 В. Конечно, такое серьёзное повышение напряжения вряд ли подойдёт для повседневного использования, но мы полагаем, что уж на частотах порядка 4.8 ГГц процессоры Sandy Bridge трудиться в режиме 24/7 определённо смогут.

Подведём итоги

Возвращаясь к началу этой статьи, хочется напомнить, что Intel позиционирует Sandy Bridge как «так» в рамках своей стратегии «тик-так». Это означает, что в понимании производителя этот процессор является носителем новой микроархитектуры. В то же время, рассматривая его строение, мы так и не нашли никаких поражающих воображение принципиально новых идей. Фактически, имеет место лишь множество небольших улучшений, воскрешение старых удачных технологий и дальнейшая интеграция. Обоснованно ли в этом случае говорить о новом поколении процессоров, или же в действительности Sandy Bridge следует рассматривать лишь как эволюционировавший Nehalem?



И здесь у нас нет никаких сомнений – мы полностью солидарны с мнением Intel. Процессоры Sandy Bridge – это прекрасная иллюстрация возникновения нового качества вследствие накопления количественных изменений. Масса нововведений в микроархитектуре вычислительных ядер, добавление поддержки 256-битных инструкций AVX, усовершенствованное графическое ядро, появление аппаратных блоков для кодирования и декодирования видео, новый L3 кэш, кольцевая шина, интеллектуальный системный агент, более агрессивная технология Turbo Boost и возросшие тактовые частоты – всё это по отдельности может и кажется мелочами, но в сумме выдаёт на-гора продукт, улучшившийся принципиально. Причём, его превосходство вполне осязаемо – оно явно прослеживается в том, что Sandy Bridge стали существенно быстрее своих предшественников, оставаясь в рамках того же теплового пакета.

Конечно, говоря «существенно», мы не подразумеваем прирост скорости в разы. Тем не менее, заменяя LGA1156-систему на базе Lynnfield или Clarkdale на аналогичный по стоимости набор из LGA1155 материнской платы и процессора Sandy Bridge можно ожидать как минимум 25-процентного увеличения быстродействия во всех процессорозависимых приложениях.

Однако существуют и отдельные классы задач, где Sandy Bridge окажутся лучше своих предшественников на порядок за счёт новых структурных блоков. В первую очередь значительный прирост быстродействия ожидается во многих утилитах для перекодирования видео, для нужд которых в новых CPU добавлены специальные аппаратные кодеки и декодеры. Также существенно быстрее на новых CPU смогут работать мультимедийные, криптографические, научные или финансовые алгоритмы, привлекающие для своих целей новые наборы инструкций AES-NI и AVX. Конечно, все эти преимущества возможно будет получить лишь при специальной оптимизации программного обеспечения, но, похоже, ждать её слишком долго не придётся, так как инженеры Intel приложили все усилия к тому, чтобы нововведения оказались удобны и для разработчиков.

Большую пользу из новой платформы смогут извлечь и те пользователи, которые собираются задействовать встроенное графическое ядро. По сравнению с прошлой версией Intel HD Graphics оно стало существенно быстрее, что наверняка смогут оценить по достоинству владельцы будущих ноутбуков, основанных на Sandy Bridge и новой платформе Huron River. А в том случае, если новые процессоры планируется использовать в составе домашних компьютеров или HTPC, встроенное графическое ядро порадует поддержкой интерфейса HDMI 1.4, позволяющего передавать на внешние устройства 3D изображение.

В общем, серьёзный минус в Sandy Bridge видится только один – проблемы с разгоном. И если покупатели процессоров верхней ценовой категории смогут, доплатив немного, получить в своё распоряжение дружественный оверклокингу разблокированный процессор, то среди процессоров дешевле $200 таких вариантов не будет. Так что платформа LGA1155 обозначит и ещё одну тенденцию – Intel хочет ограничить возможности разгона недорогих процессоров. Впрочем, вряд ли это сильно ударит по популярности разгона как явления – приверженцев эксплуатации оборудования на пределе возможностей с радостью примет в число своих адептов компания AMD, которая в текущем году должна выпустить свой собственный, не менее эпохальный чем Sandy Bridge, продукт – Bulldozer.


Рекомендуем почитать

Наверх