Телевизоры. Приставки. Проекторы и аксессуары. Технологии. Цифровое ТВ

От Sandy Bridge до Coffee Lake: сравниваем семь поколений Intel Core i7. Пять поколений Core i7: от Sandy Bridge до Skylake. Сравнительное тестирование

Общие сведения

То, что Intel намеревается планомерно переносить в процессор функции, реализуемые ранее в наборах логики, стало понятно ещё два с лишним года назад. Первые процессоры с микроархитектурой Nehalem – Bloomfield – обзавелись встроенным контроллером памяти. В следующем поколении, Lynnfield, к контроллеру памяти добавился и контроллер шины PCI Express. Затем, в Clarkdale, в процессоре появилось и встроенное графическое ядро, правда, реализованное отдельным полупроводниковым кристаллом. Sandy Bridge в этой последовательной интеграции ставит финальную точку – в процессорах с новой микроархитектурой в едином чипе будет присутствовать всё сразу: процессорные ядра, графическое ядро, контроллер памяти и контроллер шины PCI Express.



Площадь полупроводниковых кристаллов Sandy Bridge составит примерно 225 кв. мм, то есть, благодаря современному 32-нм технологическому процессу данный кристалл окажется даже меньше, чем кристалл четырёхъядерных процессоров Bloomfield и Lynnfield или шестиядерного Gulftown.

Никаких компромиссов с точки зрения характеристик в Sandy Bridge при этом нет. Общее строение процессоров предполагает наличие двух или четырёх процессорных ядер с поддержкой технологии Hyper-Threading, кэш-памяти третьего уровня объёмом до 8 Мбайт, двухканального контроллера DDR3 памяти, поддержку 16 линий PCI Express 2.0 и присутствие современного DirectX 10.1 графического ядра. То есть, процессоры нового поколения имеют всё необходимое для выступления в разных рыночных сегментах, включая и верхние.

На фоне произошедшей интеграции в Sandy Bridge сделаны значительные улучшения и на более низком уровне. Микроархитектура вычислительных ядер подверглась значительной переработке, они получили целый ряд улучшений, благодаря которым новые процессоры окажутся заметно быстрее своих предшественников даже при работе на одинаковых тактовых частотах. Параллельно были сделаны и усовершенствования, направленные на снижение тепловыделения, так что Sandy Bridge смогут работать и просто на более высоких частотах. Кроме того, на микроархитектурном уровне в процессорах добавились поддержка нового набора векторных инструкций AVX (Advanced Vector Extensions), которые будут полезны для реализации целого ряда мультимедийных, финансовых или научных алгоритмов. Принципиальное отличие AVX от предыдущих наборов векторных инструкций семейства SSE заключается в увеличении разрядности операндов со 128 до 256 бит, так что для многих задач они дадут возможность обрабатывать большие объёмы данных с меньшими затратами. Таким образом, Sandy Bridge можно охарактеризовать как существенный шаг вперёд сразу по нескольким направлениям, что и даёт основания для самых лестных высказываний в адрес этого перспективного продукта.



Запуская в начале следующего года Sandy Bridge, Intel рассчитывает быстро покорить этими процессорами большинство ценовых сегментов. Так, уже в самом начале года будет предложен широкий ассортимент Core i3, Core i5 и Core i7 с новой микроархитектурой, стоимости различных вариантов которых будут лежат в интервале от $100 до $300. А позднее в 2011 году будут представлены и более дешёвые модификации.



По имеющимся данным анонс первой группы представителей семейства Sandy Bridge назначен на 5 января, а начало их продаж – на 9 января. В этот день прайс-лист компании пополнится следующими четырёхъядерными моделями, рассчитанными на десктопы:



Следует заметить, что в дополнение к перечисленным моделям Intel предложит и целый класс мобильных и десктопных энергоэффективных процессоров Sandy Bridge. Акцентируясь на версиях, ориентированных на настольные компьютеры, мы также можем сообщить о нескольких выходящих 5 января Sandy Bridge с типичным тепловыделением 65, 45 и 35 Вт.



Таким образом, единственная ценовая категория, которая пока останется во власти процессоров Nehalem ещё долгое время – это дорогие CPU, где в течение всего следующего года будут продолжать котироваться LGA1366 процессоры Bloomfiled и Gulftown. Их замена может произойти не ранее конца 2011 года, когда Intel подготовит и адаптирует для десктопов свою перспективную серверную платформу LGA2011. Специальные «заряженные» вариации процессоров Sandy Bridge-E, которые будут предлагаться в составе этой платформы, смогут предложить энтузиастам до 8 вычислительных ядер, 16-мегабайтный L3 кэш, четырёхканальный контроллер памяти, 32 линии PCI Express 2.0 и прочие «вкусности», о которых сегодня приходится только мечтать. Однако это – отдалённая перспектива, первая же версия Sandy Bridge станет основой более приземлённой, но всё-таки новой платформы.

Хотя в Sandy Bridge по сравнению с Clarkdale и не появилось никаких принципиально новых узлов, процессоры нового поколения придут на рынок вместе с платформой LGA1155. К сожалению, она не обладает совместимостью с LGA1156, то есть, новые процессоры потребуют использования специальных материнских плат с особенным процессорным гнездом.



Вместе с Sandy Bridge в употребление войдёт и семейство свежих наборов логики, костяком которого станет общеупотребительный чипсет Intel P67 и набор системной логики с поддержкой графики Intel H67. Также как и чипсеты для LGA1156 процессоров, P67 и H67 – предельно просты: после переноса функций северного моста в процессор они состоят из единственной микросхемы – южного моста с достаточно типичным набором характеристик. Помимо совместимости с Sandy Bridge главной особенностью этих новинок станет поддержка двух SATA портов с пропускной способностью 6 Гбит/с.


К сожалению, поддержки USB3 в новых чипсетах нет, но вне всяких сомнений подавляющее большинство LGA1155 материнских плат будет иметь соответствующие порты, реализованные через дополнительные контроллеры. Это же касается и шины PCI – отсутствие соответствующего штатного контроллера в составе новых наборов системной логики вовсе не означает, что традиционные PCI разъёмы исчезнут на материнских платах.

Несмотря на то, что до анонса реальных процессоров с микроархитектурой Sandy Bridge и платформы LGA1155 остаётся ещё некоторое время, имеющаяся информация позволяет сделать и вполне конкретные прогнозы о производительности будущих систем. Так, при сопоставлении между собой процессоров Sandy Bridge и Lynnfield, имеющих одинаковое количество ядер и работающих на одинаковой тактовой частоте, новая микроархитектура выдаёт на 5-10 % более высокое реальное быстродействие.



Производительность по данным inpai.com.cn . Сравнивались
четырёхъядерные процессоры на частоте 3.4 ГГц


При этом энергопотребление процессоров Sandy Bridge оказывается примерно на 20 % ниже, то есть по соотношению «производительность на ватт» новые CPU шагнули далеко вперёд. И, кстати, если учесть, что тактовые частоты моделей Sandy Bridge превосходят частоты равноценных процессоров Lynnfield примерно на 10 %, то можно обобщённо говорить о том, что вся платформа LGA1155 будет быстрее предшествующей платформы LGA1156 как минимум на 25 %. На это число и можно ориентироваться при поверхностной оценке практической ценности новой микроархитектуры, если закрыть глаза на более глубокие усовершенствования типа улучшенного графического ядра и поддержку новых наборов инструкций AES-NI и AVX.

Истоки высокой производительности

Многие микроархитектурные изменения, посредством которых инженерам компании Intel удалось добиться повышения производительности процессоров при снижении их энергопотребления и тепловыделения, по меньшей мере, неожиданны. Дело в том, что Sandy Bridge стал не просто дальнейшим эволюционным развитием Nehalem – в нём нашёл применение целый ряд идей, позаимствованных из, казалось бы, провального проекта Pentium 4. Да-да, хотя микроархитектура NetBurst давно отвергнута Intel из-за её неэкономичности, некоторые функциональные элементы процессоров Pentium 4 теперь можно обнаружить в составе будущих Core i3, Core i5 и Core i7. И особенно иронично, что заимствования из микроархитектуры десятилетней давности, сделанные в Sandy Bridge, служат не только повышению производительности, но и уменьшению тепловыделения.

Существенные изменения в микроархитектуре Sandy Bridge начинаются уже на начальных стадиях конвейера – на этапе декодирования x86 инструкций в более простые процессорные микрооперации. Сам блок декодирования входного потока команд остался таким же, как и в Nehalem – он обеспечивает обработку до 4 инструкций за такт и поддерживает технологии Micro-Fusion и Macro-Fusion, делающие выходной поток инструкций более равномерным с точки зрения сложности его выполнения. Однако в новой микроархитектуре декодированные в процессорные микрокоманды инструкции не просто перенаправляются на следующий этап обработки, они к тому же и кэшируются. Иными словами, в дополнение к обычному 32-килобайтному кэшу инструкций первого уровня, являющемуся атрибутом практически любого x86 процессора, в Sandy Bridge добавлен ещё один добавочный кэш «нулевого уровня» – кэш результатов декодирования. Этот кэш – первая отсылка к микроархитектуре NetBurst, ведь он с точки зрения общих принципов работы – прямой аналог приснопамятного Execution Trace Cache.



Кэш результатов декодирования имеет объём порядка 6 Кбайт и вмещает до полутора тысяч микрокоманд благодаря чему служит существенным подспорьем для декодера. Дело в том, что теперь, если декодер обнаруживает во входном потоке команд находящиеся в кэше уже перетранслированные ранее инструкции, он сразу заменяет их на внутренние микрокоманды без нового декодирования. Наличие кэша результатов декодирования позволяет существенно разгрузить декодер, который является достаточно энергоёмкой частью процессора. Согласно данным Intel, этот дополнительный кэш оказывается полезен примерно в 80 % случаев, что перечёркивает всякие подозрения о его неэффективности. К тому же в образующиеся моменты простоя декодер в Sandy Bridge отключается, что вносит существенный вклад в снижение у этих процессоров энергопотребления.

Второе важное усовершенствование начальных стадий конвейера заключается в улучшении блока предсказания ветвлений. Значение правильной работы этого узла сложно переоценить, ведь каждое неправильное прогнозирование ветвления приводит к необходимости остановки и полного сброса конвейера. В результате, ошибки предсказателя влекут за собой не только снижение производительности, но и необходимость дополнительных затрат энергии для повторного заполнения конвейера. Надо сказать, что в своих последних процессорах Intel сумел добиться очень высокой эффективности данного блока. Однако в Sandy Bridge все буферы, хранящие адреса переходов и их историю, были перепроектированы с целью уплотнения содержащейся в них информации. В результате, без увеличения размеров структур данных, которыми оперирует блок предсказания переходов, Intel удалось добиться сохранения более глубокой истории ветвлений. И это положительным образом сказалось на результативности работы предсказателя, чья результативность напрямую связана с объёмом используемой им статистической информации о выполняемых условных переходах. По имеющимся оценкам, количество правильно прогнозируемых ветвлений выросло в Sandy Bridge по сравнению с предшественником более чем на 5 %.



Но самые интересные изменения затронули блок переупорядочивания инструкций, являющийся ключевым узлом всех Out-of-Order процессоров. Именно тут наиболее сильно прослеживается родство микроархитектуры Sandy Bridge с NetBurst – инженеры Intel вернули в свой новый процессор физический регистровый файл, который в Core и Nehalem был упразднён в пользу централизованного обособленного регистрового файла. Суть произошедших изменений в том, что если ранее при переупорядочивании микрокоманд в буфере сохранялись полные копии используемых ими регистров для каждой обрабатываемой команды, то теперь используются лишь ссылки на значения регистров, хранящиеся в физическом регистровом файле. Этот подход ликвидирует не только лишние пересылки данных, но и устраняет многократное дублирование содержимого регистров, что позволяет сэкономить место в регистровом файле.



В результате, блок внеочередного выполнения команд процессоров Sandy Bridge может держать «в поле зрения» до 168 микроинструкций, в то время как в процессорах Nehalem в буфер переупорядочивания помещалось лишь 128 микрокоманд. Кроме того, достигается и некоторая экономия энергии. Однако замена значений регистров на ссылки на эти значения имеет и отрицательную сторону – исполнительный конвейер приобретает дополнительные стадии, необходимые для разыменования указателей.

Но в случае с Sandy Bridge, по большому счёту, у разработчиков и не было другого выбора. В этом процессоре в обиход вводятся новые AVX-инструкции, оперирующие 256-битными регистрами, многократные пересылки значений которых создавали бы серьёзные накладные расходы. А над тем, чтобы новые команды исполнялись в микроархитектуре Sandy Bridge с хорошей скоростью, инженеры позаботились отдельно. Высокая производительность при работе с ними – это залог их принятия разработчиками программного обеспечения, так как только в этом случае они могут реально увеличить степень параллелизма и пропускную способность в векторных вычислениях.

Сами по себе инструкции AVX – это дальнейшее развитие SSE, расширяющие разрядность типовых векторных SIMD операций на 256-битные операнды. Кроме того, новый набор позволяет проводить операции в недеструктивной форме, то есть, без потери исходных данных в регистрах. Благодаря этим своим свойствам набор инструкций AVX наравне с микроархитектурными улучшениями также можно отнести к нововведениям, направленным на повышение производительности и на экономию энергии, так как их внедрение позволит упростить многие алгоритмы и совершать большее количество работы с использованием меньшего числа команд. Инструкции AVX хорошо подходят для интенсивных вычислений с плавающей точкой в мультимедиа, научных и финансовых задачах.

Для эффективного исполнения 256-битных инструкций исполнительные устройства процессора были подвергнуты специальному редизайну. Суть изменений сводится к тому, что для работы с 256-битными данными 128-битные исполнительные устройства объединяются попарно. А учитывая то, что каждый из трёх исполнительных портов Sandy Bridge (как и Nehalem) имеет устройства для работы одновременно с тремя видами данных – 64-битными, 128-битными целыми или 128-битными вещественными – попарное объединение SIMD устройств в рамках одного порта выглядит вполне естественным и разумным решением. И, что немаловажно, такое перераспределение ресурсов не наносит ущербу общей пропускной способности исполнительного блока процессора.



Ориентация Sandy Bridge на работу с 256-битными векторными инструкциями заставила разработчиков процессора задуматься и над повышением производительности работы функциональных устройств загрузки и выгрузки данных. Три порта для работы с данными, которые были реализованы в Nehalem, перекочевали и в Sandy Bridge. Но для увеличения их коэффициента полезного действия инженеры унифицировали два порта, которые ранее были предназначены для сохранения адресов и загрузки данных. Теперь они стали равноценными и оба могут либо загружать адреса и данные, либо выгружать адреса. Третий же порт остался в неизменном виде и предназначается для сохранения данных. Учитывая, что каждый порт способен пропускать до 16 байт за цикл, суммарная пропускная способность кэша данных первого уровня в новой микроархитектуре возросла на 50 %. В результате, процессоры с микроархитектурой Sandy Bridge могут загружать до 32 байт данных и сохранять 16 байт данных за такт.



Сопоставляя все описанные нововведения, получаем, что микроархитектура вычислительных ядер в процессорах Sandy Bridge изменилась более чем существенно. Привнесённые нововведения, вне всяких сомнений, вполне тянут на то, чтобы эти процессоры действительно можно было отнести не к простой доработке «узких мест» Nehalem, а к достаточно серьёзной переработке.


Новые подходы к интеграции

С разработкой архитектуры Nehalem Intel начал предпринимать реальные шаги в сторону увеличения уровня интеграции своих процессоров. В них стали последовательно переноситься функциональные узлы, ранее являвшиеся прерогативой набора логики: контроллер памяти, контроллер PCI Express, графическое ядро. Также, в процессоре добавился и кэш третьего уровня. Иными словами, процессор стал не просто локальным «вычислительным центром», а сосредоточением большой группы разнородных сложных блоков.



Конечно, такое объединение имеет множество положительных сторон и позволяет поднять производительность за счёт уменьшения задержек при обмене данными. Однако чем больше различных блоков присутствует в процессоре, тем сложнее становится реализация взаимосвязей между ними на электрическом уровне. И наиболее серьёзную проблему в этом ключе представляет соединение разделяемого L3 кэша с процессорными ядрами, особенно в свете перспективы дальнейшего увеличения их количества. Иными словами, работая над микроархитектурой процессоров Sandy Bridge, разработчики были вынуждены серьёзно задуматься об организации удобной схемы взаимодействия между функциональными узлами, находящимися в процессоре. Применявшееся ранее обычное перекрёстное соединение смогло послужить в двух- четырёх- и шестиядерных Nehalem, но для модульного процессорного дизайна с большим количеством различных ядер оно уже не подходит.

Собственно, это уже было учтено в восьмиядерных серверных процессорах Nehalem-EX, где для соединения вычислительных ядер и L3 кэша была использована принципиально новая технология. Эта технология, которая успешно перекочевала и в Sandy Bridge, – кольцевая шина. В перспективных процессорах вычислительные ядра, кэш, графическое ядро и элементы северного моста объединены специальной кольцевой шиной с QPI-подобным протоколом, которая позволила существенно сократить количество внутрипроцессорных соединений, необходимых для маршрутизации сигналов.



Для эффективной реализации взаимодействия функциональных блоков процессора с кэшем третьего уровня посредством кольцевой шины он в процессорах Sandy Bridge делится на равноправные банки объёмом по 2 Мбайта. Исходный дизайн предполагает, что число этих банков соответствует числу процессорных ядер. Но в маркетинговых целях без ущерба для целостности кэша банки могут отключаться от шины, сокращая таким образом общий объём кэш-памяти. Каждый из банков кэш-памяти управляется собственным арбитром, но при этом все они работают в тесном взаимодействии – информация в них не дублируется. Разделение на банки не означает дробления L3 кэша, оно просто позволяет увеличить его пропускную способность, которая в результате масштабируется с ростом количества ядер и, соответственно, банков. Например, учитывая, что ширина «кольца», используемого для пересылок данных, составляет 32 байта, пиковая пропускная способность L3 кэша четырёхъядерного процессора, работающего с частотой 3.4 ГГц составляет 435.2 Гбайт/с.

Кольцевая шина хороша не только своей масштабируемостью при росте количества процессорных ядер. Учитывая, что при обменах информации по «кольцу» используется кратчайший маршрут, снизилась и латентность L3 кэша. Теперь она составляет 26-31 цикл, в то время как L3 кэш Nehalem предлагал латентность 35-40 циклов. Правда, при этом следует учитывать, что вся кэш-память в Sandy Bridge работает на частоте процессора, то есть она стала быстрее и за счёт этого тоже.

Ещё одно преимущество, привнесённое кольцевой шиной, заключается в том, что она позволила подключить к общим путям пересылок данных и интегрированное в процессор графическое ядро. То есть графика в Sandy Bridge работает с памятью не напрямую, а аналогично процессорным ядрам – через кэш-память третьего уровня. Это увеличивает её производительность, а также уменьшает тот ущерб, который встроенная графика способна нанести общей производительности системы, борясь за шину памяти с вычислительными ядрами.

Графическое ядро приобретает новые функции

Появление в процессоре встроенного графического ядра – это не новость, процессоры семейства Clarkdale, обладающие встроенным GPU Intel HD Graphics присутствуют на рынке почти год. Но в Sandy Bridge графическое и вычислительные ядра наконец-то «подружились» окончательно, они находятся на одном полупроводниковом кристалле и соединены общей кольцевой шиной через которую равноправно используют все остальные ресурсы процессора. Такая перестройка архитектуры, приблизившая графическое ядро к контроллеру памяти и отдавшая в его распоряжение все возможности кэша третьего уровня, положительным образом сказалась на производительности. Однако, как и вычислительные ядра, графическое ядро получило и другие важные усовершенствования, благодаря которым оно формально относится к следующему поколению.



В целом, архитектура графического ядра не стала принципиально иной: в его основе лежат всё также 12 исполнительных (шейдерных) процессоров. Однако разработчики смогли почти в два раза увеличить их быстродействие на целом ряде операций, а кроме того, добились улучшения параллелизма в их работе. Благодаря внесённым изменениям к числу характеристик нового графического ядра добавилась и поддержка Shader Model 4.1 и DirectX 10.1.



Так как графическое ядро перебралось на 32-нм полупроводниковый кристалл, появилась возможность и безболезненно увеличить его тактовую частоту, которая сможет доходить до 1.35 ГГц. В результате всех этих действий графика Sandy Bridge в реальных приложениях станет сопоставима по скорости с дискретными видеокартами начального уровня. Intel даже задумался о реализации силами своего перспективного графического ядра полноэкранного сглаживания! Иными словами, Sandy Bridge имеет все шансы стать самым производительным интегрированным графическим решением, которое будет способно попрать позиции дискретных видеокарт в нижнем ценовом диапазоне. Хотя, конечно, AMD и NVIDIA в качестве контраргумента наверняка будут напирать на отсутствие поддержки DirectX 11, которая может пригодиться не только новейшим играм, но и, например, приложениям, задействующим DirectCompute, например, интернет-браузерам завтрашнего дня.

Однако одним лишь совершенствованием имеющейся архитектуры графического ядра дело не ограничилось. В графическую часть Sandy Bridge были добавлены новые специализированные блоки, предназначенные для декодирования и кодирования видеопотока в популярных форматах MPEG2, VC1 и AVC.



Конечно, аппаратным декодированием видео сегодня никого не удивишь, его умеет делать и графическое ядро Clarkdale. Однако раньше эта операция возлагалась на шейдерные процессоры, теперь же ей занимается отдельный функциональный узел. Смысл такого перераспределения ролей – в появившейся совместимости с 3D видео, для нового графического ядра аппаратное декодирование стерео 3D Blu-ray или MVC потока не представляет никакой проблемы.

Ещё более интересным дополнением стал аппаратный кодек, способный кодировать видеопоток в AVC формат. С практической точки зрения это означает, что в графическом ядре Sandy Bridge есть все необходимые ресурсы для выполнения транскодирования видео с высокой производительностью и без загрузки традиционных вычислительных процессорных мощностей. Что, собственно, учитывая широкую распространённость процессоров Intel, наверняка будет с успехом использоваться разработчиками программного обеспечения. Тем более что блоки аппаратного кодирования и декодирования можно будет задействовать и в системах на базе набора логики Intel P67, то есть, использующих внешнюю дискретную графическую карту.



За конкретными примерами далеко ходить не надо: известно, что поддержка новых медийных возможностей Sandy Bridge будет присутствовать в таких популярных продуктах как ArcSoft MediaConverter, Corel DVD Factory, CyberLink MediaEspresso, Movavi Video Converter, Roxio Creator и проч. И, кстати, при использовании мультимедийных блоков графического ядра Sandy Bridge для перекодирования видео остаются свободными от нагрузки шейдерные процессоры, которые никто не мешает подключить к процессу дополнительной обработки видео или к наложению спецэффектов.

В различных моделях процессоров с микроархитектурой Sandy Bridge графическое ядро будет присутствовать в двух вариантах: Intel HD Graphics 2000 и Intel HD Graphics 3000. Разница – в количестве активных исполнительных (шейдерных) процессоров. Старшая модель графического ядра, которая предназначается для мобильных решений и старших процессоров для «настольного» сегмента будет обладать всеми 12 исполнительными блоками, в то время как упрощённая вариация этого ядра, Intel HD Graphics 2000, довольствуется лишь шестью такими блоками. Также, немного ниже у Intel HD Graphics 2000 будет и частота. Но наиболее интересные элементы GPU – аппаратный кодер и декодер – в обеих версиях будут присутствовать в полном объёме.

Северный мост по-новому – системный агент

Нерассмотренным остался лишь один функциональный узел процессоров Sandy Bridge – так называемый системный агент, который объединяет в себе контроллеры внешних интерфейсов процессора: PCI Express, DMI, памяти и дисплейные интерфейсы. Фактически, в лице системного агента мы имеем примерно тоже самое, что в процессорах Nehalem называлось Uncore. Однако системный агент в Sandy Bridge всё же не полный аналог Uncore. Он не включает в себя L3 кэш, который в новой микроархитектуре выступает отдельным функциональным блоком, работающим на частоте процессора. Ещё одно отличие системного агента состоит в том, что обмен данными между ним и процессорными и графическим ядрами, а также с кэшем третьего уровня происходит посредством всё той же кольцевой шины, объединяющей в Sandy Bridge все сущности.



Говоря о нововведениях, имеющихся в системном агенте, в первую очередь хочется сказать о давно желанном усовершенствовании контроллера памяти. В процессорах Westmere (Clarkdale) контроллер памяти, объединённый с графическим ядром, показал себя не с лучшей стороны. В Sandy Bridge этот регресс наконец-то ликвидирован, новый контроллер памяти работает, по меньшей мере, не медленнее, чем контроллер памяти процессоров Lynnfield. При этом контроллером поддерживается двухканальная DDR3 SDRAM: формально – DDR3-1067 или DDR3-1333, но фактически процессоры Sandy Bridge обладают набором множителей, позволяющим тактовать память также и на частотах 1600, 1866 и 2133 МГц.

Представить себе примерный уровень производительности контроллера памяти Sandy Bridge можно, например, по имеющимся результатам теста Aida64.



По данным xfastest.com . Тестирование проводилось на Core i7-2400 с
двухканальной DDR3-1600 памятью с таймингами 7-7-7-21-1T


Латентность подсистемы памяти в системе с процессором Sandy Bridge оказывается сопоставима с латентностью аналогичной платформы с LGA1156 процессорами Core i7. При этом новые CPU однозначно выигрывают по пропускной способности подсистемы памяти.

Контроллер шины PCIE в Sandy Bridge подобен аналогичному контроллеру LGA1156 процессоров. Он поддерживает 16 линий PCI Express 2.0, которые могут группироваться либо в одну шину PCIE 16x, либо в две PCIE 8x. Именно поэтому старая платформа LGA1366 своей актуальности с выходом LGA1155 систем не утратит: она продолжит оставаться единственным вариантом, позволяющим собирать полноскоростные видеоподсистемы, объединяющие по несколько GPU, соединённых шиной PCIE с максимальной пропускной способностью.

Важное изменение произошло и в части поддерживаемых дисплейных интерфейсов. Графическое ядро новых процессоров получит возможность использования HDMI версии 1.4, ключевой особенностью которого является поддержка передачи 3D-изображения.

Управление питанием и разгон

Ещё одна важная часть системного агента Sandy Bridge, помимо контроллеров внешних интерфейсов, это – блок управления питанием PCU (Power Control Unit). Также как и в процессорах Nehalem этот блок представляет собой программируемый микроконтроллер, который собирает информацию о температурах и потребляемом токе различных узлов процессора и имеет возможность интерактивно управлять их частотой и напряжением питания. Силами PCU реализуются как энергосберегающие функции, так и турбо-режим, который в Sandy Bridge получил дальнейшее развитие.

Все функциональные модули, составляющие процессоры Sandy Bridge, разделены в нём на три домена, использующие независимую схему тактования частоты и подключения питания. Первый и основной домен объединяет процессорные ядра и L3 кэш, которые работают на единой частоте и напряжении. Второй домен – это графическое ядро, которое использует собственную частоту. Третий домен – это сам системный агент.



Такое разделение позволило инженерам реализовать работу технологий Enhanced Intel SpeedStep и Turbo Boost одновременно и независимо для графического и процессорных ядер. Подобный подход уже был применён в мобильных процессорах Arrandale, однако там он работал по-простому, через драйвер. В Sandy Bridge же реализовано полностью аппаратное решение, которое управляет частотами вычислительных и графических ядер взаимосвязано, учитывая их текущее потребление. Это позволяет получить более серьёзный реализуемый через турбо-режим разгон процессорных ядер во время простоя графического ядра и наоборот – существенный разгон графического ядра во время неполной загрузки вычислительных ядер. Агрессивность турбо-режима в Sandy Bridge нетрудно оценить по тому, что частота процессора может увеличиваться на четыре шага относительно номинальной частоты, а вариация в частоте графического ядра может достигать и шести-семи шагов.



Однако это далеко не все нововведения в технологии Turbo Boost. Преимущество её новой реализации заключается ещё и в том, что PCU получил возможность управлять частотами более интеллектуально, ориентируясь на реальные температуры процессорных составляющих, а не только на их энергопотребление. Это означает, что в тех случаях, когда процессор работает в благоприятных температурных условиях, его энергопотреблению разрешается выходить за границу, задаваемую TDP.

При типичной повседневной работе процессорная нагрузка носит скачкообразный характер. Большинство времени процессор проводит в энергосберегающих состояниях, а высокая производительность требуется лишь в небольшие промежутки времени. За такие промежутки нагрев процессора не успевает достигнуть сколь-нибудь серьёзных величин – сказывается инерционность, обеспечиваемая теплопроводностью кулера. Управляющий частотами в Sandy Bridge блок PCU справедливо считает, что ничего страшного не произойдёт, если в такие моменты процессор будет разогнан сильнее, чем в теории может позволить величина расчётного тепловыделения. Когда же температура процессора начнёт приближаться к критическим значениям, частота будет снижена до безопасных значений.



Это автоматически выливается в выгодность с точки зрения достижения максимальной производительности использования в системах на базе Sandy Bridge качественного охлаждения. Но не следует обольщаться – максимальная продолжительность работы в состоянии «за гранью TDP» аппаратно ограничена 25 секундами.

Что же касается разгона обычного, выполняемого традиционными методами, то и тут нас ожидают кардинальные перемены, которые вряд ли будут восприняты оверклокерами с энтузиазмом. Корень зла кроется все в том же стремлении к интеграции – в LGA1155 платформах Intel перенёс генератор базовой частоты в набор системной логики. Однако фатальные для традиционного разгона последствия вызвало не это, а то, что генератор частоты стал единственным и он используется для формирования всех частот в системе. Хорошо же переносят разгон, как известно, далеко не все шины и контроллеры. Например, при увеличении частоты шины PCI Express или скорости работы USB или SATA контроллеров нестабильность может наступать очень быстро. И именно этот фактор станет серьёзным препятствием при попытках увеличения частоты центрального процессора посредством разгона генератора базовой частоты.



Фактические данные таковы. Используемая в процессорах Sandy Bridge частота базового тактового генератора установлена в 100 МГц. Генератор сам по себе позволяет варьировать значения этой частоты в очень широких пределах и даже с шагом 0.1 МГц. Однако попытки её повышения очень быстро упираются в нестабильность или неработоспособность системы. Так, нам не известно ни об одном удачном опыте увеличения базовой частоты выше 105 МГц. Иными словами, традиционный и проверенный годами способ разгона через увеличение частоты тактового генератора в системах на базе Sandy Bridge даёт сбой и не позволяет получить разгон, превышающий несерьёзные 5 %.

Так что единственным реально имеющим смысл вариантом разгона перспективных LGA1155-процессоров остаётся увеличение их коэффициента умножения. Среди моделей Sandy Bridge, которые Intel собирается предлагать покупателям, будут выделены специальные продукты, не имеющие заблокированного множителя и способные в теории разгоняться до 5.7 ГГц (57 – это максимальное значение множителя, заложенное в микроархитектуре). Однако такие процессоры, которые будут обозначаться суффиксом «K» в процессорном номере, будут отнесены к верхней ценовой категории и при этом будут стоить немного дороже своих обычных собратьев.

Для пользователей же ординарных моделей CPU будет предложен искусственно ограниченный разгон – такие процессоры также позволят увеличение коэффициента умножения, но не более чем на 4 шага относительно штатного значения. Причём, речь идёт именно о разгоне, изменение множителя никак не повлияет на технологию Turbo Boost, которая в дополнение к такому ручному повышению частоты добавит ещё и своё, автоматическое. Кроме того, во всех своих процессорах Intel не будет ограничивать множители, формирующие частоту работы графического ядра и памяти. То есть, разгон графического ядра и памяти будет доступен в системах с любыми модификациями Sandy Bridge – как оверклокерскими, так и обычными.

Впрочем, оверклокеры вряд ли сочтут это достаточной компенсацией, так что скорее всего их будут интересовать исключительно разблокированные процессоры – Core i5-2500K и Core i7-2600K. Тем более что имеющаяся информация об их частотном потенциале выглядит очень обнадёживающе. Например, существуют подтверждения стабильной работоспособности Core i7-2600K при разгоне и до 5.0 ГГц с воздушным охлаждением.



Данные windwithme , http://itbbs.pconline.com.cn/diy/12120702.html


Описанный результат был достигнут при использовании кулера Prolimatech Mega Shadow Deluxe Edition и повышении напряжения процессорного ядра до 1.45 В. Конечно, такое серьёзное повышение напряжения вряд ли подойдёт для повседневного использования, но мы полагаем, что уж на частотах порядка 4.8 ГГц процессоры Sandy Bridge трудиться в режиме 24/7 определённо смогут.

Подведём итоги

Возвращаясь к началу этой статьи, хочется напомнить, что Intel позиционирует Sandy Bridge как «так» в рамках своей стратегии «тик-так». Это означает, что в понимании производителя этот процессор является носителем новой микроархитектуры. В то же время, рассматривая его строение, мы так и не нашли никаких поражающих воображение принципиально новых идей. Фактически, имеет место лишь множество небольших улучшений, воскрешение старых удачных технологий и дальнейшая интеграция. Обоснованно ли в этом случае говорить о новом поколении процессоров, или же в действительности Sandy Bridge следует рассматривать лишь как эволюционировавший Nehalem?



И здесь у нас нет никаких сомнений – мы полностью солидарны с мнением Intel. Процессоры Sandy Bridge – это прекрасная иллюстрация возникновения нового качества вследствие накопления количественных изменений. Масса нововведений в микроархитектуре вычислительных ядер, добавление поддержки 256-битных инструкций AVX, усовершенствованное графическое ядро, появление аппаратных блоков для кодирования и декодирования видео, новый L3 кэш, кольцевая шина, интеллектуальный системный агент, более агрессивная технология Turbo Boost и возросшие тактовые частоты – всё это по отдельности может и кажется мелочами, но в сумме выдаёт на-гора продукт, улучшившийся принципиально. Причём, его превосходство вполне осязаемо – оно явно прослеживается в том, что Sandy Bridge стали существенно быстрее своих предшественников, оставаясь в рамках того же теплового пакета.

Конечно, говоря «существенно», мы не подразумеваем прирост скорости в разы. Тем не менее, заменяя LGA1156-систему на базе Lynnfield или Clarkdale на аналогичный по стоимости набор из LGA1155 материнской платы и процессора Sandy Bridge можно ожидать как минимум 25-процентного увеличения быстродействия во всех процессорозависимых приложениях.

Однако существуют и отдельные классы задач, где Sandy Bridge окажутся лучше своих предшественников на порядок за счёт новых структурных блоков. В первую очередь значительный прирост быстродействия ожидается во многих утилитах для перекодирования видео, для нужд которых в новых CPU добавлены специальные аппаратные кодеки и декодеры. Также существенно быстрее на новых CPU смогут работать мультимедийные, криптографические, научные или финансовые алгоритмы, привлекающие для своих целей новые наборы инструкций AES-NI и AVX. Конечно, все эти преимущества возможно будет получить лишь при специальной оптимизации программного обеспечения, но, похоже, ждать её слишком долго не придётся, так как инженеры Intel приложили все усилия к тому, чтобы нововведения оказались удобны и для разработчиков.

Большую пользу из новой платформы смогут извлечь и те пользователи, которые собираются задействовать встроенное графическое ядро. По сравнению с прошлой версией Intel HD Graphics оно стало существенно быстрее, что наверняка смогут оценить по достоинству владельцы будущих ноутбуков, основанных на Sandy Bridge и новой платформе Huron River. А в том случае, если новые процессоры планируется использовать в составе домашних компьютеров или HTPC, встроенное графическое ядро порадует поддержкой интерфейса HDMI 1.4, позволяющего передавать на внешние устройства 3D изображение.

В общем, серьёзный минус в Sandy Bridge видится только один – проблемы с разгоном. И если покупатели процессоров верхней ценовой категории смогут, доплатив немного, получить в своё распоряжение дружественный оверклокингу разблокированный процессор, то среди процессоров дешевле $200 таких вариантов не будет. Так что платформа LGA1155 обозначит и ещё одну тенденцию – Intel хочет ограничить возможности разгона недорогих процессоров. Впрочем, вряд ли это сильно ударит по популярности разгона как явления – приверженцев эксплуатации оборудования на пределе возможностей с радостью примет в число своих адептов компания AMD, которая в текущем году должна выпустить свой собственный, не менее эпохальный чем Sandy Bridge, продукт – Bulldozer.

Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.


Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.


Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.


Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.


Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.


Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.


За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.


Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.


В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.


Что качается разгона, то максимум чего можно добиться, так это поднятия базовой с номинальных 100 МГц до 105 МГц (+/- один-два мегагерца), чего явно будет недостаточно. Пожалуй, с таким подходом Intel энтузиасты могли бы поставить крест на платформе LGA1155, если бы не одно но — компания все же решила оставить возможность разгона своих процессоров, но только в K-серии и путем поднятия множителя, так как в них он не заблокирован (максимальный x57). Пользователи уже успели познакомиться с подобными моделями на ядрах Lynnfield и Clarkdale. Их аналогов на Sandy Bridge пока два и все они относятся к ценовому диапазону $200-300, что еще больше разочарует оверклокеров, большинство которых вряд ли смогут позволить себе такие процессоры.

Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.


Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.


Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.
Модельный ряд

Процессоры на базе новой микроархитектуры в скором времени должны будут занять все ниши, включая решения начального уровня, где сейчас господствуют продукты с разъемом LGA775. Исключением станет высокопроизводительный сегмент рынка, который отдан на откуп моделям Bloomfield и Lynnfield, хотя в конце этого года все должно будет измениться в пользу Sandy Bridge и ее производных.


На данный момент компания Intel анонсировала 29 моделей новых процессоров, из которых 14 предназначены для настольного рынка. Среди них как обычные (95 Вт), так и с пониженным энергопотреблением (модели с суффиксом S — 65 Вт, и T — 45-35 Вт). Естественно, больший интерес для значительной части пользователей представляют процессоры со стандартным уровнем TDP. Тем более, что на отечественном рынке какие-либо другие вариации встречаются крайне редко.

В представленной ниже таблице приводится список всех стандартных моделей ЦП на базе Sandy Bridge, старшие из которых уже доступны на рынке.

Intel Core i7-2600/2600K* Intel Core i5-2500/2500K* Intel Core i5-2400 Intel Core i5-2300 Intel Core i3-2120 Intel Core i3-2100
Семейство
Разъем LGA1155 LGA1155 LGA1155 LGA1155 LGA1155 LGA1155
Техпроцесс CPU, нм 32 32 32 32 32 32
Число ядер 4
(8 потоков)
4
(4 потока)
4
(4 потока)
4
(4 потока)
2
(4 потока)
2
(4 потока)
Номинальная частота, ГГц 3,4 3,3 3,1 2,8 3,3 3,1
Turbo Boost (шаг поднятия частоты в зависимости от загрузки 1/2/3/4 ядер) 4/3/2/1 4/3/2/1 4/3/2/1 4/3/2/1 - -
Объем L3 кэша, Мбайт 8 6 6 6 3 3
Графическое ядро GMA HD 2000/3000 GMA HD 2000/3000 GMA HD 2000 GMA HD 2000 GMA HD 2000 GMA HD 2000
Частота графического ядра, МГц (номинанальная/турбо-режим) 850/1350 850/1100 850/1100 850/1100 850/1100 850/1100
Каналов памяти 2 2 2 2 2 2
Поддерживаемый тип памяти DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
DDR3-1333/
1066
Hyper-Threading + - - - + +
AES-NI + + + + - -
Intel vPro +/- +/- + - - -
TDP, Вт 95 95 95 95 65 65
Рекомендованная стоимость, $ 294/317 205/216 184 177 138 117
* — множитель разблокирован на повышение.

Как видим, название серий остались прежние — Core i7, Core i5 и Core i3, но изменились номера процессоров, которые стали четырехзначными. Первая цифра обозначает второе поколение Intel Core, следующие три цифры относятся к рейтингу производительности, а суффикс, в данном случае K, означает разблокированный множитель.

В серии Core i7 пока представлены две модели с частотой 3,4 ГГц и кэш-памятью объемом восемь мегабайт. Технология Turbo Boost позволяет поднимать рабочую частоту на 1-4 шага в зависимости от количества загруженных ядер. В процессоре с разблокированным множителем используется более продвинутое видеоядро GMA HD 3000, частота которого может увеличиваться с номинальных 850 МГц до 1350 МГц. Такой ЦП оценен в 317 долларов в партиях по одной тыс. штук. Более доступное решения для энтузиастов относится к серии Core i5 и имеет номер 2500K со стоимостью порядка $216. Процессоры этого модельного ряда оснащены лишь шестью мегабайтами кэша и лишены поддержки технологии Hyper-Threading. Но как покажет наше тестирование, Sandy Bridge неплохо справляется и без нее. Как и в случае со старшими продуктами, режим Turbo Boost и графическое ядро используются аналогичные, только частота GPU может подниматься до 1100 МГц. Для менее производительных Core i5 авторазгон процессора не такой прыткий и имеет шаг 1-2-2-3 (для четырех, трех, двух и одного ядра соответственно). Самые недорогие представители нового поколения относятся к серии Core i3, обладают лишь двумя ядрами и кэш-памятью в три мегабайта, но зато поддерживают Hyper-Threading и могут обрабатывать четыре потока одновременно. Технология Turbo Boost недоступна и для компенсации низкой производительности их частота изначально высокая и стартует с отметки 3,1 ГГц. Поддержка новых инструкций AES-NI ими не предусмотрена. За такие лишения производитель назначил цену около 120-140 долларов за процессор. Осталось лишь дождаться замены нынешнему Celeron, который базируется на уже древней архитектуре пятилетней давности.

Оба они относятся к решениям для энтузиастов и рассчитаны на без проблемный разгон, благодаря разблокированному на повышение множителю. Внешне процессоры Sandy Bridge отличаются от Lynnfield и Clarkdale смещенными к краю ключами и меньшим количеством контактов на лицевой стороне подложки:

Core i7-2600K, Core i5-2500K (слева), Core i5-870 и Core i5-660 (справа)


Частота модели Core i7-2600K составляет 3,4 ГГц, но за счет технологии Turbo Boost она выше на 100 МГц. И чем меньше исполняется потоков, тем она больше растет.


При загрузке трех ядер их частота будет равна 3,6 ГГц, двух — уже 3,7 ГГц, а одного — достигнет своего максимума в 3,8 ГГц. На данный момент, это один из самых высокочастотных процессоров в активе Intel. И в будущих моделях этот предел безболезненно может быть доведен до 4,2-4,5 ГГц.


Следующий участник лишен поддержки Hyper-Threading, обладает объемом кэш-памяти шесть мегабайт и по спецификациям функционирует на 3,3 ГГц. За счет авторазгона фактическая частота, естественно, равна 3,4 ГГц.


В плане работы Turbo Boost ничего не изменилось и частота Core i5-2500K меняется с шагом 100 МГц, пока не достигнет максимальных 3,7 ГГц.


В простое процессоры функционируют на 1600 МГц, при этом напряжение питания снижается с 1,2 до 0,9 В. Во время работы авторазгона оно наоборот, немного повышается (до 1,24 В). В целом, ничего особенного и все характеристики рассматриваемых моделей полностью соответствуют спецификациям на них.

Система охлаждения

Прежде чем перейдем к разгону, стоит пару слов сказать о системах охлаждения для новых процессоров.

К нам на тестирование попали два кулера. Один из них простой, с алюминиевым радиатором и медным пяточком. Частота вращения вентилятора с ШИМ-управлением составляла около 1100-2000 об/мин. Им, вероятнее всего, будут оснащаться все представители архитектуры Sandy Bridge.



Второй охладитель — башенного типа, знакомый нам еще по шестиядерному Core i7-980X Extreme Edition, где он впервые был использован. С небольшими изменениями в его конструкции компания стала им оснащать продукты для энтузиастов прошлого поколения, и даже поставляла кулер на розничный рынок отдельной единицей по названием XTS100H.



В его конструкции применены три тепловые трубки (а не четыре, как у СО Core i7-980X), пронизывающие ряд тонких часто расположенных алюминиевых пластин. Вентилятор с ШИМ-управлением защищен проволочной решеткой и обладает скоростью 800-2600 об/мин (17-45 дБА). Для снижения уровня шума предусмотрен переключатель на крышке кулера, переводящий вентилятор в менее интенсивный режим работы — 800-1400 об/мин.


Основание кулера медное, небольших размеров, но отполировано до зеркального блеска. Крепление XTS100H к плате осуществляется за счет пластиковой усилительной пластины и четырех винтов, и оно вполне надежно.


По эффективности в номинальном режиме работы процессора Core i7-2600K данные системы охлаждения проявляют себя вполне неплохо на фоне недорогого Arctic Cooling Freezer 11 LP и даже Noctua NH-D14.


Но это касается функционирования процессора на стандартной частоте — с разгоном до 4,5-5 ГГц использовать такие кулеры, к сожалению, нельзя.

Разгон

Теперь самое интересное. Наверняка многие сталкивались с проблемой разгона процессоров архитектуры Nehalem на базе 45-нм техпроцесса, которым частоты свыше 4,2 ГГц при воздушном охлаждении давались с трудом. Но никого не удивляли 4,5 ГГц на 32-нм Clarkdale и Gulftown. Помимо самого потенциала ядра свою лепту в проблему разгона вносила высокая частота BCLK, которая получалась с младшими моделями ЦП. С Sandy Bridge повышать частоту можно лишь путем увеличения множителя, предел которого будет определяться уже возможностями процессора K-серии (максимум x57). Для достижения 4,5 ГГц достаточно будет поднять немного напряжение на ядрах, не затрагивая остальные параметры (Turbo Boost обязательно должен быть включен). Тестовые экземпляры Core i7-2600K и Core i5-2500K на такой частоте заработали при повышении напряжения до 1,28 и 1,35 В соответственно, чего вполне достаточно для режима работы системы 24/7. Прибавка еще 200 МГц потребовала увеличение напряжения до 1,3 В для старшей модели и 1,375 В для младшей. Пять гигагерц покорились лишь Core i7-2600K при 1,45 В:


Температура процессора в таком режиме с Noctua NH-D14 не превышала 78°C.

Core i5-2500K смог стабильно функционировать на 4,8 ГГц при напряжении 1,425 В (температура не выходила за рамки 71 градуса по Цельсию) — если младшие все такие, то для серьезных экспериментов с разгоном он явно не подходит.


Для достижения еще большего уровня разгона Sandy Bridge в обязательном порядке необходимо активировать в BIOS/UEFI материнских плат опцию Internal PLL Overvoltage. Можно также попытаться поднять различные напряжения питания. Максимально безопасное для процессора составляет 1,52 В (но есть мнение, что выше 1,38-1,4 В для режима 24/7 использовать не рекомендуется), для «системного агента» — 0,971 В, модулей памяти — 1,57 В. Параметр VCCIO (или Vtt — напряжение на контроллере памяти) позволяет добиться стабильности при работе с высокочастотной памятью, но выше 1,1 В поднимать не рекомендуется. CPU PLL ограничен 1,89 В, а графическое ядро, как и процессорное, может довольствоваться 1,52 В.

Помимо разгона процессора можно увеличить частоту памяти, причем, без каких-либо танцев с бубном, как того требовалось ранее. Достаточно выбрать необходимый режим и, возможно, немного поднять напряжение на контроллере.


Но у этой медали есть и обратная сторона. Так как предел разгона по базовой составляет около 105 МГц, определить максимальную конкретно возможную частоту теперь будет сложно. Придется либо ограничиваться фиксированными режимами, либо подбирать BCLK в пределах 100-105 МГц, что даст прибавку по 20 МГц на каждый мегагерц сверх номинала, что не так уж и много.
Тестовые конфигурации

Для сравнения производительности новых процессоров с решениями прошлого поколения и конкурентами была собрана следующая система:

  • материнская плата: ASUS P8P67 Deluxe (Intel P67 Express, EFI 1053);
  • память: Kingston KHX2000C8D3T1K3/6GX (3x2 ГБ, DDR3-2000@1333, 8-8-8-24-1T);
  • кулер: Noctua NH-D14;
  • видеокарта: ASUS ENGTX580/2DI/1536MD5 (GeForce GTX 580);
  • жесткий диск: Seagate ST3500418AS (500 ГБ, 7200 об/мин, SATAII);
  • блок питания: Seasonic SS-600HM (600 Вт);
  • операционная система: Windows 7 Home Premium x64;
  • драйвер чипсета: Intel Chipset Software Installation Utility 9.2.0.1019;
  • драйвер видеокарты: GeForce 263.09.
В операционной системе брандмауэр, UAC и Windows Defender отключались, файл подкачки устанавливался в размере 4096 МБ. Настройки видеодрайвера не изменялись. Память работала на частоте 1333 МГц с задержками 8-8-8-24-1T. Остальные настройки в UEFI материнской платы оставлялись по умолчанию.

Конфигурации остальных участников отличались процессорами, материнскими платами и, по необходимости, памятью. Для платформы LGA1366 она была следующая:

  • процессор: Intel Core i7-975 EE (3,33 ГГц, 8 Мбайт кэш);
  • материнская плата: ASUS Sabertooth X58 (Intel X58 Express, BIOS 0603).
Платформа LGA1156 комплектовалась таким оборудованием:
  • процессор: Intel Xeon X3470 (взамен Core i7-870; 2,93 ГГц, 8 МБайт кэш);
  • процессор: Intel Core i5-660 (3,33 ГГц, 4 Мбайт кэш);
  • материнская плата: ASUS Maximus III Extreme (Intel P55 Express, BIOS 1204).
Конкурирующий лагерь отстаивал честь следующим:
  • процессор: AMD Phenom II X6 1100T (3,3 ГГц, 6 МБайт кэш);
  • процессор: AMD Phenom II X6 1075T (3,0 ГГц, 6 МБайт кэш);
  • материнская плата: ASUS Crosshair IV Extreme (AMD 890FX, BIOS 0502);
  • память: Goodram Play GY1600D364L8/4GDC (2x2 ГБ, DDR3-1600@1333, 8-8-8-24-1T).
Такой выбор процессоров обусловлен как наличием их на момент тестирования, так и ценовым позиционированием каждой из моделей. Так, стоимость Core i7-2600K (а значит и обычной версии) почти соответствует Core i7-870, а с Core i5-2500K конкурируют Core i5-660 и AMD Phenom II X6 1075T. Модель Phenom II X6 1100T является флагманом компании AMD и занимает среднее положение между линейками Core i7 и Core i5.

Все процессоры тестировались как в номинальном режиме (частота Uncore у Core i7-975 EE составляла 2940 МГц) со всеми включенными технологиями, такими как Hyper-Threading, Turbo Boost и Turbo Core, так и при разгоне до 3,8 ГГц с отключенными функциями авторазгона. Частота памяти всегда держалась на уровне 1333 МГц, представитель AMD разгонялся лишь один, так как разницы при этом между ними фактически не было бы:

  • Core i7-2600K — частота процессора 3800 МГц (38x100), память 1333 МГц (10x133);
  • Core i5-2500K — частота процессора 3800 МГц (38x100), память 1333 МГц (10x133);
  • Core i7-975 EE — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3114 МГц (18x173), память 1384 МГц (8x173);
  • Core i7-870 — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3114 МГц (18x173), память 1384 МГц (8x173);
  • Core i5-660 — частота процессора 3806 МГц (22x173), Uncore 3114 МГц (18x173), QPI 3806 МГц (22x173), память 1384 МГц (8x173);
  • Phenom II X6 1100T — частота процессора 3813 МГц (15,5x246), NB и HT 2214 МГц (9x246), память 1311 МГц (5,33x246).
Результаты тестирования в прикладном ПО

Подсистема памяти




Судя по результатам в программе Aida64 контроллер памяти Sandy Bridge действительно был переработан и демонстрирует высокую производительность, особенно в тесте на запись. Копирование данных происходит быстрее у старшей модели, а Core i5-2500K в этом случае близок по показателям к процессорам предыдущего поколения.


Обойти по латентности контроллер Lynnfield пока не удалось, но разница при стандартном режиме работы минимальна и больше проявляется уже с разгоном. И скорее всего, она будет расти с дальнейшим повышением частоты. Но учитывая потенциал новинок, на это обращать особо не стоит.

Синтетика


В PCMark Vantage рассматриваемые процессоры превосходят своих предшественников. Даже урезанный Sandy Bridge оказался производительнее бывшего флагмана компании Intel. Также достойно себя ведет Core i5-660, хотя в большинстве тестов этого пакета результатами он не блистал. Например, в игровом он хуже остальных решений компании на 20-40%.


Но за счет поддержки инструкций AES-NI в тесте Communications он почти на равных соперничает с двухтысячными моделями.


Отсюда такой высокий итоговый балл. Отметим небольшой проигрыш Core i5-2500K в игровом тесте.

Архивирование



Тестирование в архиваторах осуществлялось путем сжатия папки с различными файлами общим объемом 600 Мбайт. Оба новых процессора демонстрируют чудеса производительности. Двухъядерник Clarkdale не очень приспособлен к такой работе и результат приходится ждать в 1,5 раза дольше, чем с остальными участниками.

Рендеринг



В однопроцессороном тесте Cinebench 11 видна вся мощь архитектуры Sandy Bridge, но с переходом к многопоточному вычислению младший представитель начинает сдавать позиции, хотя и не значительно — он совсем немного отстает от более дорогого Core i7-870. Решения AMD, до этого находившиеся в тени, неожиданно вырвались вперед за счет своих шести ядер.



С POV-Ray такая же ситуация, и чем больше ядер у процессора, тем он производительнее в программе рендеринга.

Математические расчеты


Расчет количества ходов в Fritz Chess Benchmark также зависит от количества ядер или исполняемых потоков и Core i5-2500K опять отстает от Lynnfield. Его даже умудряется обойти Phenom II X6 1075T, и с разгоном разница между ними только увеличивается, вплоть до 16%.



Еще один хорошо оптимизированный под многопоточность бенчмарк. Лидеров в wPrime как таковых нет — все высокоуровневые процессоры обоих производителей показывают одинаковые результаты, которые зависят от частоты той или иной модели. Лишенный Hyper-Threading Sandy Bridge опять отстает, но не так сильно, как Core i5-660.

Работа с видео


Интересная картина наблюдается в x264 HD Benchmark, который производит двухпроходное сжатие видеофайла кодеком H.264. Первый проход на дух не переваривает Hyper-Threading и без этой технологии результат обычно выше, что мы и наблюдаем с Core i5-2500K.


Второй проход наоборот, требует как можно больше вычислительных ядер и полноценный новичок забирает заслуженную пальму первенства назад. Продукты AMD в этом тесте ни чуть не хуже конкурентов. Перспективы Clarkdale на фоне решений новой архитектуры кажутся туманными — им явно осталось на рынке совсем недолго.
Результаты тестирования в игровых приложениях

Синтетика



Теперь перейдем к игровым тестам, начав с синтетики. В 3DMark Vantage расстановка сил была предсказуема, учитывая его оптимизацию под многоядерность. Core i7-2600K безоговорочный лидер, вслед за ним расположились продукты на базе архитектуры Nehalem. Нынешний флагман AMD соперничает лишь с новым четырехъядерником Core i5, немного отставая от него. Но с разгоном они выступают почти вровень.


Новый тест на наших страницах показывает неоднозначные результаты — новинки проигрывают своим предшественникам до 3%. В чем же дело? Почему же 3DMark 11 так не благосклонен к ним? Смотрим на результаты процессорного теста Physics. В нем все закономерно и ничего нового мы не видим.


А вот в графическом подтесте наблюдается падение производительности системы на базе Sandy Bridge, и она пасует даже перед Core i5-660, во что очень трудно поверить.


Возможно, проблема заключается в реализации интерфейса PCI Express или еще чего-нибудь и в будущих версиях тестового пакета или драйверов она будет решена. Пока же можем отметить первое поражение представителей платформы LGA1155.

Игры



В реальных игровых приложениях, например, Crysis, двухтысячные модели смотрятся более привлекательно, особенно, когда 200-долларовый Core i5-2500K не хуже дорогих Lynnfield и Bloomfield.



Стратегия реального времени World in Conflict оказалась не менее чувствительной к новинкам. На фоне таких результатов покупка устаревших решений себя не оправдает. Если, конечно, они прилично не подешевеют.



S.T.A.L.K.E.R.: Call of Pripyat сильно зависит от частоты процессора и емкости его кэша. Если в номинале Core i5-2500K обходит на десяток кадров Core i7-870, то с разгоном последний берет реванш. Но ведь Lynnfield не сможет без проблем работать на частотах 4,5 ГГц, а то и выше, не так ли?

Выводы

Проведя колоссальную работу над ошибками, компания Intel представила микроархитектуру Sandy Bridge с огромным потенциалом, решения на базе которой отличаются высокой производительностью и экономичностью. И хотя ничего революционного в ней нет, именно с нее начнется новый виток развития процессорного рынка. Высокая интеграция и низкий уровень энергопотребления станут неотъемлемой частью будущих продуктов, обрастающих все большим функционалом, что невольно мы уже замечаем сейчас.

Процессоры Sandy Bridge, несмотря на свою среднюю стоимость, предлагают нам новый уровень производительности, ранее доступный лишь с топовыми решениями. Благодаря переработанному контроллеру памяти и некоторым архитектурным изменениям удалось избавиться от многих ограничивающих факторов, сдерживающих дальнейшее развитие архитектуры Nehalem. Но платой за это стала необходимость в новой платформе с разъемом LGA1155, несовместимой с ранее выпущенными решениями. Несмотря на всю привлекательность Sandy Bridge переход на нее с LGA1156 или даже LGA1366 вряд ли оправдает затраты, но она даст возможность наконец-то избавиться от древней LGA775 или же перейти из конкурирующего лагеря. Тем более, что новинка действительно того стоит.

Помимо процессорного ядра было усовершенствовано графическое, расположенное теперь на одном кристалле с остальными блоками. Его функциональность и производительность позволяет конкурировать с дискретными картами начального уровня серии GeForce и Radeon. Пользователям теперь не придется задумываться о покупке недорого адаптера, когда возможности встроенного сильно ограничены.

Энтузиасты оценят разгонный потенциал процессоров на базе очередной микроархитектуры, который благодаря использованию 32-нм техпроцесса вырос до 4,5-5,0 ГГц и выше. Такие частоты доступны при воздушном охлаждении и небольшом повышении питающего напряжения. Для подобных подвигов ранее необходимо было прибегнуть к усиленному охлаждению и серьезному увеличению напряжения питания.

Но какой бы ни была идеальной новая платформа, определенный недостаток в ней обязательно найдется. И в данном случае он касается энтузиастов. Разгонять процессоры теперь можно определенной серии с разблокированным множителем, а не любой, как это было ранее. И все бы ничего, если бы не их стоимость, которая пока находится в пределах 250-350 долларов, что не каждому оверклокеру будет по карману. Здесь явно не хватает более доступной модели, позволяющей экономным энтузиастам, коих большинство, безболезненно перейти на новую платформу.
— процессоры Intel Core i7-2600K, Core i5-2500K, Core i7-975 EE, Xeon X3470 и Core i5-660;

  • Kingston — память Kingston KHX2000C8D3T1K3/6GX;
  • Noctua — кулер Noctua NH-D14 и термопаста Noctua NT-H1;
  • Syntex — блок питания Seasonic SS-600HM;
  • Wilk Elektronik — память Goodram Play GY1600D364L8/4GDC.
  • В эти дни компания Intel представляет миру долгожданные процессоры Sandy Bridge , архитектура которых заранее была окрещена как революционная. Но не только процессоры стали новинками этих дней, а и все сопутствующие компоненты новых настольной и мобильной платформ.

    Итак, на этой неделе анонсировано аж 29 новых процессоров, 10 чипсетов и 4 беспроводных адаптера для ноутбуков и настольных рабочих и игровых компьютеров.

    К мобильным новинкам относятся:

      процессоры Intel Core i7-2920XM, Core i7-2820QM, Core i7-2720QM, Core i7-2630QM, Core i7-2620M, Core i7-2649M, Core i7-2629M, Core i7-2657M, Core i7-2617M, Core i5-2540M, Core i5-2520M, Core i5-2410M, Core i5-2537M, Core i3-2310M;

      чипсеты Intel QS67, QM67, HM67, HM65, UM67 Express;

      беспроводные сетевые контроллеры Intel Centrino Advanced-N + WiMAX 6150, Centrino Advanced-N 6230, Centrino Advanced-N 6205, Centrino Wireless-N 1030.

    В настольном же сегменте появятся:

      процессоры Intel Core i7-2600K, Core i7-2600S, Core i7-2600, Core i5-2500K, Core i5-2500S, Core i5-2500T, Core i5-2500, Core i5-2400, Core i5-2400S, Core i5-2390T, Core i5-2300;

      чипсеты Intel P67, H67, Q67, Q65, B65 Express.

    Но сразу же стоит отметить, что анонс новой платформы не является одночастным для всех моделей процессоров и чипсетов – с начала января доступны только решения класса «майнстрим», а большинство более массовых и не таких дорогих появятся в продаже немного позднее. Вместе с выпуском настольных процессоров Sandy Bridge представлен и новый процессорный разъем для них LGA 1155 . Таким образом, новинки не дополняют модельный ряд Intel Core i3/i5/i7, а являются заменой для процессоров под LGA 1156, большинство из которых теперь становятся совсем неперспективным приобретением, ибо в ближайшее время их выпуск вообще должен прекратиться. И только для энтузиастов до конца года Intel обещает продолжать выпуск старших четырехъядерных моделей на ядре Lynnfield.

    Однако, судя по «роадмапу» платформа долгожитель Socket T (LGA 775) все еще будет оставаться актуальной как минимум до середины года, являясь основой для систем начального уровня. Для наиболее же производительных игровых систем и настоящих энтузиастов до конца года будут актуальны процессоры на ядре Bloomfield по разъем LGA 1366. Как видим, жизненный цикл двухъядерных процессоров с «интегрированным» графическим адаптером на ядре Clarkdale оказался очень коротки, всего один год, но именно они «протоптали» дорожку для представленных «сегодня» Sandy Bridge, приучив потребителя к мысли, что в процессоре может быть интегрирован не только контроллер памяти, а и видеокарта. Теперь же пришло время не просто выпустить более быстрые версии подобных процессоров, серьезно обновить архитектуру, чтобы обеспечить заметное увеличение их эффективности.

    Ключевыми особенностями процессоров архитектуры Sandy Bridge являются:

      выпуск с соблюдением 32 нм техпроцесса;

      заметно увеличившаяся энергоэффективность;

      оптимизированная технология Intel Turbo Boost и поддержка Intel Hyper-Threading;

      значительное увеличение производительности встроенного графического ядра;

      реализация нового набора инструкций Intel Advanced Vector Extension (AVX) для ускорения обработки вещественных чисел.

    Но все вышеуказанные нововведения не обеспечивали бы возможности говорить о действительно новой архитектуре, если бы все это не было реализовано теперь в пределах одного ядра (кристалла), в отличие от процессоров на ядре Clarkdale.

    Естественно, чтобы все узлы процессора заработали согласовано, нужно было организовать быстрый обмен информацией между ними – важным архитектурным нововведением стала кольцевая шина Ring Interconnect.

    Объединяет же Ring Interconnect через кэш-память L3, теперь называемую LLC (Last Level Cache), процессорные ядра, графическое ядро и системный агент (System Agent), включающий в себя контроллер памяти, контроллер шины PCI Express, контроллер DMI, модуль управления питанием и другие контроллеры и модули, ранее имеющие объединенные названием «uncore».

    Кольцевая шина Ring Interconnect является следующим этапом развития шины QPI (QuickPath Interconnect), которая после «обкатки» в серверных процессорах с обновленной 8-ядерной архитектурой Nehalem-EX, перекочевала и в ядро процессоров для настольных и мобильных систем. Посредством Ring Interconnect образуются четыре 32-разрядных кольца для шин Данных (Data Ring), Запросов (Request Ring), Мониторинга состояния (Snoop Ring) и Подтверждения (Acknowledge Ring). Функционирует кольцевая шина на частоте ядер, поэтому её пропускная способность, задержки и энергопотребление полностью зависят от частоты работы вычислительных блоков процессора.

    Кэш-память третьего уровня (LLC - Last Level Cache) является общей для всех вычислительных ядер, графического ядра, системного агента и других блоков. При этом графический драйвер определяет какие потоки данных разместить в кэш-памяти, но и любой другой блок может получить доступ ко всем данным в LLC. Специальный механизм контролирует распределение кэш-памяти, чтобы не возникло коллизий. В целях ускорения работы для каждого из процессорных ядер выделен «свой» сегмент кэш-памяти, к которому оно имеет прямой доступ. Каждый такой сегмент включает независимый контроллер доступа к шине Ring Interconnect, но при этом ведется постоянное взаимодействие с системным агентом, который производит общее управление кэш-памятью.

    Системный агент (System Agent), по сути, является встроенным в процессор «северным мостом» и объединяет контроллеры шин PCI Express, DMI, оперативной памяти, блок обработки видео (медиапроцессор и управление интерфейсами), диспетчер питания и другие вспомогательные блоки. С остальными узлами процессора системный агент взаимодействует через кольцевую шину. Кроме упорядочения потоков данных, системный агент следит за температурой и загрузкой различных блоков, и через Power Control Unit обеспечивает управление напряжением питания и частотами, дабы обеспечить наилучшую энергоэффективность при высокой производительности. Здесь же можно отметить, что для питания новых процессоров нужно трехкомпонентный стабилизатор питания (или двух, если встроенное видеоядро останется неактивным) – отдельно для вычислительных ядер, системного агента и интегрированной видеокарты.

    Встроенная в процессор шина PCI Express соответствует спецификации 2.0 и насчитывает 16 линий для возможности увеличения мощности графической подсистемы при помощи мощного внешнего 3D-ускорителя. В случае использования старших наборов системной логики и согласования лицензионных вопросов эти 16 линий могут быть разделены на 2 или три слота в режимах 8x+8x или 8x+4x+4x соответственно для NVIDIA SLI и/или AMD CrossFireX.

    Для обмена данными с системой (накопителями, портами ввода-вывода, периферией, контроллеры которых находятся в чипсете) используется шина DMI 2.0, позволяющая прокачать до 2 ГБ/с полезной информации в обоих направлениях.

    Важной частью системного агента является встроенный в процессор двухканальный контроллер памяти DDR3, номинально поддерживающий модули на частоте 1066-1333 МГц, но при использовании в материнских платах на чипсете Intel P67 Express без проблем обеспечивающий функционирование модулей на частоте до 1600 и даже 2133 МГц. Размещение контроллера памяти в одном кристалле с процессорными ядрами (ядро Clarkdale состояло из двух кристаллов) должно уменьшить латентность памяти и, соответственно, увеличить производительность системы.

    Отчасти благодаря расширенному мониторингу параметров всех вычислительных ядер, кэш-памяти и вспомогательных блоков, который реализован в Power Control Unit, в процессорах Sandy Bridge появилась усовершенствованная технология Intel Turbo Boost 2.0. Теперь, в зависимости от нагрузки и выполняемых задач, ядра процессора при высокой необходимости могут ускоряться даже с превышением теплового пакета, как при обычном ручном разгоне. Но системный агент будет следить за температурой процессора и его компонентов, и когда будет зафиксирован «перегрев» частоты узлов будут постепенно уменьшаться. Однако в настольных процессорах лимитировано время работы в сверхускоренном режиме, т.к. здесь значительно легче организовать в разы более эффективное охлаждение, чем «боксовый» кулер. Такой «овербуст» позволит получить прибавку производительности в критичные для системы моменты, что должно создать у пользователя впечатление работы с более мощной системой, а также уменьшить время ожидания реакции системы. Также Intel Turbo Boost 2.0 гарантирует, что и в настольных компьютерах встроенное видеоядро имеет динамическую производительность.

    Архитектура процессоров Sandy Bridge подразумевает не только изменения в структуре межкомпонентного взаимодействия и улучшение возможностей и энергоэффективности этих компонентов, но и внутренние изменения в каждом вычислительном ядре. Если отбросить «косметические» улучшения, то наиболее важными окажутся следующие:

      возврат к выделению кэш-памяти для примерно 1,5 тысяч декодированных микроопераций L0 (использовался в Pentium 4), являющейся обособленной частью L1, что позволяет одновременно обеспечить более равномерную загрузку конвейеров и снизить энергопотребление вследствие увеличения пауз в работе достаточно сложных схем декодеров операций;

      повышение эффективности блока предсказания ветвлений вследствие увеличение емкости буферов адресов результатов ветвления, истории команд, истории ветвлений, что увеличило эффективность конвейеров;

      увеличение емкости буфера переупорядоченных команд (ROB - ReOrder Buffer) и повышение эффективности этой части процессора благодаря внедрению физического регистрового файла (PRF – Physical Register File, тоже характерной особенности Pentium 4) для хранения данных, а также расширение других буферов;

      удвоение емкости регистров для работы с потоковыми вещественными данными, что в ряде случаев может обеспечить в два раза большую скорость выполнения операций, их использующих;

      увеличение эффективности исполнения инструкций шифрования для алгоритмов AES, RSA и SHA;

      введение новых векторных инструкций Advanced Vector Extension (AVX);

    • оптимизацию работы кэш-памяти первого L1 и второго L2 уровней.

    Важной особенностью графического ядра процессоров Sandy Bridge является то, что оно теперь находится в одном кристалле с остальными блоками, а управление его характеристиками и слежение за состоянием выполняет на аппаратном уровне системный агент. При этом блок обработки медиаданных и формирования сигналов для видеовыходов вынесен в этот самый системный агент. Такая интеграция обеспечивает более тесное взаимодействие, меньшие задержки, большую эффективность и т.д.

    Однако самой архитектуре графического ядра не так много изменений, как того хотелось бы. Вместо ожидаемой поддержки DirectX 11 была просто добавлена поддержка DirectX 10.1. Соответственно и не многие приложения с поддержкой OpenGL ограничены аппаратной совместимостью только с 3-й версией спецификации этого свободного API. При этом, хотя и говорится об усовершенствовании вычислительных блоков, но их осталось столько же – 12, и то только для старших процессоров. Однако увеличение тактовой частоты до 1350 МГц обещает заметный прирост производительности в любом случае.

    С другой стороны, создать встроенное видеоядро с действительно высокой производительностью и функциональностью для современных игр при невысоком его энергопотреблении очень тяжело. Поэтому отсутствие поддержки новых API повлияет лишь на совместимость с новыми играми, а производительность при действительно большом желании комфортно играть нужно будет наращивать с помощью дискретного 3D-ускорителя. А вот расширение функциональности при работе с мультимедийными данными, в первую очередь при кодировании и декодировании видео в рамках Intel Clear Video Technology HD, можно причислить к достоинствам Intel HD Graphics II (Intel HD Graphics 2000/3000).

    Обновленный медиапроцессор позволяет разгрузить процессорные ядра при кодировании видео в форматах MPEG2 и H.264, а также расширяет набор пост-процессинговых функций аппаратной реализацией алгоритмов для автоматической подстройки контрастности изображения (ACE – Adaptive Contrast Enhancement), корректировки цветов (TCC – Total Color Control) и улучшения отображения кожи (STE – Skin Tone Enhancement). Повышает перспективность использования встроенной видеокарты реализованная поддержка интерфейса HDMI версии 1.4, совместимой с Blu-ray 3D (Intel InTru 3D).

    Все выше перечисленные архитектурные особенности обеспечивают новому поколению процессоров заметное превосходство по быстродействию над моделями предыдущего поколения, как в вычислительных задачах, так и при работе с видео.

    В итоге платформа Intel LGA 1155 становится более производительной и функциональной, приходя на смену LGA 1156.

    Если подытожить, то процессоры семейства Sandy Bridge спроектированы для решения очень широкого круга задач при высокой энергоэффективности, что должно их сделать действительно массовыми в новых производительных системах, особенно когда в продаже появятся более доступные модели в широком ассортименте.

    В ближайшее время постепенно покупателям станут доступны 8 процессоров для настольных систем разного уровня: Intel Core i7-2600K, Intel Core i7-2600, Intel Core i5-2500K, Intel Core i5-2500, Intel Core i5-2400, Intel Core i5-2300, Intel Core i3-2120 и Intel Core i3-2100. Модели с индексом K отличаются свободным множителем и более быстрым встроенным видеоадаптером Intel HD Graphics 3000.

    Также для критичных к энергопотреблению систем выпущены энергоэффективные (индекс S) и высокоэнергоэффективные (индекс T) модели.

    Для поддержки новых процессоров уже сегодня доступны материнские платы на чипсетах Intel P67 Express и Intel H67 Express, в а недалеком будущем ожидаются на Intel Q67 Express и Intel B65 Express, ориентированные на корпоративных пользователей и малый бизнес. Все эти чипсеты наконец-то начали поддерживать накопители с интерфейсом SATA 3.0, хотя и не всеми портами. А вот поддержки, казалось бы даже более востребованной шины USB 3.0 в них нет. Интересными особенностями новых чипсетов для обычных материнских плат стало то, что в них отказались от поддержки шины PCI. Кроме того, теперь тактовый генератор встроен в чипсет и управлять его характеристиками без последствий для стабильности работы системы можно лишь в очень небольшом диапазоне, если повезет то всего ±10 МГц, а на практике и того меньше.

    Также нужно отметить, что разные чипсеты оптимизированы под использование с разными процессорами в системах, предназначенных для различных целей. То есть Intel P67 Express от Intel H67 Express отличается не только отсутствием поддержки работы со встроенным видео, но и расширенными возможностями для «оверклокинга» и тюнинга производительности. В свою очередь Intel H67 Express вообще не замечает свободный множитель у моделей с индексом K.

    А ведь вследствие архитектурных особенностей, разгон процессоров Sandy Bridge пока возможен только с помощью множителя, если это модель K-серии. Хотя к некоторой оптимизации и «овербусту» склонны все модели.

    Таким образом, временно для создания иллюзии работы на очень мощном процессоре даже модели с заблокированным множителем способны на заметное ускорение. Время такого ускорения для настольных систем, как было упомянуто выше, ограничено аппаратно, а не только температурой, как в мобильных ПК.

    После представления всех архитектурных особенностей и нововведений, а также обновленных фирменных технологий, остается только еще раз просуммировать, чем же Sandy Bridge такие инновационные и напомнить о позиционировании.

    Для высокопроизводительных и массовых производительных систем в ближайшее время можно будет купить процессоры серий Intel Core i7 и Intel Core i5, которые между собой отличаются поддержкой технологии Intel Hyper-Threading (для четырехъядерных моделей Intel Core i5 она отключена) и объемом кэш-памяти третьего уровня. Для более экономных покупателей представлены новые модели Intel Core i3, которые имеют в 2 раза меньше вычислительных ядер, хоть и с поддержкой Intel Hyper-Threading, всего 3 МБ кэш-памяти LLC, не поддерживают Intel Turbo Boost 2.0 и все укомплектованы Intel HD Graphics 2000.

    В середине года для массовых систем будут представлены процессоры Intel Pentium (от этого бренда очень тяжело отказаться, хотя еще год назад это пророчили) на основе очень упрощенной архитектуры Sandy Bridge. Фактически эти процессоры для «рабочих лошадок» будут напоминать по возможностям еще вчера актуальные Core i3-3xx на ядре Clarkdale, т.к. практически всех функций, присущих старшим моделям для LGA 1155, они лишатся.

    Остается отметить, что выпуск процессоров Sandy Bridge и целой настольной платформы LGA 1155 стал очередным «Так» в рамках концепции Intel «Тик-Так», т.е. серьезным обновлением архитектуры для выпуска по уже отлаженному 32 нм техпроцессу. Примерно через год нас будут ждать процессоры Ivy Bridge с оптимизированной архитектурой и выполненные по 22 нм техпроцессу, которые, наверняка, снова будут иметь «революционную энергоэффективность», но, надеемся, не упразднят процессорный разъем LGA 1155. Что ж, подождем – увидим. А пока у нас есть минимум год на изучение архитектуры Sandy Bridge и её всестороннее тестирование, к чему и собираемся приступить уже в ближайшие дни .

    Статья прочитана 14627 раз(а)

    Подписаться на наши каналы

    Практически всегда под любой публикацией, в которой так или иначе затрагивается тема производительности современных интеловских процессоров, рано или поздно появляется несколько сердитых читательских комментариев о том, что прогресс в развитии чипов у Intel давно забуксовал и нет смысла переходить со «старого доброго Core i7-2600K» на что-то новое. В таких репликах, скорее всего, будет раздражённо упоминаться про прирост производительности на неосязаемом уровне «не более пяти процентов в год»; про низкокачественный внутренний термоинтерфейс, который непоправимо испортил современные процессоры Intel; либо про то, что покупать в современных условиях процессоры с таким же, как и несколько лет назад, количеством вычислительных ядер вообще - удел недальновидных дилетантов, так как в них нет необходимого задела на будущее.

    В том, что все такие реплики не лишены оснований, сомнений нет. Однако очень похоже, что они многократно преувеличивают имеющиеся проблемы. Лаборатория 3DNews подробно тестирует интеловские процессоры с 2000 года, и мы не можем согласиться с тезисом, что какому бы то ни было их развитию пришёл конец, а происходящее с микропроцессорным гигантом в течение последних лет иначе как стагнацией уже и не назовёшь. Да, какие-то кардинальные перемены с процессорами Intel происходят редко, но тем не менее они продолжают планомерно совершенствоваться. Поэтому те чипы серии Core i7, которые можно купить сегодня, заведомо лучше моделей, предлагавшихся несколько лет тому назад.

    Поколение Core Кодовое имя Техпроцесс Этап разработки Время выхода
    2 Sandy Bridge 32 нм Так (Архитектура) I кв. 2011
    3 Ivy Bridge 22 нм Тик (Процесс) II кв. 2012
    4 Haswell 22 нм Так (Архитектура) II кв. 2013
    5 Broadwell 14 нм Тик (Процесс) II кв. 2015
    6 Skylake 14 нм Так
    (Архитектура)
    III кв. 2015
    7 Kaby Lake 14+ нм Оптимизация I кв. 2017
    8 Coffee Lake 14++ нм Оптимизация IV кв. 2017

    Собственно, этот материал как раз и является контраргументом для рассуждений о никчёмности выбранной Intel стратегии постепенного развития потребительских CPU. Мы решили собрать в одном тесте старшие интеловские процессоры для массовых платформ за последние семь лет и посмотреть на практике, насколько представители серий Kaby Lake и Coffee Lake ушли вперёд относительно «эталонных» Sandy Bridge, которые за годы гипотетических сравнений и мысленных противопоставлений в представлении обывателей стали настоящей иконой процессоростроения.

    ⇡ Что поменялось в процессорах Intel c 2011 года по настоящее время

    Отправной точкой в новейшей истории развития процессоров Intel принято считать микроархитектуру Sandy Bridge . И это неспроста. Несмотря на то, что первое поколение процессоров под маркой Core было выпущено в 2008 году на базе микроархитектуры Nehalem, почти все основные черты, которые присущи современным массовым CPU микропроцессорного гиганта, вошли в обиход не тогда, а парой лет позднее, когда распространение получило следующее поколение процессорного дизайна, Sandy Bridge.

    Сейчас компания Intel приучила нас к откровенно неторопливому прогрессу в разработке микроархитектуры, когда нововведений стало очень мало и они почти не приводят к росту удельной производительности процессорных ядер. Но всего лишь семь лет назад ситуация была кардинально иной. В частности, переход от Nehalem к Sandy Bridge был ознаменован 15-20-процентным ростом показателя IPC (числа исполняемых за такт инструкций), что обуславливалось глубокой переделкой логической конструкции ядер с прицелом на повышение их эффективности.

    В Sandy Bridge были заложены многие принципы, которые с тех пор не менялись и стали стандартными для большинства процессоров сегодняшнего дня. Например, именно там появился отдельный кеш нулевого уровня для декодированных микроопераций, а также стал применяться физический регистровый файл, снижающий энергозатраты при работе алгоритмов внеочередного выполнения инструкций.

    Но, пожалуй, самым главным нововведением стало то, что Sandy Bridge был спроектирован как унифицированная система-на-чипе, рассчитанная одновременно на все классы применений: на серверные, десктопные и мобильные. Скорее всего, в прадедушки современных Coffee Lake общественное мнение поставило именно его, а не какой-нибудь Nehalem и уж тем более не Penryn, именно из-за этой особенности. Впрочем, и итоговая сумма всех переделок в глубинах микроархитектуры Sandy Bridge тоже оказалась весьма значительной. В конечном итоге этот дизайн утратил все старые родственные связи с P6 (Pentium Pro), которые то здесь, то там проявлялись во всех предшествующих процессорах Intel.

    Говоря об общей структуре, нельзя также не вспомнить и о том, что в процессорный кристалл Sandy Bridge впервые в истории интеловских CPU было встроено полноценное графическое ядро. Этот блок отправился внутрь процессора вслед за контроллером DDR3-памяти, разделяемым L3-кешем и контроллером шины PCI Express. Для соединения вычислительных ядер и всех остальных «внеядерных» частей инженеры Intel внедрили в Sandy Bridge новую на тот момент масштабируемую кольцевую шину, применяемую для организации взаимодействия между структурными единицами в последующих массовых CPU и по сей день.

    Если же опуститься на уровень микроархитектуры Sandy Bridge, то одной из ключевых её особенностей стала поддержка семейства SIMD-инструкций, AVX, предназначенных для работы с 256-битными векторами. К настоящему моменту такие инструкции прочно вошли в обиход и не кажутся чем-то необычным, но их реализация в Sandy Bridge потребовала расширения части вычислительных исполнительных устройств. Инженеры Intel стремились сделать работу с 256-битными данными такой же быстрой, как и с векторами меньшей разрядности. Поэтому вместе с реализацией полноценных 256-битных исполнительных устройств потребовалось и увеличение скорости работы процессора с памятью. Логические исполнительные устройства, предназначенные для загрузки и сохранения данных, в Sandy Bridge получили удвоенную производительность, кроме того, симметрично была увеличена пропускная способность кеш-памяти первого уровня при чтении.

    Нельзя не упомянуть и о сделанных в Sandy Bridge кардинальных изменениях в работе блока предсказания ветвлений. Благодаря оптимизациям в применяемых алгоритмах и увеличению размеров буферов, архитектура Sandy Bridge позволила сократить процент неверных предсказаний переходов почти вдвое, что не только заметно сказалось на производительности, но и позволило дополнительно снизить энергопотребление этого дизайна.

    В конечном итоге с сегодняшних позиций процессоры Sandy Bridge можно было бы назвать образцово-показательным воплощением фазы «так» в интеловском принципе «тик-так». Как и предшественники, данные процессоры продолжили базироваться на техпроцессе с 32-нм нормами, но предложенный ими рост производительности оказался более чем убедителен. И подпитывала его не только обновлённая микроархитектура, но и увеличенные на 10-15 процентов тактовые частоты, а также внедрение более агрессивной версии технологии Turbo Boost 2.0. Если учесть всё это, хорошо понятно, почему многие энтузиасты до сих пор вспоминают Sandy Bridge самыми тёплыми словами.

    Старшим предложением в семействе Core i7 на момент выхода микроархитектуры Sandy Bridge стал Core i7-2600K. Этот процессор получил тактовую частоту на уровне 3,3 ГГц с возможностью авторазгона при неполной нагрузке до 3,8 ГГц. Впрочем, отличали 32-нм представителей Sandy Bridge не только сравнительно высокие для того времени тактовые частоты, но и хороший разгонный потенциал. Среди Core i7-2600K нередко можно было встретить экземпляры, способные работать на частотах 4,8-5,0 ГГц, что во многом обуславливалось применением в них качественного внутреннего термоинтерфейса - бесфлюсового припоя.

    Через девять месяцев после выпуска Core i7-2600K, в октябре 2011 года, компания Intel обновила старшее предложение в модельном ряду и предложила немного ускоренную модель Core i7-2700K, номинальная частота которой была доведена до 3,5 ГГц, а максимальная частота в турборежиме - до 3,9 ГГц.

    Впрочем, жизненный цикл Core i7-2700K оказался коротким - уже в апреле 2012 года на смену Sandy Bridge пришёл обновлённый дизайн Ivy Bridge . Ничего особенного: Ivy Bridge относился к фазе «тик», то есть представлял собой перевод старой микроархитектуры на новые полупроводниковые рельсы. И в этом отношении прогресс действительно был серьёзным - кристаллы Ivy Bridge производились по 22-нм технологическому процессу, основанному на трёхмерных FinFET-транзисторах, которые в то время только входили в употребление.

    При этом старая микроархитектура Sandy Bridge на низком уровне осталась практически нетронута. Были выполнены лишь отдельные косметические переделки, которые ускорили выполнение в Ivy Bridge операций деления и немного повысили эффективность технологии Hyper-Threading. Правда, попутно были несколько улучшены «внеядерные» компоненты. Контроллер PCI Express получил совместимость с третьей версией протокола, а контроллер памяти увеличил свои возможности и стал поддерживать скоростную оверклокерскую DDR3-память. Но в итоге рост удельной производительности при переходе от Sandy Bridge к Ivy Bridge составил не более 3-5 процентов.

    Не дал серьёзных причин для радости и новый технологический процесс. К сожалению, внедрение 22-нм норм не позволило как-то принципиально нарастить тактовые частоты Ivy Bridge. Старшая версия Core i7-3770K получила номинальную частоту 3,5 ГГц с возможностью разгона в турборежиме до 3,9 ГГц, то есть с точки зрения частотной формулы она оказалась ничуть не быстрее Core i7-2700K. Улучшилась лишь энергоэффективность, однако пользователей настольных компьютеров этот аспект традиционно волнует слабо.

    Всё это, конечно, вполне можно списать на то, что на этапе «тик» никаких прорывов происходить и не должно, но кое в чём Ivy Bridge оказались даже хуже предшественников. Речь - о разгоне. При выводе на рынок носителей этого дизайна Intel приняла решение отказаться от использования при финальной сборке процессоров бесфлюсовой пайки галлиевым припоем теплораспределительной крышки к полупроводниковому кристаллу. Начиная с Ivy Bridge для организации внутреннего термоинтерфейса стала использоваться банальная термопаста, и это сразу же ударило по максимально достижимым частотам. По разгонному потенциалу Ivy Bridge определённо стали хуже, и в результате переход от Sandy Bridge к Ivy Bridge стал одним из самых спорных моментов в новейшей истории потребительских процессоров Intel.

    Поэтому на следующий этап эволюции, Haswell , возлагались особенные надежды. В этом поколении, относящемся к фазе «так», должны были появиться серьёзные микроархитектурные улучшения, от которых ожидалась способность как минимум продвинуть вперёд забуксовавший было прогресс. И в какой-то степени это произошло. Появившиеся летом 2013 года процессоры Core четвёртого поколения действительно приобрели заметные улучшения во внутренней структуре.

    Основное: теоретическая мощность исполнительных устройств Haswell, выражающаяся в количестве исполняемых за такт микроопераций, по сравнению с прошлыми CPU выросла на треть. В новой микроархитектуре не только был проведён ребаланс имеющихся исполнительных устройств, но и появилось два дополнительных исполнительных порта для целочисленных операций, обслуживания ветвлений и генерации адресов. Кроме того, микроархитектура получила совместимость с расширенным набором векторных 256-битных инструкций AVX2, которые благодаря трёхоперандным FMA-командам увеличили пиковую пропускную способность архитектуры вдвое.

    В дополнение к этому инженеры Intel пересмотрели ёмкость внутренних буферов и, где это было необходимо, увеличили их. Выросло в размере окно планировщика. Кроме того, были увеличены целочисленный и вещественночисленный физические регистровые файлы, что улучшило возможности процессора по переупорядочиванию порядка исполнения инструкций. В дополнение ко всему этому, существенно изменилась и подсистема кеш-памяти. L1- и L2-кеши в Haswell получили вдвое более широкую шину.

    Казалось бы, перечисленных улучшений должно быть достаточно для того, чтобы заметно поднять удельную производительность новой микроархитектуры. Но как бы не так. Проблема дизайна Haswell состояла в том, что он оставил без изменений входную часть исполнительного конвейера и декодер x86-команд сохранил ту же производительность, что и раньше. То есть максимальный темп декодирования x86-кода в микроинструкции остался на уровне 4-5 команд за такт. И в результате при сопоставлении Haswell и Ivy Bridge на одинаковой частоте и при нагрузке, не использующей новые AVX2-инструкции, выигрыш в производительности оказался всего лишь на уровне 5-10 процентов.

    Имидж микроархитектуры Haswell подпортила и первая волна процессоров, выпущенная на её основе. Опираясь на всё тот же 22-нм техпроцесс, что и Ivy Bridge, новинки не смогли предложить высокие частоты. Например, старший Core i7-4770K вновь получил базовую частоту 3,5 ГГц и максимальную частоту в турборежиме на уровне 3,9 ГГц, то есть по сравнению с прошлыми поколениями Core никакого продвижения не наметилось.

    В то же время с внедрением следующего технологического процесса с 14-нм нормами у Intel стали возникать разного рода трудности, поэтому через год, летом 2014 года, на рынок было выведено не следующее поколение процессоров Core, а вторая очередь Haswell, которая получила кодовые имена Haswell Refresh, или, если говорить о флагманских модификациях, то Devil’s Canyon. В рамках этого обновления Intel смогла заметно увеличить тактовые частоты 22-нм CPU, что действительно вдохнуло в них новую жизнь. В качестве примера можно привести новый старший процессор Core i7-4790K, который по номинальной частоте взял отметку в 4,0 ГГц и получил максимальную частоту с учётом турборежима на уровне 4,4 ГГц. Удивительно, что подобное полугигагерцевое ускорение было достигнуто без каких-либо реформ техпроцесса, а лишь за счёт простых косметических изменений в схеме питания процессоров и благодаря улучшению теплопроводящих свойств термопасты, используемой под крышкой CPU.

    Впрочем, даже представители семейства Devil’s Canyon особенно жалуемыми в среде энтузиастов предложениями стать не смогли. На фоне результатов Sandy Bridge их разгон нельзя было назвать выдающимся, к тому же достижение высоких частот требовало сложного «скальпирования» - демонтажа процессорной крышки с последующей заменой штатного термоинтерфейса каким-либо материалом с лучшей теплопроводностью.

    Из-за сложностей, которые преследовали Intel при переводе массового производства на 14-нм нормы, выступление следующего, пятого по счёту поколения процессоров Core, Broadwell , получилось сильно скомканным. Компания долго не могла решить, стоит ли вообще выпускать на рынок десктопные процессоры с этим дизайном, поскольку при попытках изготовления крупных полупроводниковых кристаллов уровень брака превышал приемлемые значения. В конечном итоге предназначенные для настольных компьютеров четырёхъядерники Broadwell всё-таки появились, но, во-первых, произошло это лишь летом 2015 года - с девятимесячным опозданием относительно изначально запланированного срока, а во-вторых, уже через два месяца после их анонса Intel представила дизайн следующего поколения, Skylake.

    Тем не менее с точки зрения развития микроархитектуры Broadwell трудно назвать вторичной разработкой. И даже более того, в настольных процессорах этого поколения применялись такие решения, к которым ни до того, ни после того Intel никогда не прибегала. Уникальность десктопных Broadwell определялась тем, что в них проникло производительное интегрированное графическое ядро Iris Pro уровня GT3e. И это значит не только то, что процессоры этого семейства обладали самым мощным на тот момент встроенным видеоядром, но и также то, что они комплектовались дополнительным 22-нм кристаллом Crystall Well, представляющим собой основанную на eDRAM кеш-память четвёртого уровня.

    Смысл добавления в процессор отдельного чипа быстрой встроенной памяти вполне очевиден и обусловлен потребностями производительного встроенного графического ядра в фрейм-буфере с низкой латентностью и высокой пропускной способностью. Однако установленная в Broadwell память eDRAM архитектурно была выполнена именно как виктимный кеш, и ей могли пользоваться и вычислительные ядра CPU. В результате десктопные Broadwell стали единственными в своём роде массовыми процессорами с 128 Мбайт L4-кеша. Правда, при этом несколько пострадал объём расположенного в процессорном кристалле L3-кеша, который был сокращён с 8 до 6 Мбайт.

    Некоторые улучшения были заложены и в базовой микроархитектуре. Несмотря на то, что Broadwell относился к фазе «тик», переделки коснулись входной части исполнительного конвейера. Было увеличено окно планировщика внеочередного исполнения команд, в полтора раза вырос объём таблицы ассоциативной трансляции адресов второго уровня, а, кроме того, вся схема трансляции приобрела второй обработчик промахов, что позволило обрабатывать по две операции преобразования адресов параллельно. В сумме все нововведения повысили эффективность внеочередного исполнения команд и предсказания сложных ветвлений кода. Попутно были усовершенствованы механизмы выполнения операций умножения, которые в Broadwell стали обрабатываться в существенно более быстром темпе. По итогам всего этого Intel даже смогла утверждать, что улучшения микроархитектуры повысили удельную производительность Broadwell по сравнению с Haswell на величину порядка пяти процентов.

    Но несмотря на всё это, ни о каком существенном преимуществе первых десктопных 14-нм процессоров вести речь было невозможно. И кеш четвёртого уровня, и микроархитектурные изменения лишь пытались скомпенсировать главный изъян Broadwell - низкие тактовые частоты. Из-за проблем с технологическим процессом базовая частота старшего представителя семейства, Core i7-5775C, была установлена лишь на уровне 3,3 ГГц, а частота в турборежиме не превышала 3,7 ГГц, что оказалось хуже характеристик Devil’s Canyon на целых 700 МГц.

    Подобная же история произошла и с разгоном. Предельные частоты, до которых удавалось раскочегаривать десктопные Broadwell без использования продвинутых методов охлаждения, находились в районе 4,1-4,2 ГГц. Поэтому нет ничего удивительного, что потребители восприняли выпуск Broadwell скептически, и процессоры этого семейства так и остались странным нишевым решением для тех, кто был заинтересован в производительном встроенном графическом ядре. Первым же полноценным 14-нм чипом для настольных компьютеров, который смог привлечь к себе внимание широких слоёв пользователей, стал только следующий проект микропроцессорного гиганта - Skylake .

    Производство Skylake, как и процессоров предыдущего поколения, выполнялось по 14-нм техпроцессу. Однако здесь Intel уже смогла добиться нормальных тактовых частот и разгона: старшая десктопная версия Skylake, Core i7-6700K, получила номинальную частоту 4,0 ГГц и авторазгон в рамках турборежима до 4,2 ГГц. Это чуть более низкие значения, если сравнивать с Devil’s Canyon, однако более новые процессоры оказались определённо быстрее предшественников. Дело в том, что Skylake - это «так» в интеловской номенклатуре, что означает существенные изменения в микроархитектуре.

    И они действительно есть. Улучшений в дизайне Skylake на первый взгляд было сделано не так много, но все они носили прицельный характер и позволили устранить имевшиеся слабые места в микроархитектуре. Если коротко, то Skylake получили увеличенные внутренние буфера для более глубокого внеочередного исполнения инструкций и более высокую пропускную способность кеш-памяти. Усовершенствования затронули блок предсказания переходов и входную часть исполнительного конвейера. Также был увеличен темп исполнения инструкций деления, и перебалансированы механизмы исполнения операций сложения, умножения и FMA-инструкций. В довершение разработчики потрудились над повышением эффективности технологии Hyper-Threading. В сумме это позволило добиться примерно 10-процентного улучшения производительности на такт в сравнении с процессорами прошлых поколений.

    В целом Skylake можно охарактеризовать как достаточно глубокую оптимизацию исходной архитектуры Core, с таким расчётом, чтобы в дизайне процессора не оставалось никаких узких мест. С одной стороны, за счёт увеличения мощности декодера (с 4 до 5 микроопераций за такт) и скорости работы кеша микроопераций (с 4 до 6 микроопераций за такт) существенно увеличился темп декодирования инструкций. А с другой - выросла эффективность обработки получающихся микроопераций, чему поспособствовало углубление алгоритмов внеочередного исполнения и перераспределение возможностей исполнительных портов вместе с серьёзной ревизией темпа исполнения целого ряда обычных, SSE и AVX-команд.

    Например, Haswell и Broadwell имели по два порта для исполнения умножений и FMA-операций над вещественными числами, но только один порт предназначался для сложений, что плохо соответствовало реальному программному коду. В Skylake этот дисбаланс был устранён и сложения стали выполняться уже на двух портах. Кроме того, количество портов, способных работать с целочисленными векторными инструкциями, выросло с двух до трёх. В конечном итоге всё это привело к тому, что практически для любого типа операций в Skylake всегда есть несколько альтернативных портов. А это значит, что в микроархитектуре наконец были успешно устранены практически все возможные причины простоя конвейера.

    Заметные изменения затронули и подсистему кеширования: пропускная способность кеш-памяти второго и третьего уровня была увеличена. Кроме того, сократилась ассоциативность кеша второго уровня, что в конечном счёте позволило улучшить его КПД и уменьшить штраф при обработке промахов.

    Существенные перемены произошли и на более высоком уровне. Так, в Skylake вдвое выросла пропускная способность кольцевой шины, которая соединяет все процессорные блоки. Кроме того, в CPU этого поколения обосновался новый контроллер памяти, который получил совместимость с DDR4 SDRAM. А в дополнение к этому для соединения процессора с чипсетом стала применяться новая шина DMI 3.0 с увеличенной вдвое пропускной способностью, что дало возможность реализовать скоростные линии PCI Express 3.0 в том числе и через чипсет.

    Впрочем, как и все предшествующие версии архитектуры Core, Skylake представлял собой ещё одну вариацию на тему изначального дизайна. А это значит, что и в шестом поколении микроархитектуры Core разработчики Intel продолжили придерживаться тактики поэтапного внедрения улучшений на каждом цикле разработки. В целом это - не слишком впечатляющий подход, который не позволяет увидеть какие-то значимые изменения в производительности сразу - при сравнении CPU из соседних поколений. Но зато при модернизации старых систем ощутимый прирост производительности заметить совсем несложно. Например, сама Intel охотно сравнивала Skylake с Ivy Bridge, демонстрируя при этом, что за три года быстродействие процессоров выросло более чем на 30 процентов.

    И в действительности это был достаточно серьёзный прогресс, потому что потом всё стало значительно хуже. После Skylake какое бы то ни было улучшение удельной производительности процессорных ядер прекратилось совсем. Те процессоры, которые представлены на рынке в настоящее время, всё ещё продолжают использовать микроархитектурный дизайн Skylake, несмотря на то, что с момента его появления в десктопных процессорах прошло уже почти три года. Неожиданный простой случился из-за того, что Intel не смогла справиться со внедрением следующей версии полупроводникового процесса с 10-нм нормами. В результате весь принцип «тик-так» рассыпался, вынудив микропроцессорного гиганта как-то выкручиваться и заниматься многократным перевыпуском старых продуктов под новыми именами.

    Процессоры поколения Kaby Lake , которые появились на рынке в самом начале 2017 года, стали первым и очень ярким примером попыток Intel продать клиентам тот же Skylake во второй раз. Близкие родственные связи между двумя поколениями процессоров особо и не скрывались. Intel честно говорила, что Kaby Lake - это уже не «тик» и не «так», а простая оптимизация предыдущего дизайна. При этом под словом «оптимизация» понимались некие улучшения в структуре 14-нм транзисторов, которые открывали возможность увеличения тактовых частот без изменения рамок теплового пакета. Для видоизменённого техпроцесса был даже придуман специальный термин «14+ нм». Благодаря этой производственной технологии старший массовый десктопный процессор Kaby Lake, получивший наименование Core i7-7700K, смог предложить пользователям номинальную частоту 4,2 ГГц и частоту турборежима 4,5 ГГц.

    Таким образом, рост частот Kaby Lake по сравнению с оригинальным Skylake составил примерно 5 процентов, и этим всё и ограничивалось, что, честно говоря, ставило под сомнение правомерность отнесения Kaby Lake к следующему поколению Core. До этого момента каждое последующее поколение процессоров, не важно, относилось оно к фазе «тик» или «так», обеспечивало хоть какой-то прирост показателя IPC. Между тем в Kaby Lake никаких микроархитектурных улучшений не было вообще, поэтому эти процессоры логичнее было бы считать просто вторым степпингом Skylake.

    Однако новая версия 14-нм техпроцесса всё же смогла кое в чём положительно проявить себя: разгонный потенциал Kaby Lake по сравнению с Skylake подрос примерно на 200-300 МГц, благодаря чему процессоры данной серии оказались достаточно тепло встречены энтузиастами. Правда, Intel продолжила использовать под процессорной крышкой вместо припоя термопасту, поэтому для полноценного разгона Kaby Lake необходимо было проводить скальпирование.

    Не справилась Intel и с вводом в строй 10-нм технологии и к началу текущего года. Поэтому в конце прошлого года на рынок была выведена ещё одна разновидность процессоров, построенных на всё той же микроархитектуре Skylake, - Coffee Lake . Но говорить о Coffee Lake как о третьем обличье Skylake не совсем правильно. Прошлый год стал периодом кардинальной смены парадигмы на процессорном рынке. В «большую игру» вернулась AMD, которая смогла переломить устоявшиеся традиции и создать спрос на массовые процессоры с числом ядер более четырёх. Внезапно Intel оказалась в роли догоняющей, и выход Coffee Lake стал не столько попыткой заполнить паузу до долгожданного появления 10-нм процессоров Core, сколько реакцией на выход шести- и восьмиядерных процессоров AMD Ryzen.

    В результате процессоры Coffee Lake получили важное структурное отличие от своих предшественников: число ядер в них было увеличено до шести штук, что с массовой платформой Intel произошло впервые. Однако при этом никаких изменений на уровне микроархитектуры вновь введено не было: Coffee Lake по сути - шестиядерный Skylake, собранный на основе точно таких же по внутреннему устройству вычислительных ядер, которые снабжены увеличенным до 12 Мбайт L3-кешем (по стандартному принципу 2 Мбайт на ядро) и объединены привычной кольцевой шиной.

    Впрочем, несмотря на то, что мы так запросто позволяем себе говорить о Coffee Lake «ничего нового», утверждать о полном отсутствии каких-то перемен не совсем справедливо. Хотя в микроархитектуре вновь ничего не поменялось, специалистам Intel пришлось потратить немало усилий для того, чтобы шестиядерные процессоры смогли вписаться в стандартную десктопную платформу. И результат вышел достаточно убедительным: шестиядерные процессоры остались верны привычному тепловому пакету и, более того, совсем не замедлились по тактовым частотам.

    В частности, старший представитель поколения Coffee Lake, Core i7-8700K, получил базовую частоту 3,7 ГГц, а в турборежиме он может разгоняться до 4,7 ГГц. При этом оверклокерский потенциал Coffee Lake, несмотря на его более массивный полупроводниковый кристалл, оказался даже лучше, чем у всех предшественников. Core i7-8700K нередко выводятся их рядовыми владельцами на пятигигагерцевый рубеж, причём такой разгон бывает реален даже без скальпирования и замены внутреннего термоинтерфейса. И это значит, что Coffee Lake хоть и экстенсивный, но существенный шаг вперёд.

    Всё это стало возможным исключительно благодаря очередному усовершенствованию 14-нм технологического процесса. На четвёртый год его использования для массового производства десктопных чипов Intel удалось добиться действительно впечатляющих результатов. Внедрённая третья версия 14-нм норм («14++ нм» в обозначениях производителя) и перекомпоновка полупроводникового кристалла позволили существенно улучшить производительность в пересчёте на каждый затраченный ватт и поднять суммарную вычислительную мощность. Внедрением шестиядерности Intel, пожалуй, смогла совершить даже более значительный шаг вперёд, чем любым из предшествующих тому улучшений микроархитектуры. И сегодня Coffee Lake смотрится весьма соблазнительным вариантом для модернизации старых систем, основанных на предыдущих носителях микроархитектуры Core.

    Кодовое имя Техпроцесс Число ядер GPU L3-кеш, Мбайт Число транзисторов, млрд Площадь кристалла, мм 2
    Sandy Bridge 32 нм 4 GT2 8 1,16 216
    Ivy Bridge 22 нм 4 GT2 8 1,2 160
    Haswell 22 нм 4 GT2 8 1,4 177
    Broadwell 14 нм 4 GT3e 6 Н/д ~145 + 77 (eDRAM)
    Skylake 14 нм 4 GT2 8 Н/д 122
    Kaby Lake 14+ нм 4 GT2 8 Н/д 126
    Coffee Lake 14++ нм 6 GT2 12 Н/д 150

    ⇡ Процессоры и платформы: спецификации

    Для проведения сравнения семи последних поколений Core i7 мы взяли старших представителей в соответствующих сериях - по одному от каждого дизайна. Основные характеристики этих процессоров приведены в следующей таблице.

    Core i7-2700K Core i7-3770K Core i7-4790K Core i7-5775C Core i7-6700K Core i7-7700K Core i7-8700K
    Кодовое имя Sandy Bridge Ivy Bridge Haswell (Devil’s Canyon) Broadwell Skylake Kaby Lake Coffee Lake
    Технология производства, нм 32 22 22 14 14 14+ 14++
    Дата выхода 23.10.2011 29.04.2012 2.06.2014 2.06.2015 5.08.2015 3.01.2017 5.10.2017
    Ядра/потоки 4/8 4/8 4/8 4/8 4/8 4/8 6/12
    Базовая частота, ГГц 3,5 3,5 4,0 3,3 4,0 4,2 3,7
    Частота Turbo Boost, ГГц 3,9 3,9 4,4 3,7 4,2 4,5 4,7
    L3-кеш, Мбайт 8 8 8 6 (+128 Мбайт eDRAM) 8 8 12
    Поддержка памяти DDR3-1333 DDR3-1600 DDR3-1600 DDR3L-1600 DDR4-2133 DDR4-2400 DDR4-2666
    Расширения набора инструкций AVX AVX AVX2 AVX2 AVX2 AVX2 AVX2
    Интегрированная графика HD 3000 (12 EU) HD 4000 (16 EU) HD 4600 (20 EU) Iris Pro 6200 (48 EU) HD 530 (24 EU) HD 630 (24 EU) UHD 630 (24 EU)
    Макс. частота графического ядра, ГГц 1,35 1,15 1,25 1,15 1,15 1,15 1,2
    Версия PCI Express 2.0 3.0 3.0 3.0 3.0 3.0 3.0
    Линии PCI Express 16 16 16 16 16 16 16
    TDP, Вт 95 77 88 65 91 91 95
    Сокет LGA1155 LGA1155 LGA1150 LGA1150 LGA1151 LGA1151 LGA1151v2
    Официальная цена $332 $332 $339 $366 $339 $339 $359

    Любопытно, что за прошедшие с момента выпуска Sandy Bridge семь лет Intel так и не смогла заметно нарастить тактовые частоты. Несмотря на то, что дважды менялся технологический производственный процесс и дважды серьезно оптимизировалась микроархитектура, сегодняшние Core i7 почти не продвинулись вперёд по своей рабочей частоте. Новейший Core i7-8700K имеет номинальную частоту 3,7 ГГц, что всего лишь на 6 процентов выше частоты вышедшего в 2011 году Core i7-2700K.

    Впрочем, такое сравнение не совсем корректно, ведь Coffee Lake имеет в полтора раза больше вычислительных ядер. Если же ориентироваться на четырёхъядерный Core i7-7700K, то рост частоты выглядит всё-таки убедительнее: этот процессор ускорился относительно 32-нм Core i7-2700K на достаточно весомые 20 процентов в мегагерцевом выражении. Хотя всё равно вряд ли это можно назвать впечатляющим приростом: в абсолютных величинах это конвертируется в прибавку по 100 МГц в год.

    Нет никаких прорывов и в других формальных характеристиках. Intel продолжает снабжать все свои процессоры индивидуальной кеш-памятью второго уровня объёмом 256 Кбайт на ядро, а также общим на все ядра L3-кешем, размер которого определяется из расчёта 2 Мбайт на ядро. Иными словами, главный фактор, по которому произошёл самый большой прогресс, - это число вычислительных ядер. Развитие Core начиналось с четырёхъядерных CPU, а пришло к шестиядерным. Причём очевидно, что это ещё не конец и в ближайшей перспективе мы увидим и восьмиядерные варианты Coffee Lake (либо Whiskey Lake).

    Впрочем, как нетрудно заметить, за семь лет у Intel почти не менялась и ценовая политика. Даже шестиядерный Coffee Lake по сравнению с предшествующими четырёхъядерными флагманами подорожал всего лишь на шесть процентов. Все же остальные старшие процессоры класса Core i7 для массовой платформы всегда обходились потребителям в сумму порядка $330-340.

    Любопытно, что самые крупные перемены произошли даже не с самими процессорами, а с поддержкой ими оперативной памяти. Пропускная способность двухканальной SDRAM с момента выхода Sandy Bridge и до сегодняшнего дня выросла вдвое: с 21,3 до 41,6 Гбайт/с. И это - ещё одно немаловажное обстоятельство, определяющее преимущество современных систем, совместимых со скоростной DDR4-памятью.

    Да и вообще, все эти годы вместе с процессорами эволюционировала и вся остальная платформа. Если вести речь о главных вехах в развитии платформы, то, помимо роста скорости совместимой памяти, отметить хочется и появление поддержки графического интерфейса PCI Express 3.0. Кажется, что скоростная память и быстрая графическая шина наряду с прогрессом в частотах и архитектурах процессоров выступают весомыми причинами того, что современные системы стали лучше и быстрее прошлых. Поддержка DDR4 SDRAM появилась в Skylake, а перевод процессорной шины PCI Express на третью версию протокола произошёл ещё в Ivy Bridge.

    Кроме того, заметное развитие получили и сопутствующие процессорам наборы системной логики. Действительно, сегодняшние интеловские чипсеты трёхсотой серии могут предложить гораздо более интересные возможности в сравнении с Intel Z68 и Z77, которые использовались в LGA1155-материнских платах под процессоры поколения Sandy Bridge. В этом нетрудно убедиться по следующей таблице, в которой мы свели воедино характеристики флагманских интеловских чиспсетов для массовой платформы.

    P67/Z68 Z77 Z87 Z97 Z170 Z270 Z370
    Совместимость с CPU Sandy Bridge
    Ivy Bridge
    Haswell Haswell
    Broadwell
    Skylake
    Kaby Lake
    Coffee Lake
    Интерфейс DMI 2.0 (2 Гбайт/с) DMI 3.0 (3,93 Гбайт/с)
    Стандарт PCI Express 2.0 3.0
    Линии PCI Express 8 20 24
    Поддержка PCIe M.2 Нет
    Есть
    Есть, до 3 устройств
    Поддержка PCI Есть Нет
    SATA 6 Гбит/с 2 6
    SATA 3 Гбит/с 4 0
    USB 3.1 Gen2 0
    USB 3.0 0 4 6 10
    USB 2.0 14 10 8 4

    В современных наборах логики существенно развились возможности для подключения высокоскоростных носителей информации. Самое главное: благодаря переходу чипсетов на шину PCI Express 3.0 сегодня в производительных сборках можно использовать быстродействующие NVMe-накопители, которые даже по сравнению с SATA SSD могут предложить заметно лучшую отзывчивость и более высокую скорость чтения и записи. И одно только это может стать веским аргументом в пользу модернизации.

    Кроме того, современные наборы системной логики предоставляют гораздо более богатые возможности для подключения дополнительных устройств. И речь не только о существенном увеличении числа линий PCI Express, что обеспечивает наличие на платах нескольких дополнительных слотов PCIe, заменяющих обычные PCI. Попутно в сегодняшних чипсетах имеется также и врождённая поддержка портов USB 3.0, а многие современные материнские платы снабжаются и портами USB 3.1 Gen2.

    Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.


    Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

    Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

    При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.


    Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.


    Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.


    Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

    System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.


    Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

    Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.


    За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.


    Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.


    В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.


    Что качается разгона, то максимум чего можно добиться, так это поднятия базовой с номинальных 100 МГц до 105 МГц (+/- один-два мегагерца), чего явно будет недостаточно. Пожалуй, с таким подходом Intel энтузиасты могли бы поставить крест на платформе LGA1155, если бы не одно но — компания все же решила оставить возможность разгона своих процессоров, но только в K-серии и путем поднятия множителя, так как в них он не заблокирован (максимальный x57). Пользователи уже успели познакомиться с подобными моделями на ядрах Lynnfield и Clarkdale. Их аналогов на Sandy Bridge пока два и все они относятся к ценовому диапазону $200-300, что еще больше разочарует оверклокеров, большинство которых вряд ли смогут позволить себе такие процессоры.

    Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.


    Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.


    Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

    После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.



    Похожие публикации