Вторая итерация микроархитектуры Core: обзор Core 2 Extreme QX9650

Автор: Gavric
Дата: 29.10.2007
Все фото статьи

Введение


Если вы следите за событиями, происходящими на процессорном рынке, то наверняка знаете, что на 12 ноября этого года компания Intel наметила анонс серверных процессоров семейства Penryn, первых CPU, для производства которых применяется инновационный 45-нм технологический процесс. Хотя эти процессоры и являются очередными вариантами широко распространённой микроархитектуры Core, они представляют немалый интерес. Дело в том, что Penryn – это не простой результат перевода предыдущих 65-нм процессорных ядер на новую производственную технологию. В них инженеры Intel реализовали целый ряд усовершенствований, направленных на увеличение производительности, достигаемое без роста тактовой частоты.

Однако Intel взяла на вооружение тактику AMD, когда новые архитектурные решения в первую очередь внедряются на серверный рынок. Так, через две недели будут анонсированы лишь 45-нм процессоры Xeon с кодовыми именами Harpertown (4 ядра; 12 Мбайт L2; 50, 80 и 120 Вт TDP) и Wolfdale-DP (2 ядра; 6 Мбайт L2; 40, 55 и 80 Вт TDP). Процессоры же семейства Penryn, к сожалению, придут в настольные и мобильные системы только в следующем году. За одним исключением: Intel пошла на поводу наиболее обеспеченной части компьютерных энтузиастов и решила всё-таки дать им шанс прикоснуться к новым технологиям до Рождества. Иными словами, вместе с обновлённой линейкой Xeon в магазинах появится и единственная модель 45-нм четырёхъядерного LGA775 процессора Core 2 Extreme QX9650 (кодовое имя – Yorkfield XE), которую самые нетерпеливые покупатели смогут приобрести за статусную сумму 999 долларов. Анонс процессора также намечен на 12 ноября, но мы имеем возможность несколько забежать вперёд и рассказать об этой новинке уже сегодня.


Когда процессор Core 2 Extreme QX9650 занял своё место на испытательном стенде, мы были очень обрадованы. Ещё бы: вот она, возможность подробно изучить самый быстрый, самый новый и ещё много какой самый-самый продукт для энтузиастов! Но, к сожалению, тестирование этого CPU оказалось не самым интересным занятием – дело в том, что на данный момент этот процессор абсолютно не с чем сравнивать. То, что благодаря микроархитектуре Core, внесённым в неё улучшениям и новой производственной технологии с нормами 45 нм он обходит старые конкурирующие решения с любых точек зрения – совершенно очевидно.

Компания Intel взяла хороший темп смены технологических процессов и процессорных архитектур. Как планируется, новые микроархитектуры теперь будут предлагаться Intel каждые два года, а через год после их внедрения процессорные ядра должны будут переводиться на новый техпроцесс с внесением в них некоторых небольших усовершенствований. Семейство Penryn как раз и стало такой эволюционной производной от Merom, Conroe и Woodcrest, выходящей примерно спустя год после того, как на рынок пришли первые CPU с микроархитектурой Core. Согласно этому плану, ближе к концу следующего года нас как раз ожидает встреча с принципиально новой архитектурой, известной сегодня под кодовым именем Nehalem.

Главный же соперник Intel, компания AMD, оказалась неспособна вписаться в предложенный Intel ритм и выпустить в этом году высокочастотные модели четырёхъядерных "настольных" процессоров с новой микроархитектурой K10, хотя мы их и ожидали. Взамен этого в ноябре-декабре AMD собирается предложить лишь только новые процессоры среднего уровня, противопоставлять которые Core 2 Extreme QX9650 будет совершенно бессмысленно. Поэтому в данном материале мы подойдём к рассмотрению интеловской новинки лишь с позиции изучения её отличий от предшествующих моделей четырёхъядерных процессоров Kentsfield, основанных на старых 65-нм ядрах.

Core 2 Extreme QX9650: первый взгляд


Первый процессор семейства Penryn для настольных компьютеров, Yorkfield, выглядит совершенно обыденно. Его внешний вид практически ничем не выдаёт тот факт, что под теплорассеивателем спрятаны два двухъядерных кристалла c кодовым именем Wolfdale, произведённых по технологическому процессу с нормами 45 нм.


Слева – Core 2 Extreme QX9650, справа - Core 2 Extreme QX6850

Заметную точку в левом нижнем углу крышки CPU расценивать как признак нового процессора не стоит. Такая (или подобная, но расположенная в левом верхнем углу) метка была введена Intel некоторое время назад у всех четырёхъядерных процессоров. Она обозначает свойства материала теплорассеивателя и используется производителем исключительно для внутренних нужд.

Зато "брюшко" у новинки весьма специфично. Такой схемы расположения навесных элементов мы ещё не встречали.


Слева – Core 2 Extreme QX9650, справа - Core 2 Extreme QX6850

Диагностическая утилита CPU-Z уже знакома с новыми 45-нм процессорами Yorkfield и правильно их распознаёт.


Из снимка становятся понятны все основные особенности новинки. Core 2 Extreme QX9650 – это ещё один четырёхъядерный процессор, аналогичный по частоте рассмотренному нами недавно Core 2 Extreme QX6850 (Kentsfield), производимому по предыдущему 65-нм техпроцессу. Его штатная тактовая частота также равна 3,0 ГГц, при этом используется 1333 МГц шина и множитель 9х.

Однако при этом новый процессор обладает большим кэшем второго уровня, суммарный объём которого у Core 2 Extreme QX9650 доведён до 12 Мбайт. Поскольку новый CPU, также как и четырёхъядерные процессоры прошлого поколения, физически скомпонован из пары двухъядерных кристаллов, его L2-кэш состоит из двух 6-мегабайтных половинок. В этом Yorkfiled родственен Kentsfield: и тот, и другой процессоры не являются монолитными четырёхъядерными кристаллами.

Поддержка нового набора инструкций SSE4.1 – ещё одно бросающееся в глаза преимущество Core 2 Extreme QX9650, как и всех остальных процессоров семейства Penryn. В остальном же, никаких явных сюрпризов новый Core 2 Extreme QX9650 – на первый взгляд – в себе не таит.


Всё сказанное остаётся дополнить таблицей с формальными характеристиками нового процессора. Для наглядности, в этой же таблице мы приводим и спецификации предыдущего процессора серии Core 2 Extreme, QX6850.


Yorkfield: что нового


В предыдущем разделе мы кратко обозначили основные отличия процессора Core 2 Extreme QX9650 от его предшественника. Теперь настал подходящий момент, чтобы более подробно познакомиться с теми нововведениями, которые будут нас ожидать во всех процессорах семейства Penryn.

45 нм технологический процесс

Начать рассмотрение особенностей новых процессоров следует с используемого для их выпуска технологического процесса. Ведь позволил создать процессоры Penryn именно переход на 45-нм технологию, которая, помимо увеличения сложности кристалла за счёт усовершенствования функциональных блоков, позволяет снизить напряжение питания CPU, уменьшить тепловыделение и в перспективе поднять тактовые частоты.

Новый технологический процесс представляет интерес ещё и потому, что для его освоения Intel пришлось провести огромную исследовательскую работу, в рамках которой классические диэлектрические материалы (в частности, оксид кремния), применяемые с 60-х годов прошлого века для производства интегральных микросхем, были заменены на принципиально новые (соединения редкоземельного металла гафния). Новые 45-нм транзисторы используют металлический затвор вместо затвора из поликристаллического кремния, а также диэлектрик с высокой диэлектрической проницаемостью (high-k) – силицид гафния.


Эти изменения в конструкции полупроводниковых элементов позволяют решить сразу несколько насущных задач. Новый технологический процесс с нормами 45 нм почти вдвое поднимает плотность расположения транзисторов на кристалле, а кроме того, примерно на 20 % увеличивает их скорость переключения и на 30 % снижает необходимую для этого мощность. В качестве дополнительного бонуса, благодаря новым материалам значительно уменьшаются и токи утечки: в канале исток-сток – ориентировочно в пять раз, а через диэлектрик затвора – примерно на порядок.

Надо сказать, что освоение 45-нм технологии без перехода на использование новых материалов вряд ли могло стать возможным. Дело в том, что транзисторы старой конструкции с диэлектриком затвора из оксида кремния при дальнейшей миниатюризации, необходимой для наращивания скорости переключения, попросту теряют основные свойства. Уже в 65-нм полупроводниковых приборах толщина слоя диэлектрика доходила до 5 атомов. Необходимое для улучшения параметров производительности полупроводниковых устройств дальнейшее утончение этого слоя привело бы к тому, что он перестал бы являться серьёзным препятствием для электронов. Новый диэлектрик с высокой диэлектрической проницаемостью как раз и решает эту проблему, он позволяет увеличить толщину слоя диэлектрика затвора без потери в скорости срабатывания транзисторов.

Что же касается замены поликремниевого материала затвора на металлический, то этот шаг – отчасти вынужденный. Он был обусловлен несовместимостью диэлектрика на основе силицида гафния со старым материалом на квантовом уровне, влекущей за собой падение быстродействия транзисторов.

Как и ранее, для производства 45-нм процессоров используются медные соединения, 300-мм пластины и 193-нанометровая литография. Таким образом, переход на новый процесс не потребовал от Intel смены основной массы оборудования. Это позволяет надеяться на то, что освоение массового выпуска процессоров Penryn пройдёт без каких либо трудностей, при хорошем выходе годных кристаллов.

Благодаря новому технологическому процессу Intel собирается в течение следующего года нарастить частоты своих процессоров семейства Core 2 Quad до 3,0 ГГц, а линейки Core 2 Duo – до 3,33 ГГц, удерживая их при этом в рамках привычных тепловых пакетов 95 и 65 Вт, соответственно. Частота же топовых моделей четырёхядерных CPU для энтузиастов, типичное тепловыделение которых установлено на уровне 130 Вт, сможет достичь 3,2 ГГц. При этом Intel собирается сделать ещё один шаг, направленный на увеличение производительности, и перевести их на использование более скоростной шины с частотой 1600 МГц.

L2 кэш

Преимущества нового 45-нм технологического процесса открыли перед инженерами Intel пространство для увеличения числа транзисторов в CPU без роста размера кристалла. Эта возможность была по традиции использована в первую очередь для увеличения размера кэш-памяти второго уровня. В то время как старые 65-нм двухъядерные процессоры Conroe содержали 4-мегабайтный разделяемый между ядрами кэш, их 45-нм последователи Wolfdale получили L2-кэш с объёмом 6 Мбайт.

Площадь, занимаемая на кристалле L2-кэшем, в новых процессорах окончательно превысила площадь остальных функциональных блоков, что хорошо видно по фотографии ядра Wolfdale – половинки Yorkfield.


В результате, новые четырёхъядерные процессоры семейства Penryn будут обладать кэш-памятью второго уровня суммарным объёмом 12 Мбайт: по 6 Мбайт на каждые два ядра. Иными словами, с внедрением нового технологического процесса никаких изменений в строении процессоров с четырьмя ядрами не произошло. Пары ядер всё также расположены на разных кристаллах и обмениваются данными через системную шину и оперативную память.

Рост объёма кэш-памяти Yorkfield потребовал соответственного увеличения с 16 до 24 числа областей ассоциативности. Благодаря такому шагу Intel надеется добиться более эффективного использования L2-кэша и сохранению высокой быстроты поиска в нём данных.


Слева – Core 2 Extreme QX9650, справа - Core 2 Extreme QX6850

Впрочем, измерение латентности кэш-памяти на практике показывает, что у нового процессора при увеличении в объёме он стал всё-таки слегка медленнее.


Вместе с увеличением объёма кэш-память новых CPU получила дополнительную функцию "enhanced cache line split load". Цель этого нововведения заключается в ускорении выборки из кэш-памяти неправильно выровненных данных, части которых могли бы быть помещены в одной строке, но попали в разные строки кэша. Новая функция пытается предугадать такие данные и сделать их выборку из кэша столь же быстрой, как если бы они лежали в одной строке. В теории, это усовершенствование может ускорить работу приложений, работа которых связана со сканированием трактов данных.

SSE4

Процессоры семейства Penryn, в том числе и Yorkfild, могут похвастать и очередным расширением системы SIMD-команд. В новом поколении своих CPU Intel ввёл поддержку набора SSE4.1, состоящего из 47 новых инструкций. Тем не менее, новые команды, несмотря на достаточно большое их количество, не представляют собой связанного множества, набор SSE4 включает разнородные дополнения к уже существующим SIMD-инструкциям. Новые команды, по традиции, должны будут помочь в увеличении скорости работы новых процессоров с трёхмерной графикой, с потоковым видео и в целом ряде научных вычислительных задач.


Впрочем, положительный эффект от внедрения SSE4 может начать ощущаться в полной мере лишь спустя некоторое время, когда этот набор получит всестороннюю поддержку в программном обеспечении. На сегодняшний же день новые SIMD-команды используются лишь в двух приложениях (кодеках) для перекодирования видео: в DivX 6.7 и в TMPEG Xpress 4.4.

Что же касается основных возможностей SSE4, то этот набор включает новые операции целочисленного векторного произведения, операции для поиска минимума и максимума в целочисленных векторах, инструкции для повышения эффективности векторизации целочисленного кода, а также команды для ускорения кодирования видео, вычисления вещественного скалярного произведения и инструкции для потоковой загрузки данных, использующие особенности строения кэш-памяти процессора.



Усовершенствования микроархитектуры

Вместе с внедрением дополнительных SIMD-команд инженеры Intel переработали в новых процессорах и некоторые функциональные блоки. Благодаря этому было достигнуто существенное ускорение выполнения операций деления целых и вещественных чисел, а также увеличение темпа обработки SSE-инструкций, связанных с битовой перестановкой.

За быстрое деление в Penryn отвечает блок, получивший название Fast Radix-16 Divider. В то время как применяемый в 65-нм процессорах с микроархитектурой Core блок Radix-4 мог вычислять только 2 бита частного за один проход итерационного алгоритма, новый блок способен подсчитывать уже 4 бита за такт. Благодаря этому процессоры Penryn примерно в два раза быстрее предшественников выполняют операции целочисленного и вещественночисленного деления, а также обеспечивают существенное ускорение при вычислении квадратных корней.

Реализация в 45-нм процессорах новых команд, входящих в набор SSE4, потребовала от инженеров переработки и механизма выполнения битовых перестановок. Новый однопроходный 128-битный модуль перестановок, получивший название Super Shuffle Engine, может выполнять битовые перестановки в 128-битном регистре за один такт. В результате скорость выполнения SSE-инструкций, которые содержат операции, связанные с перестановкой, в новых процессорах удвоилась. К числу таких команд, в частности, относятся упаковка, распаковка, побитовый сдвиг и выравнивание операндов.

Помимо ускорения выполнения ряда инструкций, некоторые улучшения были внесены в работу технологии виртуализации и механизма маскировки прерываний. В результате, в процессорах семейства Penryn, во-первых, на 25...75 % увеличилась скорость переключения между виртуальными машинами, а во-вторых, существенно быстрее стала происходить обработка инструкций CLI/STI.

Настольные процессоры Penryn: сегодня и завтра



Хотя в данном обзоре речь идёт лишь о первом представителе новой линейки процессоров для настольных компьютеров, Core 2 Extreme QX9650, мы старались сделать настоящий материал полезным не только для потенциальных покупателей этого недешёвого CPU, но и для тех пользователей, которые будут ожидать появления более доступных Penryn. Именно поэтому мы решили включить в статью и некоторые сведения о планах Intel по внедрению процессоров Yorkfield и Wolfdale во все сектора рынка.

В таблице ниже приводятся данные о полной линейке 45-нм процессоров Wolfdale и Yorkfield, а также сведения об их ожидаемой цене и ориентировочном времени появления в продаже.


Как следует из приведённых данных, рассматриваемый в данной статье процессор Core 2 Extreme QX9650 будет оставаться старшим предложением в рядах Intel недолго. В первом квартале эстафету от него подхватит более новый CPU Core 2 Extreme QX9770 с тактовой частотой 3,2 ГГц и частотой шины 1600 МГц. Специально для поддержки этого CPU Intel готовит набор логики X48, который должен будет выйти одновременно с ним. Этот перспективный процессор не только поднимет стоимость старших моделей CPU для десктопов до отметки 1399 долларов, но и станет рекордсменом по тепловыделению, типичный уровень которого возрастёт до 136 Вт.

Не экстремальные четырёхъядерные 65-нм процессоры Yorkfield будут доступны с начала будущего года в виде трёх моделей с частотами от 2,5 до 2,83 ГГц. В отличие от современных Core 2 Quad на ядре Kentsfield, все они будут работать с 1333-мегагерцовой системной шиной. Более частая сетка частот процессоров будет обеспечиваться за счёт поддержки в 45-нм процессорах дробных делителей. Следует отметить, что выход новых процессоров в линейке Core 2 Quad с 45-нм ядрами не повлечёт за собой уменьшение стоимости младших четырёхъядерных моделей. Самый медленный Yorkfield с процессорным номером Q9300 будет стоить столько же, сколько и Core 2 Quad Q6600. Любопытно, что при этом кэш-память выходящего в январе Core 2 Quad Q9300 будет урезана до 6 Мбайт, что даже меньше чем у современных процессоров Kentsfield.

Также в начале будущего года серьёзное пополнение произойдёт и в рядах двухъядерных CPU. Новые процессоры Wolfdale будут постепенно вытеснять старые Core 2 Duo, которые быстро потеряют популярность из-за того, что при одинаковой с Wolfdale стоимости они будут обладать меньшей тактовой частотой и меньшим L2-кэшем. Благодаря внедрению 45-нм ядер частота старшего двухъядерного CPU поднимется до 3,16 ГГц, а по демократичной цене 166 долларов можно будет купить процессор с весьма солидной по современным меркам частотой 2,66 ГГц.

Очень интересное пополнение в линейке Wolfdale ожидается во втором квартале. Примерно в этот период Intel планирует выпустить бюджетный двухъядерный процессор семейства Penryn с частотой шины 1066 МГц и урезанным до 3 Мбайт L2-кэшем.

Следует заметить, что никаких изменений в линейке четырёхъядерных процессоров в течение второго квартала не ожидается. Зато за третий квартал будущего года, перед выходом процессоров с новой микроархитектурой Nehalem, Intel планирует дополнительно увеличить на один шаг тактовые частоты старших моделей в линейках Core 2 Quad и Core 2 Duo.

Как мы тестировали


Итак, главной целью настоящей статьи является выяснение возможностей нового процессора Core 2 Extreme QX9650, первого представителя семейства Penryn для настольных компьютеров. Как мы уже сетовали ранее, сравнивать этот процессор имеет смысл только с его предшественником, Core 2 Extreme QX6850. Именно в таком ключе и было выполнено всё тестирование.

Системы для измерения производительности собирались из следующего набора комплектующих:

Процессоры:

Intel Core 2 Extreme QX9650 ((LGA775, 3.0GHz, 1333MHz FSB, 12MB L2, Yorkfield);
Intel Core 2 Extreme QX6850 ((LGA775, 3.0GHz, 1333MHz FSB, 8MB L2, Kentsfield).


Материнская плата: ASUS P5E3 Deluxe (LGA775, Intel X38, DDR3 SDRAM).
Память: 2 Гбайта DDR3-1333 с таймингами 7-7-7-20 (Corsair Dominator TWIN3X2048-1800C7DF G).
Графическая карта: OCZ GeForce 8800GTX (PCI-E x16).
Дисковая подсистема: Western Digital WD1500AHFD (SATA150).
Операционная система: Microsoft Windows Vista x86.

Хочется заметить, что материнская плата ASUS P5E3 Deluxe, основанная на новом наборе логики Intel X38, выбрана в качестве тестовой платформы не случайно. Хотя полноценную поддержку новых 45-нм процессоров, по идее, должны обеспечивать все материнские платы на чипсетах Intel X38 и P35, далеко не ко всем из них имеются необходимые обновления BIOS. Например, нашу традиционную тестовую платформу ASUS P5K3 Deluxe мы не смогли использовать именно по этой причине. Впрочем, следует понимать, что появление необходимых прошивок – это дело времени, тем более что до официального анонса Core 2 Extreme QX9650 остаётся ещё целых две недели.

Производительность



Синтетические тесты: SiSoftware Sandra XII (2008)

Мы очень редко используем тесты в Sandra для оценки производительности процессоров. Однако в данном случае мы решили сделать исключение. На результаты предлагаемых этим пакетом простых синтетических тестов размер и особенности строения кэш-памяти процессоров оказывают минимальное влияние, что может помочь нам оценить значимость микроархитектурных усовершенствований, сделанных в процессорах Penryn.


Наибольшее преимущество, превышающее 17 %, наблюдается в целочисленном мультимедийном тесте. Это – весьма показательный момент, так как этот тест – единственный из представленных, в котором могут использоваться новые инструкции SSE4. Иными словами, данный результат наглядно показывает, что очередное расширение набора SIMD инструкций, произошедшее в Penryn, при условии грамотного использования, действительно может ощутимо ускорить выполнение оптимизированных приложений. Также, солидный прирост производительности можно наблюдать и в арифметическом вещественночисленном тестах. Здесь успех Yorkfield следует отнести на счёт нового модуля Fast Radix-16 Divider.

Не столь внушительный, но заметный выигрыш можно наблюдать и в тестах практической пропускной способности памяти. В данном случае, очевидно, свою роль сыграл увеличенный кэш второго уровня.

Полагаясь на результаты Sandra XII, можно ожидать, что новый четырёхъядерный 45-нм процессор, выступая даже на одинаковой частоте со своим предшественником, сможет продемонстрировать заметное преимущество, обеспечиваемое лишь улучшениями в микроархитектуре. Впрочем, делать какие-то далеко идущие выводы, основываясь лишь на результатах синтетических тестов, неправильно: они сильно "выпячивают" определённые качества процессоров. Истинное же положение дел можно понять лишь по результатам измерения производительности в реальных задачах.

Общая производительность: SYSmark 2007 и PCMark Vantage

Для определения производительности тест SYSmark 2007 использует типичные сценарии работы в наиболее распространённых реальных приложениях.


Столь же впечатляющего преимущества Penryn, как наблюдалось в синтетических тестах, в реальных задачах нет. Средняя разница в быстродействии Yorkfield и Kentsfield, работающих на одинаковой тактовой частоте, не достигает даже и 2 %.

Новый тестовый пакет PCMark Vantage для измерения общей производительности использует несколько иной подход. Вместо запуска полноценных приложений он моделирует выполнение распространённых алгоритмов.


Результаты PCMark Vantage качественно похожи на то, что мы уже видели в SYSMark 2007. В среднем уровень быстродействия Core 2 Extreme QX9650 и Core 2 Extreme QX6850 расходится лишь на полтора процента.

3D игры


Игры всегда относились к приложениям, скорость в которых достаточно сильно коррелирует с размером кэш-памяти второго уровня. Так, по всей видимости, произошло и в этот раз: 12-мегабатный кэш Yorkfield сделал своё дело. В некоторых играх Core 2 Extreme QX9650 обходит по производительности Core 2 Extreme QX6850 почти на 7 %, в среднем же преимущество нового процессора в игровых задачах составляет без малого 4 %.

Кодирование медиаконтента


Существующие версии большинства кодеков пока что не поддерживают набор инструкций SSE4, хотя в нём есть команды, посредством которых возможно солидное увеличение скорости их работы. Именно поэтому в будущем мы ожидаем дальнейшее увеличение разрыва в быстродействии между новыми 45-нм и старыми 65-нм процессорами при кодировании медиаконтента. Иллюстрацией этого утверждения выступает результат в DivX 6.7: в этой версии кодека уже введён экспериментальный поиск совпадений через SSE4-инструкции, что приводит к почти 30-процентной победе нового процессора, поддерживающего SSE4.

К слову, как показало проведённое нами дополнительное исследование, величина наблюдаемого преимущества в DivX 6.7 сильно зависит от характера кодируемого видеоролика. В то время как на нашем тестовом фрагменте с батальной сценой преимущество Yorkfield составляло не более 30 %, предложенный нам компанией Intel ролик для испытаний, в котором значительную часть занимало изображение ряби на воде, демонстрировал почти 70-процентную разницу в скорости.

Другие приложения

Для этого раздела мы выбрали ещё четыре интересных распространённых задачи, которые тематически не подходят ни к одной из предыдущих частей изложения.


Приведённые примеры приложений хорошо иллюстрируют то, что процессоры Yorkfield могут обеспечивать гораздо более высокое быстродействие, нежели Kentsfield, даже в тех задачах, где новые SSE4-инструкции не поддерживаются. Для этого оказывается вполне достаточно других усовершенствований: в первую очередь, большего L2 кэша и ускорения выполнения операций деления.

Обобщённый итог

Подводя итог тестированию быстродействия, взглянем ещё раз на тот прирост, который способен обеспечить новый процессор Core 2 Extreme QX9650 по сравнению с Core 2 Extreme QX6850. Напомним, оба процессора работают на одинаковых тактовых частотах, поэтому наблюдаемое преимущество относится исключительно на счёт архитектурных усовершенствований.


Величина превосходства нового процессора сильно зависит от характера приложений. Но, несмотря на это, практически во всех задачах она положительна. Что, впрочем, совершенно неудивительно, учитывая что Core 2 Extreme QX9650 обладает большим L2-кэшем, отсутствующей у предшественника поддержкой SSE4 и целым рядом микроархитектурных улучшений. Более того, по мере внедрения набора инструкций SSE4 в приложения величина превосходства новых 45-нм процессоров над старыми 65-нм будет только расти. Что же касается сегодняшнего положения дел, то на данный момент Core 2 Extreme QX9650 оказался в среднем на 6,5 % быстрее, чем Core 2 Extreme QX6850.

Тепловыделение и энергопотребление


Микроархитектура Core позиционируется Intel не только в качестве высокопроизводительного решения. Intel считает её эффективной и с точки зрения соотношения "производительность на Ватт", в чём мы уже не раз убеждались в наших тестах. Впрочем, обычно экономичность не сильно волнует покупателей процессоров серии Core 2 Extreme. Тем более, что в отличие от обычных CPU, эти процессоры для энтузиастов имеют достаточно высокое типичное тепловыделение – 130 Вт.

Тем не менее, вполне логичным было бы ожидать, что выход 45-нм ядер и процессоров Penryn на их основе позволит дополнительно улучшить параметры экономичности. С другой стороны, для нового Core 2 Extreme QX9650, работающего на той же частоте, что и Core 2 Extreme QX6850 со старыми 65-нм ядрами, Intel всё же не снизил паспортное значение TDP. Поэтому давайте посмотрим, что же произошло с тепловыделением и энергопотреблением на практике.

Для испытаний нами было проведено сравнение величин потребляемой мощности, измеренных в аналогичных платформах, снабжённых различными процессорами – Yorkfield и Kentsfield. В проведённых опытах нами измерялся ток, проходящий через схему питания процессора, что позволяет оценить энергопотребление самих CPU (без учёта потерь в конвертере питания процессора). Во время тестов нагрузка на процессоры создавалась программой Prime95 25.3.

Кроме того, для полноты картины была измерена и температура процессорных ядер. Получение сведений о температуре CPU по данным встроенных в них термодатчиков выполнялось посредством утилиты CoreTemp 0.95.4. Для охлаждения процессоров в процессе работы был использован один и тот же стандартный "коробочный" кулер.

Во время тестов энергосберегающие Enhanced Intel SpeedStep и Enhanced Halt State (C1E) были активизированы. Кстати, процессоры Penryn, точно также как и их предшественники, в состояниях с низкой загрузкой сбрасывают свой коэффициент умножения до 6x.


Полученные значения температуры и энергопотребления приведены в таблице ниже.


Как того и следовало ожидать, новый технологический процесс с нормами производства 45 нм позволил Intel ощутимо снизить тепловыделение и энергопотребление своих процессоров. Впрочем, это и неудивительно. Как уже было сказано выше, новые транзисторы, в которых используется high-k диэлектрик, имеют гораздо более низкие токи утечки, что позволило снизить рабочие токи и напряжения, необходимые для стабильного функционирования процессора в целом.

Несмотря на то, что Core 2 Extreme QX9650 и Core 2 Extreme QX6850 характеризуются одинаковым уровнем паспортного типичного тепловыделения, на практике Yorkfield потребляет под максимальной нагрузкой почти на 30 % меньше. В состоянии же покоя выигрыш в энергопотреблении ещё больше, он превышает величину 50 %.

Разница в энергопотреблении отражается вполне естественным образом и на рабочих температурах. Процессор Yorkfield при своём функционировании нагревается осязаемо меньше, что даёт надежду на возможность его значительного разгона. К нему и перейдём.

Разгон


Для экспериментов по разгону мы использовали ту же самую платформу, что и о время тестов быстродействия. Однако для отвода тепла от процессора мы применили не стандартный "коробочный" кулер, а гораздо более производительный Scythe Infinity с одним вентилятором со скоростью вращения 1800 об/мин.

Штатное напряжение попавшего в нашу лабораторию процессора оказалось равным 1,2 В. И в первую очередь мы решили попробовать разогнать его, не повышая это напряжение.

Традиционно, Intel на фиксирует множитель у дорогих процессоров для энтузиастов. Core 2 Extreme QX9650 в этом плане не оказался исключением. Используя данную возможность, нам удалось добиться устойчивого функционирования процессора на частоте 3410 МГц, полученной как 10 x 341 МГц. При более высоких частотах у CPU, к сожалению, начинались проблемы с прохождением теста стабильности Prime95.


Впрочем, разгон четырёхъядерного процессора без повышения напряжения питания до 3,4 ГГц – неплохой результат. Хотя некоторые процессоры Kentsfield степпинга G0 были способны на подобное, из виду не следует упускать их более высокое номинальное напряжение питания.

Вторая часть испытаний проводилась при увеличенном до 1,5 В напряжении на CPU. Надо заметить, что более низкое тепловыделение Yorkfield действительно сильно помогает при разгоне: даже при значительном увеличении напряжения выше штатного значения тестовый четырёхъядерный процессор не перегревался и не уходил в "троттлинг".

Максимальная частота, на которой нам удалось добиться абсолютно стабильной работы Core 2 Extreme QX9650 в разогнанном состоянии, составила 4,068 ГГц. Она была получена как 12 x 339 МГц.


Таким образом, в разгоне с воздушным охлаждением новым процессорам вполне может покоряться 4-гигагерцовая частота. Это ли не яркое подтверждение роста частотного потенциала новых 45-нм ядер?

Кстати, при эксплуатации на частоте 4,086 ГГц тестовый CPU сохранял вполне приемлемый температурный режим. Его максимальная температура не зашкаливала за 85 °С, а минимальная температура в состоянии покоя составляла 43 °С.

Выводы


Итак, компания Intel совершила очередной сильный эволюционный ход, подготовив к выпуску процессоры семейства Penryn с 45-нм ядрами. Освоение нового технологического процесса вкупе с добавлением набора инструкций SSE4, увеличением кэша второго уровня и прочими микроархитектурными улучшениями позволили поднять производительность CPU ещё на несколько процентов без увеличения тактовой частоты. Кроме того, одновременно с этим инженерам компании удалось добиться снижения тепловыделения и энергопотребления процессоров, хотя и их предшественники отличались не плохими показателями экономичности. Также ощутимо вырос и частотный потенциал, что, несомненно, порадует оверклокеров.


В результате процессоры Penryn производят исключительно положительное впечатление, по всем параметрам они превосходят любые другие представленные на рынке решения для настольных систем. Фактически, единственным недостатком новых CPU является лишь то, что в данный момент их нельзя купить в магазине, и в этом году на прилавках имеет шанс появиться лишь самый быстрый и необоснованно дорогой процессор Core 2 Extreme QX9650.

Рыночная же экспансия полных линеек процессоров Yorkfield и Wolfdale ожидается лишь в начале следующего года. Но тогда им придётся соперничать не только со своими заведомо худшими предшественниками, но и с новыми процессорами компании AMD. Исход этого поединка пока неизвестен, однако то, что Intel хорошо подготовилась к выходу конкурирующих процессоров семейства Phenom, сомнению не подлежит.

В заключение хочется подметить один любопытный факт. Несмотря на то, что уже почти полтора года с момента появления первых CPU с микроархитекутрой Core и до сегодняшнего момента мы продолжаем говорить о хорошем частотном потенциале процессорных ядер, используемых в Core 2, Intel не спешит поднимать тактовые частоты своих CPU. Выпущенный в июле прошлого года процессор Core 2 Etreme Q6800 имел частоту 2,93 ГГц, анонсируемый же через две недели Core 2 Extreme QX9650 будет работать на частоте 3,0 ГГц. За это время производительность процессоров Intel для энтузиастов увеличивалась исключительно благодаря другим шагам: увеличению количества ядер, разгону системной шины, внедрению микроархитектурных усовершенствований. Поэтому складывается впечатление, что в отсутствие конкуренции в верхнем сегменте рынка Intel преднамеренно не хочет ускорять свои процессоры. Так ли это – покажет следующий год, когда, надеемся, копания AMD всё-таки сможет противопоставить быстрым четырёхъядерным процессорам Intel свои новые продукты. В любом случае, 2008 год обещает стать весьма интересным.