Обзор Intel Xeon E5 v4: тестирование Broadwell-EP с высокими нагрузками на сервер

Xeon_678x452-326x230

Xeon E5 v4 SKU и цены

На момент публикации у нас нет точных цен на Xeon E5 v4. Но в целом цены примерно на 1-2% выше, чем у сопоставимого Xeon E5 v3.

 

V4vsV3Estimated-performance1_575px

 

Intel Xeon E5 v4 SKU
Ядра / ПотокиTDPБазовая тактовая частотаЦена
E5-2699 v422/44145W2.2GHz$ 4115
E5-2698 v420/40135W2.2GHz$ 3228
E5-2697A v416/32145W2.6GHz$ 2891
E5-2697 v418/36145W2.3GHz$ 2702
E5-2695 v418/36120W2.1GHz$ 2424
E5-2690 v414/28135W2.6GHz$ 2090
E5-2687W v412/24160W3.0GHz$ 2141
E5-2683 v416/32120W2.1GHz$ 1846
E5-2680 v414/28120W2,4$ 1745
E5-2667 v48/16135W3.2GHz$ 2057
E5-2660 v414/28105W2.0GHz$ 1445
E5-2650L v414/2865W1.7GHz$ 1329
E5-2650 v412/24105W2.2GHz$ 1166
E5-2643 v46/12135W3.4GHz$ 1552
E5-2640 v410/2090W2,4$ 939
E5-2637 v44/8135W3,5 ГГц$ 996
E5-2630 v410/2085W2.2GHz$ 667
E5-2630L v410/2055W1.8GHz$ 612
E5-2623 v44/885W2.6GHz$ 444
E5-2620 v48/1685W2.1GHz$ 417
E5-2609 v48/885W1.7GHz$ 306
E5-2603 v46/685W1.7GHz$ 213

Между тем собственные оценки производительности Intel не совсем впечатляют. Их оценки основаны на почти идеально масштабируемых тестах SPECrate, и даже эти достижения «идеального мира» просто скромны, на самом деле почти не вдохновляют. Мы уже говорили об этом: этот рынок остро нуждается в конкуренции, если мы хотим, чтобы новое поколение принесло более захватывающие улучшения в показателях производительности на доллар.

Конфигурация и методология тестирования

Все наши тесты проводились на Ubuntu Server 14.04 LTS. Правда, некоторым нашим читателям это может показаться старым дистрибутивом, но предприятия предпочитают стабильность и поддержку новейшему программному обеспечению. Мы обновили этот дистрибутив до последней версии (14.04.4), которая предоставляет нам более обширную поддержку оборудования.

Чтобы сделать вещи более интересными, мы протестировали 4 различных SKU и включили Xeon E5 v3 предыдущего поколения, Xeon E5-2697v2 (High End Ivy Bridge EP) и E5-2690 (High End Sandy Bridge EP). Мы даже включили Xeon X5680 для сравнения. Xeon E5-2695 v4 интересно сравнить с Xeon E5-2699 v3, так как он имеет такое же количество ядер и более или менее одинаковую скорость. Таким образом, мы могли бы количественно оценить улучшение, которое ядро ​​Broadwell предлагает по сравнению с ядром Haswell.

И последнее, но не менее важное: мы хотим отметить, как графики производительности имеют цветовую кодировку. Оранжевый – это последнее поколение (v4), темно-синий – предыдущее (v3), а светло-синий – это поколение, которое (возможно) должен заменить текущий (v4) (Xeon E5 v1).

Сервер Intel Xeon E5 – S2600WT (корпус 2U)

ЦПУДва процессора Intel Xeon E5-2699v4 (2,2 ГГц, 22c, 55 МБ L3, 145 Вт)
Два процессора Intel Xeon E5-2695v4 (2,1 ГГц, 18c, 45 МБ L3, 145 Вт)
Два процессора Intel Xeon E5-2699v3 (2,3 ГГц, 18c, 45 МБ) L3, 145 Вт)
Два процессора Intel Xeon E5-2695v3 (2,3 ГГц, 14c, 35 МБ L3, 120 Вт)
Два процессора Intel Xeon E5-2667v3 (3,2 ГГц, 8c, 20 МБ L3, 135 Вт)
баран128 ГБ (8×16 ГБ) Kingston DDR-2400
Внутренние Диски2x Intel SSD3500 400 ГБ
Материнская платаСерверная системная плата Intel Wildcat Pass
Набор микросхемIntel Wellsburg B0
Версия BIOS1/28/2016
PSUDelta Electronics 750 Вт DPS-750XB A (80+ платина)

Типичные настройки BIOS можно увидеть ниже.

V4_CPUbios_575px

SuperMicro 6027R-73DARF (шасси 2U)

ЦПУДва процессора Intel Xeon E5-2697 v2 (2,7 ГГц, 12c, 30 МБ, L3, 130 Вт)
Два процессора Intel Xeon E5-2690 (2,9 ГГц, 8c, 20 МБ, L3, 135 Вт)
баран128 ГБ (8×16 ГБ) Samsung на частоте 1866 МГц
Внутренние Диски2x Intel SSD3500 400 ГБ
Материнская платаSuperMicro  X9DRD-7LN4F
Набор микросхемIntel C602J
Версия BIOSR 3.0a (6 декабря 2013 г.)
PSUSupermicro 740W PWS-741P-1R (80+ платина)

Все C-состояния включены в обоих BIOS.

Другие заметки

Оба сервера питаются от стандартной европейской линии электропередачи 230 В (макс. 16 А). Температура воздуха в помещении контролируется и поддерживается на уровне 23 ° C нашими кондиционерами Airwell CRAC.

 

Одноядерная целочисленная производительность с SPEC CPU2006

В прошлых обзорах серверов я использовал сжатие и декомпрессию LZMA (7-zip) для оценки однопоточной производительности. Но я хорошо знал, что, хотя это был приличный целочисленный тест, он также дал очень близорукий взгляд на процесс. Заметив, что мои коллеги использовали SPEC CPU2006, и после обсуждения этого вопроса с несколькими людьми, я понял, что использование SPEC CPU2006 было намного лучшим способом оценки производительности одного ядра. Хотя SPEC CPU2006 в большей степени ориентирован на высокопроизводительные вычисления и рабочие станции, он содержит множество целочисленных рабочих нагрузок.

Я также хотел, чтобы настройки были как можно более “нормальными”. Поэтому я использовал:

  • 64-битный gcc: наиболее используемый компилятор в linux, хороший универсальный компилятор, который не пытается «сломать» тесты (libquantum …)
  • gcc версия 4.8.4: 4.8.x существует уже давно, очень зрелая версия
  • -O2 -fno-strict-aliasing: стандартные настройки компилятора, которые используют многие разработчики
  • Запустите 2 копии и привяжите их к первому ядру

Конечная цель состоит в том, чтобы измерить производительность в не «агрессивно оптимизированных» приложениях, где по какой-то причине, как это часто бывает, «многопоточная недружественная» задача заставляет нас ждать. Поскольку мы хотим сравнить эти числа с другими архитектурами, такими как IBM POWER 8, мы решили использовать все доступные потоки на одном ядре. В случае Intel это означает, что поверх него работают один физический и два одновременно работающих потока.

 Мы включили Opteron 6376 по ностальгическим причинам. Мы показываем результаты двух потоков, работающих поверх одного модуля с двумя «целочисленными ядрами».
субтестXeon E5-2690Opteron 6376Xeon E5-2697v2Xeon E5-2667 v3Xeon E5-2699 v3Xeon E5-2699 v4
400.perlbench41,129,337,642,639,9+36,6
401.bzip233,424,130,133,129,925,3
403.gcc40,226,738,942,436,433,3
429.mcf45,131,746,846,441,643,9
445.gobmk36,4+25,533,234,931,727,7
456.hmmer30,426,127,63127,128,4
458.sjeng35,224,732,835,230,528,3
462.libquantum74,939,979,384,462,267,3
464.h264ref51,734,248,152,145,240,7
471.omnetpp+24,525,326,829,426,629,9
473.astar28,220,726,127,92423,6
483.xalancbmk41,528,241,448,242,441,8

Если вы не привыкли видеть эти цифры, это не говорит вам слишком много. Поскольку Sandy Bridge EP (Xeon E5 v1) около 4 лет, серверы на базе этого процессора будут заменены более новыми. Таким образом, Sandy Bridge является нашей рекомендацией, и производительность Sandy Bridge считается 100%.

субтестТип приложенияXeon E5-2690Opteron 6376Xeon E5-2697v2Xeon E5-2667 v3Xeon E5-2699 v3Xeon E5-2699 v4
400.perlbenchСпам-фильтр100%71%91%104%97%89%
401.bzip2компрессия100%72%90%99%90%76%
403.gccсоставление100%66%97%105%91%83%
429.mcfПланирование транспортного средства100%70%104%103%92%97%
445.gobmkИИ игры100%70%91%96%87%76%
456.hmmerПоследовательность белка анализы100%86%91%102%89%93%
458.sjengшахматы100%70%93%100%87%80%
462.libquantumКвантовый сим100%53%106%113%83%90%
464.h264refКодирование видео100%66%93%101%87%79%
471.omnetppСеть сим100%103%109%120%110%122%
473.astarНайти путь100%73%93%99%85%84%
483.xalancbmkОбработка XML100%68%100%116%102%101%

Многие умные люди потратили недели, если не месяцы, на анализ SPEC CPU2006, поэтому мы не будем притворяться, что можем предложить вам полную картину через несколько дней. Если вам нужен подробный анализ компиляторов и CPU 2006, я рекомендую очень подробную статью  SPEC CPU 2006 meister Andreas Stiller в февральском выпуске C’T (немецкий компьютерный журнал).

Нам нужно гораздо больше данных профилирования, чем мы могли бы собрать за последние недели. Но для того, что мы можем сделать, мы начнем с самого важного параметра: clockspeed.

Одна из самых важных вещей, которую нужно осознать, заключается в том, что – особенно с плохо загруженными рабочими нагрузками – эти массивные многоядерные процессоры почти никогда не работают на заявленной тактовой скорости.

  • Xeon E5-2690 может работать на частоте 3,3 ГГц с занятыми всеми ядрами и способен развивать частоту до 3,8 ГГц
  • Xeon E5-2697 v2 может работать на частоте 3 ГГц с занятыми всеми ядрами и способен развивать частоту до 3,5 ГГц
  • Xeon E5-2699 v3 может работать на частоте 2,8 ГГц со всеми занятыми ядрами и способен развивать частоту до 3,6 ГГц
  • Xeon E5-2667 v3 3,2 ГГц – это специализированная высокочастотная модель. Он может работать на частоте 3,4 ГГц со всеми занятыми ядрами и способен развивать частоту до 3,6 ГГц.
  • Xeon E5-2699 v4 может работать на частоте 2,8 ГГц со всеми занятыми ядрами и способен развивать частоту до 3,6 ГГц

Так что это уже многое объясняет. В отличие от многих эталонных приложений, SPEC CPU2006 работает в течение длительного времени (от 5 до 15 минут на тест), и наше первое впечатление состоит в том, что части HCC не могут поддерживать все свои ядра при максимальном турбо-ускорении. В противном случае нет причин, по которым Xeon E5-2699 v3 или v4 будет работать хуже, чем Xeon E5-2667 v3: оба могут работать на частоте 3,6 ГГц, когда активно одно ядро.

Симулятор сети с низким IPC и интенсивным использованием памяти omnetppp, похоже, является единственным тестом, который работает значительно лучше на новых ядрах (Haswell, Broadwell) по сравнению с Sandy Bridge. Похоже, что это единственный тест, в котором чипы с большим количеством ядер (E5-2699 v4, E5-2699 v3) продолжают превосходить Sandy Bridge. Мы могли бы точно определить причину, проводя тестирование с различными скоростями памяти и каналами. E5-2699 v4 может предложить самую высокую производительность благодаря большему кэш-памяти L3 (55 МБ) и более высокой скорости DIMM (DDR4-2400) по сравнению с Sandy Bridge (20 МБ, DDR3-1600). В противном случае, когда мы сохраняем более или менее постоянную тактовую частоту, глядя на Xeon E5-2667v3 и Xeon E5-2690, мы получаем разницу скорости в 1-5% и только подтесты с интенсивным использованием памяти (omnetpp, Libquantum) и xalancbmk ( низкий IPC, ветвление интенсивно) показывают более высокие улучшения.

Как только мы протестируем оба топовых SKU с помощью «-Ofast» (более агрессивная настройка компилятора), результаты немного изменятся:

субтестТип приложенияXeon E5-2699 v4 против Xeon E5-2690 (-Ofast)Xeon E5-2699 v4 против Xeon E5-2690 (-O2)
400.perlbenchСпам-фильтр111%89%
401.bzip2компрессия94%76%
403.gccсоставление95%83%
429.mcfПланирование транспортного средства114%97%
445.gobmkИИ игры90%76%
456.hmmerПоследовательность белка анализы106%93%
458.sjengшахматы93%80%
462.libquantumКвантовый сим101%90%
464.h264refКодирование видео89%79%
471.omnetppСеть сим132%122%
473.astarНайти путь98%84%
483.xalancbmkОбработка XML105%101%

Переключение с -O2 на -Ofast повышает абсолютную производительность Broadwell-EP более чем на 19%. Между тем относительное преимущество в производительности по сравнению с Xeon E5-2690 составляет в среднем 3%. В результате недостаток тактовой частоты последнего Xeon сводится на нет увеличением IPC. Очевидно, что последнее поколение Xeons выигрывает от агрессивных оптимизаций больше, чем предыдущие. Это неудивительно, конечно, но интересно, что новейшие Xeon нуждаются в большей оптимизации, чтобы «держать линию» в производительности одного ядра.

Пока мы можем сделать вывод, что если вы обновите Xeon E5-2xxx v1 до аналогичной модели v4, ваш однопоточный целочисленный код не будет работать быстрее без перекомпиляции и оптимизации. Усовершенствования процесса были использованы главным образом для добавления большего количества ядер в одном и том же диапазоне энергопотребления, в то время как Intel также продала несколько скоростных бинов, чтобы добавить еще больше ядер в топовые модели. В результате одноядерная целочисленная производительность в основном держит линию, не более того. Единственным исключением являются приложения с интенсивным использованием памяти, которые получают выгоду от каждого растущего L3-кэша и более быстрой технологии DRAM.

Одноядерная целочисленная производительность с SPEC CPU2006

В прошлых обзорах серверов я использовал сжатие и декомпрессию LZMA (7-zip) для оценки однопоточной производительности. Но я хорошо знал, что, хотя это был приличный целочисленный тест, он также дал очень близорукий взгляд на процесс. Заметив, что мои коллеги использовали SPEC CPU2006, и после обсуждения этого вопроса с несколькими людьми, я понял, что использование SPEC CPU2006 было намного лучшим способом оценки производительности одного ядра. Хотя SPEC CPU2006 в большей степени ориентирован на высокопроизводительные вычисления и рабочие станции, он содержит множество целочисленных рабочих нагрузок.

Я также хотел, чтобы настройки были как можно более “нормальными”. Поэтому я использовал:

  • 64-битный gcc: наиболее используемый компилятор в linux, хороший универсальный компилятор, который не пытается «сломать» тесты (libquantum …)
  • gcc версия 4.8.4: 4.8.x существует уже давно, очень зрелая версия
  • -O2 -fno-strict-aliasing: стандартные настройки компилятора, которые используют многие разработчики
  • Запустите 2 копии и привяжите их к первому ядру

Конечная цель состоит в том, чтобы измерить производительность в не «агрессивно оптимизированных» приложениях, где по какой-то причине, как это часто бывает, «многопоточная недружественная» задача заставляет нас ждать. Поскольку мы хотим сравнить эти числа с другими архитектурами, такими как IBM POWER 8, мы решили использовать все доступные потоки на одном ядре. В случае Intel это означает, что поверх него работают один физический и два одновременно работающих потока.

Мы включили Opteron 6376 по ностальгическим причинам. Мы показываем результаты двух потоков, работающих поверх одного модуля с двумя «целочисленными ядрами».
субтестXeon E5-2690Opteron 6376Xeon E5-2697v2Xeon E5-2667 v3Xeon E5-2699 v3Xeon E5-2699 v4
400.perlbench41,129,337,642,639,9+36,6
401.bzip233,424,130,133,129,925,3
403.gcc40,226,738,942,436,433,3
429.mcf45,131,746,846,441,643,9
445.gobmk36,4+25,533,234,931,727,7
456.hmmer30,426,127,63127,128,4
458.sjeng35,224,732,835,230,528,3
462.libquantum74,939,979,384,462,267,3
464.h264ref51,734,248,152,145,240,7
471.omnetpp+24,525,326,829,426,629,9
473.astar28,220,726,127,92423,6
483.xalancbmk41,528,241,448,242,441,8

Если вы не привыкли видеть эти цифры, это не говорит вам слишком много. Поскольку Sandy Bridge EP (Xeon E5 v1) около 4 лет, серверы на базе этого процессора будут заменены более новыми. Таким образом, Sandy Bridge является нашей рекомендацией, и производительность Sandy Bridge считается 100%.

субтестТип приложенияXeon E5-2690Opteron 6376Xeon E5-2697v2Xeon E5-2667 v3Xeon E5-2699 v3Xeon E5-2699 v4
400.perlbenchСпам-фильтр100%71%91%104%97%89%
401.bzip2компрессия100%72%90%99%90%76%
403.gccсоставление100%66%97%105%91%83%
429.mcfПланирование транспортного средства100%70%104%103%92%97%
445.gobmkИИ игры100%70%91%96%87%76%
456.hmmerПоследовательность белка анализы100%86%91%102%89%93%
458.sjengшахматы100%70%93%100%87%80%
462.libquantumКвантовый сим100%53%106%113%83%90%
464.h264refКодирование видео100%66%93%101%87%79%
471.omnetppСеть сим100%103%109%120%110%122%
473.astarНайти путь100%73%93%99%85%84%
483.xalancbmkОбработка XML100%68%100%116%102%101%

Многие умные люди потратили недели, если не месяцы, на анализ SPEC CPU2006, поэтому мы не будем притворяться, что можем предложить вам полную картину через несколько дней. Если вам нужен подробный анализ компиляторов и CPU 2006, я рекомендую очень подробную статью  SPEC CPU 2006 meister Andreas Stiller в февральском выпуске C’T (немецкий компьютерный журнал).

Нам нужно гораздо больше данных профилирования, чем мы могли бы собрать за последние недели. Но для того, что мы можем сделать, мы начнем с самого важного параметра: clockspeed.

Одна из самых важных вещей, которую нужно осознать, заключается в том, что – особенно с плохо загруженными рабочими нагрузками – эти массивные многоядерные процессоры почти никогда не работают на заявленной тактовой скорости.

  • Xeon E5-2690 может работать на частоте 3,3 ГГц с занятыми всеми ядрами и способен развивать частоту до 3,8 ГГц
  • Xeon E5-2697 v2 может работать на частоте 3 ГГц с занятыми всеми ядрами и способен развивать частоту до 3,5 ГГц
  • Xeon E5-2699 v3 может работать на частоте 2,8 ГГц со всеми занятыми ядрами и способен развивать частоту до 3,6 ГГц
  • Xeon E5-2667 v3 3,2 ГГц – это специализированная высокочастотная модель. Он может работать на частоте 3,4 ГГц со всеми занятыми ядрами и способен развивать частоту до 3,6 ГГц.
  • Xeon E5-2699 v4 может работать на частоте 2,8 ГГц со всеми занятыми ядрами и способен развивать частоту до 3,6 ГГц

Так что это уже многое объясняет. В отличие от многих эталонных приложений, SPEC CPU2006 работает в течение длительного времени (от 5 до 15 минут на тест), и наше первое впечатление состоит в том, что части HCC не могут поддерживать все свои ядра при максимальном турбо-ускорении. В противном случае нет причин, по которым Xeon E5-2699 v3 или v4 будет работать хуже, чем Xeon E5-2667 v3: оба могут работать на частоте 3,6 ГГц, когда активно одно ядро.

Симулятор сети с низким IPC и интенсивным использованием памяти omnetppp, похоже, является единственным тестом, который работает значительно лучше на новых ядрах (Haswell, Broadwell) по сравнению с Sandy Bridge. Похоже, что это единственный тест, в котором чипы с большим количеством ядер (E5-2699 v4, E5-2699 v3) продолжают превосходить Sandy Bridge. Мы могли бы точно определить причину, проводя тестирование с различными скоростями памяти и каналами. E5-2699 v4 может предложить самую высокую производительность благодаря большему кэш-памяти L3 (55 МБ) и более высокой скорости DIMM (DDR4-2400) по сравнению с Sandy Bridge (20 МБ, DDR3-1600). В противном случае, когда мы сохраняем более или менее постоянную тактовую частоту, глядя на Xeon E5-2667v3 и Xeon E5-2690, мы получаем разницу скорости в 1-5% и только подтесты с интенсивным использованием памяти (omnetpp, Libquantum) и xalancbmk ( низкий IPC, ветвление интенсивно) показывают более высокие улучшения.

Как только мы протестируем оба топовых SKU с помощью «-Ofast» (более агрессивная настройка компилятора), результаты немного изменятся:

субтестТип приложенияXeon E5-2699 v4 против Xeon E5-2690 (-Ofast)Xeon E5-2699 v4 против Xeon E5-2690 (-O2)
400.perlbenchСпам-фильтр111%89%
401.bzip2компрессия94%76%
403.gccсоставление95%83%
429.mcfПланирование транспортного средства114%97%
445.gobmkИИ игры90%76%
456.hmmerПоследовательность белка анализы106%93%
458.sjengшахматы93%80%
462.libquantumКвантовый сим101%90%
464.h264refКодирование видео89%79%
471.omnetppСеть сим132%122%
473.astarНайти путь98%84%
483.xalancbmkОбработка XML105%101%

Переключение с -O2 на -Ofast повышает абсолютную производительность Broadwell-EP более чем на 19%. Между тем относительное преимущество в производительности по сравнению с Xeon E5-2690 составляет в среднем 3%. В результате недостаток тактовой частоты последнего Xeon сводится на нет увеличением IPC. Очевидно, что последнее поколение Xeons выигрывает от агрессивных оптимизаций больше, чем предыдущие. Это неудивительно, конечно, но интересно, что новейшие Xeon нуждаются в большей оптимизации, чтобы «держать линию» в производительности одного ядра.

Пока мы можем сделать вывод, что если вы обновите Xeon E5-2xxx v1 до аналогичной модели v4, ваш однопоточный целочисленный код не будет работать быстрее без перекомпиляции и оптимизации. Усовершенствования процесса были использованы главным образом для добавления большего количества ядер в одном и том же диапазоне энергопотребления, в то время как Intel также продала несколько скоростных бинов, чтобы добавить еще больше ядер в топовые модели. В результате одноядерная целочисленная производительность в основном держит линию, не более того. Единственным исключением являются приложения с интенсивным использованием памяти, которые получают выгоду от каждого растущего L3-кэша и более быстрой технологии DRAM.

Многопоточная целочисленная производительность

Хотя сжатие и декомпрессия сами по себе не являются эталонными тестами (по крайней мере, в отношении серверов), все больше и больше серверов должны выполнять эти задачи как часть большей роли (например, сжатие базы данных, оптимизация веб-сайта).

67413c

67413d

 

Это два приложения, которые действительно выигрывают от философии Intel, согласно которой «как можно меньше ядер с низким энергопотреблением в одном кристалле, сохраняя при этом линейную однопоточную производительность». Лучший Xeon E5 версии 4 не менее чем в 2,6 раза быстрее, чем Xeon E5 версии 1.

Заключительные мысли

Из-за ограниченного количества времени, которое мы должны были проводить с новыми Broadwell-EP Xeons в преддверии сегодняшнего эмбарго, мы потратили большую часть нашего времени на наших новых критериях. Однако мы также быстро проверили мощность. Похоже, что и мощность холостого хода, и нагрузка при полной загрузке с плавающей запятой немного уменьшились, но нам необходимо выполнить более тщательную проверку, чтобы дополнительно подтвердить и охарактеризовать это.

Между тем, учитывая то, что было замечательным предложением Xeon E5-2650L v3, очень жаль, что Intel не включила такой низкий SKU в наши образцы для обзора. Xeon E5-2699 v4 – это надежный продукт, но он не работает в домашних условиях. Либо это просто сбой нашей текущей настройки (прошивки?), Но кажется, что новые Xeon E3 v4s не достигают тех же турбо скоростей, что и наши Xeon E5 v3s. В результате однопоточная производительность (иногда) немного ниже, и новому процессору требуется больше ядер, чтобы превзойти предыдущее.

Мы заметили это главным образом в приложениях HPC, где новый Xeon – немного смешанный пакет. Тем не менее, учитывая, что от 72 до 88 потоков – это много для многих интересных приложений (Spark, базы данных SQL …), безусловно, есть место для процессоров, которые жертвуют большим количеством ядер для более высокой однопоточной производительности (без преувеличения). Мы застряли на частоте 3,6 ГГц слишком долго.

С учетом вышесказанного, нет никаких сомнений в том, что Xeon E5-2699 v4 обеспечивает одно приложение, которое наиболее важно: виртуализация.
v4Refresh_575px

Хотя мы еще не проводили всесторонних испытаний на основе гипервизора, мы почти уверены, что дополнительные ядра и меньшие задержки VMexit обеспечат хорошую производительность этого ЦП в виртуализированных средах. Технология директора ресурсов Intel и множество улучшений (объявленных прерываний), которые помогают гипервизору лучше выполнять задачи с интенсивным вводом-выводом, являются очень привлекательными функциями.

Хотя это немного, по сравнению с Xeon E5 v3s на базе Haswell-EP, производительность также выросла примерно на 20% в ключевых приложениях, таких как базы данных и приложения ERP. И хотя в некоторых случаях мы можем жаловаться всем, что хотим, на небольшое снижение производительности в однопоточном режиме, но дело в том, что Intel увеличила производительность в этих ключевых приложениях в 2–2,7 раза за четыре года, сохраняя при этом энергопотребление. более или менее то же самое. Другими словами, обновление этих серверов Sandy Bridge-EP окупится. И для многих предприятий это то, что имеет значение.

Источник: https://www.anandtech.com/show/10158/the-intel-xeon-e5-v4-review/

 




Опубликовано 01.04.2016 LGA771-Intel-Xeon в категории "Обзор железа

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *