Успех процессора AMD Ryzen и отличия архитектуры Zen от Bulldozer — ничего нового

За последние несколько лет AMD застряла на техпроцессе 32- и 28-нм чипов, что стало препятствием для лобового наращивания мощности устройств.

Напомню, что Bulldozer делался в спешке, выпущен был сырым, фактически более менее зрелая ревизия появилась в Piledriver.

Универсальный подход в Bulldozer снижал многопоточную производительность на 20% по сравнению с обычным 2-ядерным подходом.

Steamroller был первой существенной переработкой архитектуры Bulldozer, исправив В Steamroller AMD отменила спорные решения по «обобществлению» дефицитных ресурсов для исполнительных устройств,  вернувшись ближе к 2-ядерной архитектуре.

Для повышения производительности CPU компания также значительно улучшила принцип работы кеш-памяти L1 (одновременно нарастив объём в 1,5—2 раза).

В целом также AMD не стояла не месте, сосредоточившись на менее мощной архитектуре Jaguar (успешно примененной в приставках Microsoft, Sony).

Но вернемся к «новинке».

Если описывать кратко, то, помимо усовершенствований, касающихся платформы (DDR4, кэши) и «питания» исполнительных устройств (кэши, предсказание переходов, ), ничего нового фактически нет, просто перераспределение, перестановка элементов микроархитектуры ПЛЮС УДВОЕНИЕ процессора.

Ядро/модуль состоит, как и раньше, из 4 64-битных ALU (целочисленных устройств) , 2 128-битных FPU (операции с вещественными числами и мультимедия) .  2 MMX юнита, которые, считались третьим (или третьим и четвертым) устройством блока вычислений с плавающей запятой, убраны. То, что представлялось системе как 2 слабеньких ядра (каждый с 2 ALU) с 1 разделяемым общим FPU (из двух 128-битных FMAC и 2 64-битных MMX). Такой подход считается кластерной многопоточностью.

Теперь те же 4 64-битных ALU + 2 128-битных считаются 1 мощным «широким» ядром с поддержкой SMT (2 потока).

Старые процессоры FX (на Bulldozer) продавались как 8-ядерные (8 слабеньких ядер, являющихся 4 полноценными ядрами-модулями)=16 ALU, новые Ryzen являются двумя FX на одном кристалле (итого 32 ALU устройств предлагают пользователям и операционной системе 16 логических ядер/потоков).

Посмотрите на сравнение технических характеристик процессоров — AMD просто завалила конкурента транзисторами и кэшем.

Процессор AMD Ryzen 7 1800Х Intel Core i7-6700K Intel Core i7-5820K Intel Core i7-5960X AMD FX-9590
Название ядра Ryzen Skylake Haswell-E Haswell-E Piledriver
Технология пр-ва 14 нм 14 нм 22 нм 22 нм 32 нм
Частота ядра, ГГц 3,6/4,0 4,0/4,2 3,3/3,6 3,0/3,5 4,7/5
Кол-во ядер/потоков 8/16 4/8 6/12 8/16 8/8
Кэш L1 (сумм.), I/D, КБ 512/256 128/128 192/192 256/256 16/64
Кэш L2, КБ 512 4×256 6×256 8×256 4×2048
Кэш L3, МиБ 16 8 15 20 8
Оперативная память 2×DDR4-2400 2×DDR3-1600 /
2×DDR4-2133
4×DDR4-2133 4×DDR4-2133 2×DDR3-1866
TDP, Вт 95 91 140 140 220
Цена
39000
34000
32000
85000
19000

Максимальные частоты остались около 4-5 ГГц (что еще раз указывает на неизменность дизайна ключевых исполнительных устройств), хотя энергопотребление конечно снизилось за счет уменьшения размеров транзисторов.

Картинки по запросу ryzen 7

Если перевернуть медаль, то из реальной работы —  каждое ядро получило существенно снижающий накладные расходы по декодированию инструкций собственный кеш микроопераций, полностью переделанный скоростной кэш 1-го уровня с обратной записью, собственный для каждого ядра блок FPU и выделенный L2-кеш, а также массу иных оптимизаций.

AMD устранило узкие места на входе в процессор: объём окна планировщика увеличился на 75 процентов, а в целом планировщики могут отправлять на исполнение в полтора раза больше инструкций, чем это было в ядрах Excavator.

 

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *