Въведение През последните няколко години AMDзагуби почти всички завоювани преди това позиции на пазара на процесори за настолни компютри. Със семейството от ядра Bulldozer, компанията беше заседнала в света на 32nm и 28nm планарни транзисторни чипове, докато Intel многократно правеше архитектурни подобрения, преминаваше към 3D транзистори и също така въведе производствени процеси с 22nm и 14nm стандарти. В резултат на това в асортимента на AMD просто нямаше предложения за продуктивни компютри и Intel всъщност успя да заеме монополна позиция. Но за щастие AMD реши да не се примирява с настоящата ситуация и посвети последните няколко години на работа върху нов дизайн на процесора - микроархитектурата Zen. Той обещава всичко, което ентусиастите биха искали да видят в модерен процесор: висока специфичност, добра енергийна ефективност, модерна технологияпроизводство и атрактивна цена. AMD Ryzen са първите процесори на новата микроархитектура и ако разработчиците наистина изпълниха всичките си обещания, то днес ще видим триумфалното завръщане на AMD на пазара.

Zen е огромна крачка напред спрямо миналите микроархитектури на AMD. Това не е по-нататъшно развитие на Bulldozer, а напълно нов и независим проект, който е постигнал безпрецедентно увеличение на ефективността. В резултат на AMD работаговори за 52 процента увеличение на IPC (броя инструкции, изпълнявани на часовник) в сравнение с микроархитектурата на Excavator. В допълнение, за първи път за AMD, Ryzen въвежда поддръжка за SMT (Simultaneous Multi Threading) технология, която позволява изпълнението на две изчислителни нишки на едно ядро. В същото време Ryzen е и първият процесор на AMD, пуснат на модерна 14nm технологична технология, използваща FinFET транзистори, което допринася за завладяването на високи честоти с добра енергийна ефективност. Друга важна промяна е преминаването към по-модерна платформа, която е фокусирана върху работата с двуканален DDR4 SDRAM.

Процесорната линия Ryzen 7, която AMD пуска на пазара днес, включва три осем-ядрени процесора на цени от $330 до $500. Всички те са сходни по основни характеристики, но се различават по честоти. Успяхме да стигнем до тестовете среден моделв семейството, $400 Ryzen 7 1700X, който ще се конкурира с Core i7-6800K или Core i7-7700K. Изгражданията, базирани на новите процесори на AMD, са добри с това, че дънните платки с необходимия конектор Socket AM4 са значително по-евтини от дънните платки за водещи процесори на Intel и следователно конфигурация, базирана на Ryzen 7 1700X, наистина може да бъде много привлекателна опция за настолен персонален компютър . Основното е, че всичко, което AMD успя да обещае по отношение на производителността и други потребителски качества, наистина се сбъдва.

С други думи, днес сме свидетели на най-грандиозното събитие на пазара на процесори за последните пет години. Истинската конкуренция наистина може да се завърне в сферата на процесорите за настолни компютри и това ще бъде доста способно да тласне забележимо закъсалия прогрес. Затова няма да отлагаме най-интересното за по-късно, а веднага ще преминем към техническите подробности, а след това и към тестовете.

Дзен микроархитектурата накратко

За да разберете идеите зад новия дизайн на процесора, трябва да знаете, че при разработването на микроархитектурата Zen инженерите на AMD дадоха приоритет на четири основни аспекта. Първо, изпълнение. Инженерите се опитаха не само да постигнат значителни подобрения в скоростта на изпълнение на еднопоточно натоварване, но също така се опитаха да увеличат паралелността на архитектурата колкото е възможно повече. Второ, пропускателна способност. Новите процесори имат значително подобрена кеш памет и алгоритми за предварително извличане, а конвейерът за изпълнение е преработен, за да се избегнат тесни места и принудителен престой. Трето, ефективност. Оптимизирането на специфичната производителност на изразходван ват беше друг основен приоритет. Zen се възползва напълно от активното и неактивно управление на мощността на AMD и се възползва напълно от технологията на 14nm FinFET процес. И четвърто, мащабируемост. Новите процесори Ryzen се отличават с модулен дизайн, като основният градивен елемент е четириядреният блок CCX (Core Complex). Тези блокове са свързани заедно чрез новата високоскоростна шина Infinity Fabric, което прави Zen дизайн, който може да бъде внедрен в процесори с различна сложност и за различни цели.

Нека се спрем на всички тези характеристики малко по-подробно.

По отношение на производителността, микроархитектурата Zen прави това, което компанията нарича „квантов скок“ в скоростта на изпълнение на инструкциите в сравнение с предишни проекти. На първо място, това се дължи на факта, че Zen ядрата вече не споделят никакви ресурси помежду си, както беше в Bulldozer, те са напълно независими и също така поддържат SMT технология, която позволява изпълнение на две нишки на едно ядро ​​едновременно (подобно на Hyper-Threading) . В допълнение, всяко ядро ​​получи собствен micro-op кеш, което значително намалява разходите за декодиране на инструкции, напълно преработен кеш за бързо записване от първо ниво с ниска консумация на енергия, собствен FPU модул за всяко ядро ​​и специален L2 кеш, както и много други оптимизации.

Поради факта, че размерът на прозореца на планировчика се е увеличил със 75 процента, като цяло програмистите могат да изпращат за изпълнение един път и половина повече инструкцииотколкото беше в ядрата на Excavator. В същото време декодерът се разширява поне един път и половина, благодарение на което Zen може да изпрати много повече работа на своите изпълнителни устройства. Освен това Zen въведе кеш за микрооперации, който позволява на процесора да се справя без повтарящи се достъпи до L2 и L3 кеша и многократно декодиране на инструкции при работа с повтарящи се кодови секции. Схемата за прогнозиране на прехода се промени значително, сега използва хардуерна невронна мрежа, което значително увеличава процента на правилно взети клонове. Плюс това, пълното използване на всички налични ресурси се поддържа от SMT поддръжка, която позволява на приложения, които поддържат паралелни изчисления, да създават два пъти повече нишки.



Продуктивният двигател винаги се нуждае от адекватно захранване с гориво и микроархитектурата Zen обръща много внимание на този аспект. Следователно не трябва да се изненадвате, че йерархията на кеш паметта се е променила донякъде в нея. L1 кешът за инструкции е нараснал до 64 KB и L1 кешът за данни е записан обратно. L2 кеша стана индивидуален за всяко ядро ​​с обем 512 KB. А кешът L3 получи обем от 8 MB за всеки четири ядра, за които се споделя в рамките на Core Complex. Включващ интелигентни алгоритми за предварително извличане нова системакеширането може да предостави на изчислителните ядра до пет пъти повече данни, отколкото в Excavator.



14nm технологичният процес също играе важна роля при внедряването на Zen архитектурата. За физическото внедряване на процесорите Ryzen, AMD избра вариант на технологията на процеса GlobalFoundries, която е фокусирана върху дизайни с висока плътност. Това направи възможно ядрото на Ryzen да има сравнително малка площ, да работи при сравнително ниски захранващи напрежения и в крайна сметка да осигури благоприятна зависимост на консумацията на енергия от производителността. В допълнение, всички минали разработки на компанията, насочени към повишаване на енергийната ефективност на процесора, са приложени в Zen: динамично захранване и изключване на различни процесорни възли, динамична промяна на честотата. Решенията, насочени към пестене на енергия, могат да бъдат намерени и директно в микроархитектурата. Това е частично подпомогнато от кеша на микрооперациите и в допълнение CPU мениджърът използва специален стеков механизъм за генериране на многократно използвани адреси.

Благодарение на оптимизациите от този вид, микроархитектурата Zen има много широк обхват, в бъдеще тя трябва да стане основата на цялото семейство процесорни продукти на AMD: за лаптопи, настолни компютри и сървъри.



Мащабируемостта на Zen разчита отчасти на факта, че процесорите са сглобени от градивни блокове CCX, които комбинират 4 ядра и могат да изпълняват 8 нишки. Всеки CCX има 512 KB L2 кеш на ядро ​​и общ L3 кеш от 8 MB. Настоящите процесори Ryzen 7, които AMD разкрива днес, са изградени от два CCX и получават съответно 8 ядра и 16 нишки. CCX са свързани помежду си чрез специална шина Infinity Fabric.

Такъв подреден Zen дизайн ще позволи на AMD в бъдеще да пуска процесори с различен брой ядра и нишки, различно количество кеш памет, фокусирани върху различни приложенияи пазарни сегменти.



Значителна роля в това играе шината Infinity Fabric, която е базирана на HyperTransport и ви позволява бързо и с минимални усилия да сглобявате процесорни чипове с различни конфигурации. Високата производителност и приоритизирането на трафика правят Infinity Fabric много подходящ за тази роля. Шината може лесно да обработва трансфер на данни между CCX, системна памети други контролери, които са представени в ядрото на процесора Ryzen. В допълнение, параметрите на отделните CCXs също се управляват чрез Infinity Fabric.



По-специално, телеметричната информация за състоянието на отделните ядра, тяхната температура и консумация се събира на една и съща шина и чрез нея се контролират напреженията и честотите. Всъщност Infinity Fabric може да се разглежда и като част от собствената технология SenseMI на AMD.


Технология AMD SenseMI

Важен компонент на процесорите Ryzen е разпределена мрежа от сензори за ток, напрежение, консумация и температура, която ви позволява точно да следите състоянието на процесора. Тази телеметрия се събира през шината Infinity Fabric на всяка милисекунда, което позволява гъвкав контрол на матрицата на процесора, като същевременно се поддържа високата му реакция. Технологията SenseMI действа като интелигентна добавка към този механизъм. Първо, той управлява процесора през шината Infinity Fabric по такъв начин, че да оптимизира моменталната му мощност и характеристики на производителност. Второ, той също така включва някои функции за предварително извличане и предвиждане на разклонения. Като цяло технологията SenseMI може да се разглежда като декомпозиция на няколко алгоритъма за различни цели.

Механизъм чиста сила е отговорен за пестенето на енергия и ви позволява да намалите честотата и напрежението на онези процесорни единици (или дори ядра), чийто принос за крайната скорост на решаване на проблема не зависи от нищо. С други думи, благодарение на Pure Power, процесорът става по-икономичен без загуба на производителност.



Механизъм Прецизно усилванерешава обратния проблем на Чистата сила. Използвайки телеметричните данни, събрани чрез шината Infinity Fabric, той може да увеличи честотата на отделните процесорни ядра на малки стъпки от 25 MHz, ако това не доведе до излизане на процесора отвъд установените ограничения за температура и потребление. С други думи, Precision Boost е гъвкаво регулиране на честотата на процесора към текущите условия, подобно на това как работят съвременните видеокарти.



технология Разширен честотен обхват (XFR)- Това е механизъм за автоматично овърклокване на процесора, който привлича вниманието на ентусиастите в зависимост от параметрите на охладителната му система. XFR се реализира само в процесори, които имат окончание X в името си.В тях, при редица условия, той може допълнително да увеличи тактовата честота извън границите, определени като част от Precision Boost. В повечето случаи XFR се активира, ако температурите на процесорните ядра са далеч от граничните стойности, но освен абсолютните стойности на температурите, XFR се фокусира и върху техните производни.



Прогноза на невронни мрежие друг аспект на технологията SenseMI. Това означава, че архитектурата на Zen има истинска невронна мрежа за обучение в реално време, която се занимава с прогнозиране как приложението ще се държи в близко бъдеще. Такова предвиждане има смисъл, за да се подготвят проактивно инструкции за изпълнение и необходимите данни за тях.



И последната част от SmartMI е механизмът Smart Prefetch. Той предварително извлича необходимите данни в L1 и L2 кеш паметта на процесора въз основа на информация за това как приложението е работило до този момент. Това елиминира възможния престой на процесора, който може да възникне поради ненавременно зареждане на данни.



В обобщение, няма съмнение, че Zen микроархитектурата представлява огромна стъпка напред от Bulldozer. И не само, че новите процесори използват модерна технологична технология и традиционен x86 дизайн с пълноценни широки ядра без споделени блокове и поддръжка на многопоточна (SMT). Направени са и много други подобрения, благодарение на които броят на инструкциите, изпълнявани от едно ядро ​​на такт, се е увеличил повече от един път и половина. Това се поддържа от подобрено предсказване на разклоненията, появата на кеш от микрооперации, възможността за изпращане на до шест микрооперации на часовник (срещу четири), 60% увеличение на буферите на планировчика, двукратно увеличение на скоростта на завършване и оставка на микрооперации, едно и половина пъти увеличение на дълбочината на опашките за зареждане и разтоварване, възможност за извършване на до четири операции с плаваща запетая на цикъл (срещу три), многократно увеличение на пропускателната способност на всички кешове и увеличаване на размера на L1 кеша, подобрения на ниво предварително извличане на данни и множество други неща.

Тестови процесор: AMD Ryzen 7 1700X

Днес, 2 март 2017 г., AMD пуска първата партида от своите новаторски процесори Ryzen. И това е наистина историческо събитие: на пазара на процесори от много дълго време не е имало продукти, на които да е поверено такова бреме от очаквания. Не е шега - AMD ще се конкурира с по-старите процесори на Intel за високопроизводителни настолни компютри, но в същото време ще намали почти наполовина ценовата лента.

По време на първата фаза от пускането на пазара на Ryzen, AMD ще заложи на своите осемядрени процесори, класифицирани като семейство Ryzen 7. Това са най-скъпите настолни носители на новата микроархитектура Zen с цени, вариращи от $330 до $500. Но въпреки относително висока цена, компанията очаква почти бурно търсене на нов продукт и се е подготвила сериозно за него. Продуктите Ryzen 7 вече са на склад във водещи магазини, а AMD е произвела предварително общо около милион процесора.

При позиционирането на нови продукти AMD се придържа към малко по-различни принципи от Intel. Компанията явно залага на по-голяма масовост. В същото време тя вижда Ryzen 7 1800X като два пъти по-евтината алтернатива за Core i7-6900K. Ryzen 7 1700X се противопоставя не на осемядрен, а на шестядрен процесор с подобна цена процесор Core i7-6800K. Ryzen 7 1700 също е обявен като пряк конкурент на четириядрения Core i7-7700K. С други думи, старата тактика на AMD да се опитва да съпостави предложенията на Intel с превъзходен брой ядра на по-ниска цена е отразена и в новата гама. Въпреки това, ядрата на AMD сега са много по-мощни от преди и фамилията Ryzen 7 наистина изглежда много силна.

За да се запознаем с новата линия процесори, получихме от AMD средния модел Ryzen 7 1700X, който е интересен, защото може да се използва за изграждане на конфигурации с не много висока цена - от 80 до 100 хиляди рубли.



Имайте предвид, че процесорите Ryzen са инсталирани в специален нов сокет Socket AM4, който сега се превръща в основа за цялата гама настолни процесори на AMD. А това означава, че старите дънни платки не са подходящи - имаме нужда от нови, базирани на чипсети AMD X370, B350 и т.н.

Ето как Ryzen 7 1700X се определя от диагностичната програма CPU-Z.



Пред нас е нов 8-ядрен AMD процесор с кодово име Summit Ridge и Zen microarchitecture, който се отличава с поддръжка на SMT и възможност за изпълнение на 16 потока едновременно, 512 KB L2 кеш на ядро ​​и L3 кеш в две части от по 8 MB.

Номиналната честота на Ryzen 7 1700X е зададена на 3,4 GHz, но в повечето случаи можете да наблюдавате работата на този процесор на честота от 3,5 GHz - работата на технологията Precision Boost засяга. В същото време, при натоварване с нисък поток, честотата може да се увеличи до 3,8 GHz, а ако имате късмет, след това до 3,9 GHz поради XFR.

Захранващото напрежение на нашия Ryzen 7 1700X под товар се колебаеше между 1,25-1,275 V. AMD казва, че стандартното напрежение за различни Ryzen 7 може да бъде зададено в много широк диапазон и обикновено варира от 1,2 до 1,3625 V. Това означава, че в сравнение с 14nm Intel процесори, ще видим още високи напрежения. Следователно температурният режим на Ryzen 7 1700X при номинална стойност не предизвиква много безпокойство. При натоварване наблюдавахме загряване до 76-78 градуса според термодатчика, вграден в ядрото. В покой температурите са около 45 градуса.

Socket AM4 платформа и нови чипсети

Както вече споменахме, процесорите от семейството Ryzen са фокусирани върху използването на принципно нова платформа и новия конектор Socket AM4. Това се дължи преди всичко на факта, че AMD трябваше да въведе поддръжка за DDR4 памет, която вече спечели мястото на индустриалния стандарт. И в същото време, възползвайки се от момента, беше решено да се преначертае цялата платформа, правейки процесорите да изглеждат като SoC. С други думи, допълнителен набор от контролери беше прехвърлен към интегрирания северен мост на процесора, което направи чипсетите от ново поколение изключително прости устройства.



В резултат на това не е изненадващо, че новият процесорен сокет AM4 получи увеличен брой пинове - те вече са 1331. Това означава, че Ryzen не е съвместим с никакви стари дънни платки. Освен това AMD промени изискванията за местоположението на монтажните отвори за охладителните системи на дънните платки и следователно Ryzen изисква нови охладители или поне нови стойки за стари. Следователно, въпреки факта, че Ryzen на пръв поглед са подобни на своите предшественици, имат подобни размери и външен дизайн, цялата екосистема за тях трябва да бъде напълно актуализирана.

В процесорите Bulldozer в чипа на процесора е внедрен контролер на паметта. В последното поколение APU контролерът за графика също е преместен в основния чип. PCI шинаекспресен. В Ryzen към процесора бяха добавени допълнителни PCI Express ленти, USB и SATA портове. Всъщност AMD сега създаде ситуация, при която процесорът може да работи без никакви допълнителни чипсети, което прави възможно създаването на изключително прости и компактни дънни платки.

Въпреки това си струва да започнем с факта, че интегрираният контролер на паметта в процесорите Ryzen е напълно нов. Предназначен е за работа с двуканална DDR4 SDRAM и поддържа само такава памет. Няма обратна съвместимост с DDR3 SDRAM. Официално контролерът на паметта Ryzen поддържа DDR4 модули до 2666 MHz, за които могат да бъдат осигурени два или четири слота на Socket AM4 дънни платки. Може да се използва и памет с честота по-висока от DDR4-2666 с Ryzen, но авторите на процесора в този случай не дават никакви гаранции.

Въпреки това, използването на високоскоростни модули памет в Socket AM4 може да причини проблеми. Максимална честота DDR4, който може да се получи в Ryzen без промяна на базовата BCLK честота е само 3200 MHz. Освен това работата на DDR4-2933 или DDR4-3200 памет е възможна само ако се използва двойка модули. С други думи, по отношение на честотните възможности на контролера на паметта, Ryzen е много по-нисък от настоящите процесори на Intel за платформата LGA 1151, които свободно завладяват DDR4-4000 и по-високи режими. Но засега има известна надежда, че ситуацията може да бъде коригирана чрез нови версии на BIOS за дънни платки.

В допълнение към вградения контролер на паметта, поддържащ двуканален DDR4 SDRAM, Ryzen осигурява:

16 линии PCI Express 3.0 за графична карта (при необходимост те могат да бъдат разделени на два слота по формулата 8x + 8x);
4 ленти PCI Express 3.0 за свързване с чипсета или за други устройства;
4 USB 3.0 порта;
4 PCI Express 3.0 ленти за NVMe съхранение (могат да бъдат преконфигурирани до 2 PCI Express 3.0 ленти за NVMe съхранение и два SATA порта).

Така само от процесора Ryzen се получава завършена система върху чип.

Въпреки това, за типичните настолни системи, опциите за разширение, налични в процесора, вероятно ще бъдат недостатъчни. Следователно един от комплектите логика - X370, B350 или A320, който ще добави някои допълнителни неща към посочения списък, може да бъде свързан към процесора чрез PCI Express линиите, предназначени за тази цел. И ако няма нужда от това, тогава е възможно да оборудвате Ryzen със специални опростени чипсети Mini-ITX X300 или A300, които не консумират PCI Express 3.0 процесорни линии, но не добавят почти нищо към списъка с функции.

По-голямата част от характеристиките на платформата Socket AM4 се определят от процесора Ryzen. Чипсетите в новата платформа играят чисто второстепенна роля и всъщност малко зависи от тях по отношение на функционалността на платформата.

Дори по-старият чипсет X370, който вероятно ще се използва в повечето дънни платки за ентусиасти, не носи много: допълнителни два USB 3.1 порта, шест USB 3.0 и USB 2.0 порта, осем SATA порта, четири от които могат да бъдат преобразувани в два SATA Express интерфейси и осем допълнителни бавни PCI Express 2.0 ленти. Освен това в платформата Socket AM4 използването на един или друг чипсет позволява или забранява овърклок, разделяне на графични линии PCI Express 3.0 x16 и RAID режими за SATA портове. Например, в същия X370, както в по-стария чипсет, са разрешени овърклок, SLI или CrossfireX конфигурации и RAID масиви от нива 0, 1 и 10.



Заедно с X370, напредналите потребители може да се интересуват и от по-простия логически набор B350. Той все още позволяваше овърклок на процесора и RAID масиви, а основната разлика от по-старата версия се отнася до невъзможността да се раздели графичната шина на процесора на два слота. В допълнение, част от USB 3.0 и SATA портовете паднаха под ножа, от които има съответно два и шест в чипсета, плюс броят на линиите PCI Express 2.0 беше намален до шест.



Друга интересна алтернатива е чипсетът X300, който е специално проектиран за прости компактни системи. Той не добавя абсолютно нищо към възможностите на процесора, но позволява разделянето на графичната шина PCI Express 3.0 x16 на два слота и позволява овърклок на процесора.

Подробна информация за това какви функции се предлагат в комбинация с Ryzen от определени чипсети сме обобщили в следващата таблица.



Въпреки че чипсетите носят името AMD, ASMedia, известна с различните си контролери, играе основна роля в тяхното развитие. Именно благодарение на нея AMD успя да бъде първият, който представи чипсети на пазара с поддръжка на USB 3.1 портове с честотна лента от 10 Gb / s. Въпреки това, вродена подкрепа Тип-C конекторидокато чипсетите на AMD не го правят. За да се появи удобен симетричен USB конектор на платката, производителите на дънни платки ще трябва да отделят допълнителен драйвер за чип.

Благодарение на поддръжката на USB 3.1, чипсетите за платформата Socket AM4 изглеждат модерни, но не бива да се заблуждавате много относно техните възможности. Докато логическите комплекти от серия 200 на Intel могат да осигурят до 30 високоскоростни порта (PCIe 3.0, SATA и USB 3.0), дори по-старият AMD X370 има наполовина по-малко такива портове. Това отчасти се компенсира от възможностите на северния мост, вграден в процесора, но въпреки това платформата на Intel ви позволява да създавате по-гъвкави конфигурации с повече възможности за свързване на допълнителни устройства.

За тестване получихме майка Платка ASUS Crosshair IV Hero.


Това дънна платкае базиран на по-стария чипсет AMD X370 и използва потенциала му максимално. Платката поддържа разделяне на графичната шина PCI Express 3.0 на два слота и конфигурации, базирани на технологиите SLI и CrossfireX. И двата графични слота на тази платка са подсилени с метални рамки SafeSlot и са широко разположени, за да поемат масивни и мощни графични процесори.

Платката поддържа овърклок, като настройките й за овърклок са направени така, че работата на процесора на по-високи честоти да не създава проблеми. За охлаждане на компонентите на системата е предвидена технология Fan Xpert, която ви позволява да контролирате всичките пет вентилатора, които са свързани към платката. Както при най-новите ROG платки за LGA 1151, ASUS Crosshair IV Hero има специални конектори за помпа за течно охлаждане, както и сензори за температура и поток на охлаждащата течност. Има и специален конектор за високомощни вентилатори.



Важна характеристика на базираните на Ryzen системи е, че M.2 слотът за NVMe устройства се свързва директно към PCI Express 3.0 процесорните ленти. Точно това се прави на Crosshair IV Hero. Няма ограничения на скоростта - M.2 има четири необходими PCIe ленти. В същото време самият M.2 слот се отдалечава от процесора и видеокартите - там, където ще му е по-лесно да организира адекватно охлаждане.

Платката е снабдена с модерното вече RGB осветление, което се управлява чрез приложението ASUS Aura RGB. Също така, допълнителни LED ленти могат да бъдат свързани към Crosshair IV Hero.

Интегрираната звукова карта е базирана на ексклузивното последно поколение S1220 кодек, който осигурява съотношение сигнал/шум от 113 dB. Този кодек работи във връзка с първокласния ESS Sabre DAC, което като цяло ви позволява да получите качество на звука, сравнимо с това на евтините дискретни звукови карти. В допълнение, аудио пътят е придружен от програмата Sonic Studio III, която улеснява управлението на аудио потоци. Например, може да се използва за изпращане на звуци от игра към слушалки, музика към високоговорители и звук от видео към телевизор.



Тогава накратко спецификации ASUS Crosshair IV Hero изглежда така:



Гигабитовата мрежа на платката е представена от обичайния контролер на Intel, който е оборудван с програмата GameFirst за приоритизиране на мрежовия трафик. В допълнение, платката има допълнителен M.2 слот, който може да побере WiFi контролер.



Задният панел на платката е гъсто пълен с портове, плюс хардуерните бутони Clear CMOS и Възпроизвеждане на BIOS. Но основната площ е заета от множество USB портове, сред които има 10 Gb / s USB порт 3.1 във варианти Type-A и Type-C. Между другото, платката осигурява и изход за USB 3.1 порт, който се намира на предния панел на корпуса.

Препоръчителната цена на ASUS Crosshair IV Hero е $255.

Как тествахме

Тестването на процесора AMD Ryzen 7 1700X беше извършено в пълно съответствие с предписанията на производителя: водещият продукт на AMD беше противопоставен на цялата текуща линия процесори Core i7. Освен това не пропуснахме да включим в тестовете по-стария процесор от линията AMD FX.

В крайна сметка, пълен списъккомпонентите, включени в тестовите системи, получиха следната форма:

Процесори:

AMD Ryzen 7 1700X (Summit Ridge, 8 ядра + SMT, 3.4-3.8 GHz, 16MB L3);
AMD FX-9590 (Vishera, 8 ядра, 4.7-5.0 GHz, 8 MB L3);
Intel Core i7-7700K (Kaby Lake, 4 ядра + HT, 4.2-4.5 GHz, 8 MB L3);
Intel Core i5-7600K (Kaby Lake, 4 ядра, 3.8-4.2 GHz, 8 MB L3);
Intel Core i7-6900K (Broadwell-E, 8 ядра + HT, 3.2-4.0 GHz, 20 MB L3);
Intel Core i7-6800K (Broadwell-E, 6 ядра + HT, 3.4-3.8 GHz, 15 MB L3).

Охладител за процесор: Noctua NH-U14S.
Дънни платки:

ASUS Crosshair IV Hero (сокет AM4, AMD X370);
ASUS 970 PRO Gaming/Aura (сокет AM3+, AMD 970 + SB950);
ASUS Maximus IX Hero (LGA1151, Intel Z270);
ASUS X99-Deluxe (LGA2011-v3, Intel X99).

Памет:

2 x 8 GB DDR4-3000 SDRAM, 15-17-17-35 (Corsair Vengeance LPX CMK16GX4M2A3000C15).
4 × 4 GB DDR4-3000 SDRAM, 15-17-17-35 (G.Skill F4-3000C15Q-16GRR).
2 × 8 GB DDR3-2133 SDRAM, 9-11-11-31 (G.Skill F3-2133C9D-16GTX).

Видео карта: NVIDIA GeForce GTX 1080 (8 GB/256-bit GDDR5X, 1607-1733/10000 MHz).
Дискова подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Захранване: Corsair RM850i ​​(80 Plus Gold, 850 W).

Тестването е проведено в операционна система Microsoft Windows 10 Enterprise Build 14393 с помощта на следния набор от драйвери:

AMD Chipset Driver Crimson ReLive Edition 17.2.1;
Драйвер за чипсет Intel 10.1.1.38;
Intel двигател за управлениеИнтерфейсен драйвер 11.6.0.1030;
Intel турбо ускорение Max Technology 3.0 1.0.0.1029;
NVIDIA GeForce 378.66 Шофьор.

производителност

Интегрирана производителност

За да оценим производителността на процесорите при обичайни задачи, използвахме тестовия пакет BAPCo SYSmark 2014 SE, който симулира работата на потребителя в реални общи съвременни офис програмии приложения за създаване и обработка на цифрово съдържание. Най-новите версии на този бенчмарк работят по четири сценария: Продуктивност в офиса ( офис работа: подготовка на текстове, обработка на електронни таблици, работа с електронна пощаи посещаване на интернет сайтове), създаване на медии (работа върху мултимедийно съдържание - създаване на реклама с помощта на предварително заснети цифрови изображения и видеоклипове), данни / финансов анализ (обработка на архив с финансови данни, техните Статистически анализи инвестиционно прогнозиране на базата на определен модел) и Отзивчивост (анализ на реакцията на системата при стартиране на приложения, отваряне на файлове, работа с интернет браузър с голям брой отворени раздели, многозадачност, копиране на файлове, пакетни операции със снимки, криптиране и архивиране на файлове , и инсталиране на програми).















AMD противопоставя Ryzen 7 1700X на шестядрения процесор Core i7-6800K, но както виждаме, според интегрирания индикатор в SYSmark 2014 SE, новият продукт на AMD все още му отстъпва, демонстрирайки нивото на производителност на Core i5 . Проблемът е, че повечето от често срещаните приложения остават еднонишкови и при такова натоварване Ryzen все още е по-слаб от архитектурите на Intel, макар и не много. Ярка илюстрация на това може да се види в резултатите от изпълнението на скрипта Office Productivity. При сложно многонишково натоварване, особено от броене, производителността на Ryzen 7 1700X е наред. И така, в подтеста за данни / финансов анализ, новият Ryzen 7 1700X не само превъзхожда шестядрения Core i7-6800K, но също така се оказва по-силен от осемядрения Intel Core i7-6900K.

За да оценим сложната производителност в 3D игрите, използвахме теста Futuremark 3DMark Professional Edition 2.2.3509, в който използвахме сцената Time Spy 1.0.






Този бенчмарк е добре оптимизиран за многопоточност, така че Ryzen 7 1700X показва много добра скорост в него. Микроархитектурата Zen позволи на AMD да направи пълноценен осемядрен процесор, чиято производителност е по-близка до Core i7-6900K, отколкото до прекия му конкурент, Core i7-6800K.

Тестове за приложение

Задачата, която реагира най-чувствително на увеличаването на паралелизма на процесора, традиционно е окончателното изобразяване в пакетите за 3D дизайн и симулация. Тествахме скоростта на изобразяване в две популярни приложения: Autodesk 3ds max 2017, където измерихме времето, необходимо за изобразяване при разделителна способност 1920 × 1080, използвайки рендеринга на mental ray на стандартната сцена Hummer; и в Blender 2.78a, където е проверена продължителността на изграждане на крайния модел от Blender Cycles Benchmark rev4.






Ryzen 7 1700X изпълнява своите обещания и осигурява производителност на рендиране, която преди беше възможна само с осемядрени процесори Intel. Все пак трябва да се припомни, че Ryzen 7 1700X струва около два и половина пъти по-евтино от Core i7-6900K.

Следващата тестова задача е обработка на изображения. Използва се тук Adobe Lightroom 6.8 и Adobe Photoshop CC 2017. В първия случай производителността се тества при групова обработка на поредица от изображения в RAW формат. Тестовият сценарий включва последваща обработка и експорт в JPEG с разделителна способност 1920 × 1080 и максимално качество на двеста 12-мегапикселови RAW изображения, направени с цифров фотоапарат Nikon D300. Във втория - производителност при обработката на отделни графични изображения. За да направите това, се измерва средното време за изпълнение на тестов скрипт, който е творчески преработен тест за скорост на Photoshop на Retouch Artists, който включва типична обработка на четири 24-мегапикселови изображения, направени от цифров фотоапарат.






Приложения на Adobe за фотографи - с функции. Във Photoshop много филтри и операции все още се изпълняват в еднопоточен режим. Lightroom започна активно да използва AVX2 инструкции. И двете са лоши за микроархитектурата Zen, така че и в двете тестови задачи процесорът Ryzen 7 1700X губи дори от четириядрения Core i5, да не говорим за процесорите на Intel от по-висок клас.

Но обработката на видео, подобно на изобразяването, се счита за задача, чиято производителност се мащабира добре с увеличаване на паралелизма на процесора. Тук използвахме четири задачи за тестване. Adobe след ефекти CC 2017 - тест за скорост на рендиране с проследяване на лъчи. Измерва се времето, необходимо на системата за изобразяване при разделителна способност 1920 ×. [имейл защитен]предварително направено видео. Adobe Premiere Pro CC 2017 - тестване на производителността за нелинейно редактиране на видео. Измерва времето за изобразяване на H.264 Blu-ray за проект, съдържащ HDV 1080p25 кадри с различни приложени ефекти. x264 r2744 - тестване на скоростта на транскодиране на видео във формат H.264/AVC. За да оцените изпълнението, оригиналът [имейл защитен] AVC видео файл с побитова скорост около 30 Mbps. И x265 2.2+17 8bpp - тестване на скоростта на транскодиране на видео в обещаващия H.265/HEVC формат. За оценка на производителността се използва същият видео файл като в теста за скорост на транскодиране на x264 енкодер.












При работа с видео, както и при крайно изобразяване, Ryzen 7 1700X е много добър. Той наистина може да се конкурира с Core i7-6900K за $1000, което прави новия продукт на AMD лек. перфектен изборза потребители, които създават мултимедийно съдържание.

За измерване на скоростта на процесорите по време на компресиране на информация избрахме два архиватора: 7-zip 16.04 и WinRAR 5.40. И в двата случая е измерено времето за компресиране на директории с различни файлове с общ обем 1,7 GB при максимална степен на компресия.






За бърза работаЗа архиваторите са важни добрата пропускателна способност и ниската латентност на подсистемата на паметта. Контролерът на паметта на процесорите Ryzen се оказа изключително неуспешен, така че в тези тестове Ryzen 7 1700X може да се сравни само с четириядрените процесори на Intel.

Производителност на браузъра Microsoft Edgeе тестван в специализиран тест WebXPRT 2015, който имплементира реално използвани в Интернет приложения алгоритми в HTML5 и JavaScript.



Задачата е еднонишкова, но Ryzen 7 1700X се справя добре, на второ място след процесорите на Intel, базирани на микроархитектурата Kaby Lake.

В заключение, тествахме скоростта на криптографските алгоритми в помощната програма VeraCrypt 1.19.Тук беше използван вграденият в програмата бенчмарк, който използва тройно криптиране Serpent-Twofish-AES.



Задачата е еднонишкова, плюс изпълнението на AES набора от инструкции на Zen е много ефективно. Резултатът не закъснява: Ryzen 7 1700X е на първо място.

Производителност на игрите

Доскоро производителността на платформи, оборудвани с модерни процесори, в по-голямата част от текущите игри се определяше от възможностите на графичната подсистема. Въпреки това, провеждайки се през няколко последните годинипроцъфтяваща производителност графични карти за игридоведе до факта, че сега често производителността е ограничена не толкова от видеокартата, колкото от централен процесор. И ако по-рано, за да разберем игровия потенциал на конкретен процесор, трябваше да използваме намалени разделителни способности, тогава при съвременните видеокарти това изобщо не е необходимо.

За да завършим нашата система за тестване на процесори, NVIDIA ни предостави най-новия си ускорител GeForce GTX 1080, който, благодарение на безпрецедентната си висока мощност, е много подходящ за 4K резолюции и виртуална реалност, и още повече за FullHD. В резултат на това успяхме да се откажем от тестовете за игри с резолюция 1280 × 800, които често не срещаха разбиране от нашите читатели. Сега зависимостта на честотата на кадрите от мощността на процесора може да бъде перфектно проследена в абсолютно реални, а не изкуствено създадени условия: в FullHD резолюция 1920 × 1080 и с максимални настройки за качество на изображението. Възприехме този подход.






























Игрите не дават много поводи за оптимизъм по отношение на Ryzen. Не, разбира се, това не са процесори от серията FX, чиято игрова производителност вече стана причина за подигравки. Ryzen 7 1700X произвежда повече от приемливо ниво на игрова производителност на настоящия етап и със сигурност изважда видеокарти от клас GeForce GTX 1080 без съмнение. Но ако погледнете относителните показатели за производителност, се оказва, че всеки настоящ процесор Intel Core i7 и дори Core i5 има по-висок гейминг потенциал - при високо качество на графиката това може да се види дори в най-често срещаната FullHD резолюция. Причините за това състояние на нещата са добре разбрани: бавен контролер на паметта Ryzen и по-слаб FPU-част от процесорите на Intel.

Все пак трябва да се подчертае още веднъж, че към момента мощността на Ryzen 7 1700X е напълно достатъчна, за да осигури висока честота на кадрите в игрите. И следователно не трябва да се счита за недостатъчно продуктивен процесор за игри. В допълнение, новият продукт на AMD има осем пълноценни ядра, което може да бъде добра помощ в новите гейминг проекти, които, макар и плахо, все още вървят към пълното използване на многонишковостта и прехода към DirectX 12.

Консумация на енергия

Ситуацията с консумацията на енергия е друга интригуваща част от днешното тестване. AMD премести своите процесори към модерен 14nm процес и оптимизира архитектурата с ясен фокус върху енергийната ефективност. В резултат на това компанията сега казва, че осемядрените Ryzens се вписват в 95-ватов TDP. Тоест, те трябва да са значително по-икономични от LGA 2011-3 процесорите на Intel с типично разсейване на топлината от 140 вата. Има ситуацията с реална консумация на енергиямястото, където Ryzen 7 1700X може да спечели чиста победа над конкурента? Да проверим.

Използван от нас в тестова системанов цифров блок Power Corsair RM850i ​​ви позволява да контролирате консумираната и изходна електрическа мощност, която използваме за измервания. Графиката по-долу показва общата консумация на системи (без монитор), измерена "след" захранването, която е сумата от консумацията на енергия на всички компоненти, участващи в системата. Ефективността на самото захранване в този случай не се взема предвид.



На празен ход платформата Socket AM4 наистина изглежда много икономична. И това не е изненадващо, Ryzen използва усъвършенствани енергоспестяващи технологии, а съпътстващите чипсети не се различават по специални енергийни апетити.



Но при изобразяване в Blender ситуацията с потреблението изглежда малко по-различна от очакваното. При натоварване система с Ryzen 7 1700X изисква приблизително същото количество мощност като платформа, базирана на Core i7-6900K. И това поражда съмнения, че Ryzen 7 наистина се вписва в 95-ватовия TDP.

А ето как изглежда ситуацията с потреблението на максимум възможно натоварване: в помощната програма Prime 28.10, която активно използва изключително енергоемки FMA и AVX2 инструкции.



По отношение на консумацията на енергия, Ryzen 7 1700X все пак успява да изостане малко от Core i7-6900K. Тук, разбира се, не става въпрос за 30-те процента разлика, както пише в спецификациите, а за разликата на ниво от само няколко вата. На теория Ryzen 7 1700X трябваше да е по-близо до Core i7-7700K, чийто TDP е настроен на 91W, но на практика предложението на AMD е видимо по-ненаситно.

Овърклок

Ryzen гони, за съжаление, зле. Очевидно е, че номиналните честоти на тези процесори са вдигнати до краен предел дори фабрично. Следователно не е необходимо да се разчита на факта, че производителността може да бъде допълнително увеличена чрез прости манипулации.
Стабилният максимум, който успяхме да постигнем с нашия екземпляр Ryzen 7 1700X, беше само 3,85 GHz, тоест успяхме да надхвърлим турбо режима само малко. Процесорът не е взел по-висока честота.



И дори тогава, за да може системата да премине теста за стабилност в Prime 95 28.10, напрежението на процесора трябваше да бъде повишено повече от сериозно - до 1,5 V. Фактът, че дългосрочната работа на 14-nm чип при това напрежение няма да доведе до разграждане на полупроводниковия кристал, има основателни съмнения.

Освен това температурният режим с такова привидно незначително ускорение се оказа не много благоприятен. Въпреки факта, че Ryzen има спойка под капака, а не паста, термичният сензор, вграден в процесорния чип, регистрира нагряване до 99 градуса.

заключения

Всички наистина се надявахме на това и то се случи: AMD го направи. Новите процесори Ryzen са коренно различни от Bulldozer. Микроархитектурата в тях е напълно обновена и сега Ryzen 7 е продукт от високо ниво. Както беше обещано, еднопоточната производителност в новия продукт се е увеличила с около един и половина пъти, а консумацията на енергия е намаляла с приблизително същото. В резултат AMD се оказа високопроизводителен осемядрен процесор, който наистина може да се постави на едно ниво с предложенията на Intel за платформата LGA 2011-3. Освен това AMD изглежда има много амбициозни планове в светлината на завръщането си на пазара, тъй като се опитва да разбие установените цени по пътя и да започне да предлага висококачествени осем ядра на безпрецедентна цена ниски цени.

В резултат на това новата платформа на AMD може да бъде много привлекателно решение за онези потребители, които се нуждаят от висока многопоточна производителност. Както показаха нашите обширни тестове, най-добри резултати Ryzen 7 показва при работа с цифрово съдържание – при рендиране и при обработка на видео. А това означава, че професионалистите и любителите, които избират конфигурации за работа, а не за забавление, трябва сериозно да обмислят избора за себе си на процесори Ryzen 7. Тази препоръка обаче не важи за фотографите: с графичните редактори новата микроархитектура на AMD се показва без значение.

Що се отнася до по-масовите приложения на компютрите - игрите, тогава за тях Ryzen е далеч най-добрият избор. Има две слабости в дизайна на новите процесори на AMD: контролерът на паметта и относително слабият FPU. И това, и другото в игровите задачи има много голямо значение. Следователно в тях осемядрените процесори AMD дават само производителността на нивото на Core i5. Разбира се, това в никакъв случай не е изречение, защото такава скорост като цяло за съвременния графични картидостатъчно тихо.

И все пак, въз основа на резултатите от прегледа, можем да кажем, че Ryzen 7 е ясен успех за AMD. Компанията се връща към горните ценови сегменти и все още не е необходимо повече. Да се ​​надяваме, че сега инженерите на компанията ще могат да се придържат към графика, който самите те са определили, и всяка година ще пускат подобрени версии на Zen, в които всички тесни места на тази микроархитектура ще бъдат постепенно коригирани.

От своя страна тази седмица AMD покани избрани членове на пресата и анализатори да дойдат и да обсъдят следващото ниво на дзен данни. В тази част обсъждаме съобщенията за микроархитектурата, които са направени, и също така виждаме как се сравнява с предишните поколения основни дизайни на AMD.

AMD Zen

Прогноза, декодиране, опашка и изпълнение

Първо, нека се потопим направо в блок-схемата, както е показано:

Ако се съсредоточим само отляво, за да започнем, можем да видим повечето от детайлите на микроархитектурата на високо ниво, включително основните кешове, новото включване на op-cache, някои подробности за декодери и диспечери, планировчици, портове за изпълнение и зареждане /уредби за съхранение. Няколко слайда по-късно в презентацията говорят за пропускателната способност на кеша.

Първо, едно от големите отклонения от предишните дизайни на микроархитектурата на AMD е наличието на микрооперационен кеш (може би си струва да се отбележи, че тези слайдове понякога говорят за това кога това означава микрооперация, което създава малко объркване). Дизайнът на Bulldozer на AMD не разполагаше с операционен кеш, което изискваше да извлича подробности от други кешове, за да реализира често използвани микрооперации. Intel е внедрил подобно споразумение в продължение на няколко поколения с голям ефект (някои от които са големи ходове за Conroe), така че виждането му тук е достатъчно обещаващо за AMD. Не ни беше казано степента или степента на този буфер и AMD може да предостави тази информация с течение на времето.

Освен очакваните „подобрения за предсказване на клонове“, които са толкова неясни, колкото и да звучат, AMD все още не е разкрила декодиращите устройства в Zen, но е посочило, че те могат да декодират четири инструкции на цикъл, които да се подават в опашка от операции. Тази опашка, с op-cache, може да достави 6 операции/цикъл за планировчици. Причините, поради които опашката може да изпраща повече на цикъл, е, че декодерът може да предостави инструкция, която след това завършва в две микрооперации (улеснявайки дефинирането на инструкции и микрооперации). Тази опашка от микрооперации обаче помага за подаването на отделни сегменти с цели числа и с плаваща запетая към процесора. За разлика от Intel, който използва комбиниран планировчик за INT/FP, диаграмата на AMD предполага, че те ще останат отделни със собствените си планировчици в този момент.

От страната INT на ядрото ще се изпълняват ALU операции, както и AGU/зареждане и операции за съхранение. Устройствата за зареждане/съхранение могат да изпълняват 2 16-байтови зареждания и едно 16-байтово запаметяване на цикъл, използвайки 32 KB 8-пътека, L1 Data cache набор от асоциативни записи. AMD изрично направи това кеш за обратно записване, а не кеша за запис, който видяхме в Bulldozer, който беше източник на много време на празен ход в определени кодове. AMD също така заявява, че зареждането/съхраняванията ще имат по-ниска латентност в кеш паметта, но не обяснява до каква степен са се подобрили.

FP страната на ядрото ще осигури два мулти-порта и два ADD порта, което трябва да позволи две комбинирани FMAC операции или една 256-битова AVX на цикъл. Комбинацията от INT и FP сегменти означава, че AMD се стреми към широко ядро ​​и иска да използва значително количество паралелизъм на ниво инструкции. Колко ще зависи от кеш паметта и буферите за пренареждане - към момента не са дадени реални данни за буферите, освен че в ядрата ще бъде добавен по-голям прозорец на планировчика на инструкции +75% за операции за пренареждане и +50% по-широка ширина на въпроса за потенциални пропускателна способност. По-широките ядра, ceteris paribus, ще позволят на AMD да работи с много нишки едновременно, за да използва потенциално множество нишки с линеен и естествено нисък IPC.

Какво да очакваме от компанията през 2017 г.?

Преди време AMD сподели с широката публика поредните данни за новата микроархитектура Zen, както и за платформата AM4, която (заедно с новите процесори и APU) трябва да се превърне в основен продукт на компанията за пазара на настолни компютри през следващата година. Ясно е, че предварителната информация не е изчерпателна, но е доста интересна, защото ви позволява да разберете приблизително какво да очаквате от новите продукти (и какво не). Това беше причината да напиша този материал, посветен не на микроархитектурните тънкости (разбира се, важни, но не всички), а, да кажем, потребителските характеристики на новата платформа.

Актуални проблеми

Както писахме преди почти две години, ситуацията с десктоп платформите на AMD изглеждаше малко странна през последните няколко години. Всъщност основните събития се случиха в областта на APU (както компанията нарича процесори с интегрирана графика), където от 2011 г. насам се промениха две платформи и половина: FM1, FM2 и съвместима с последната от горе до долу FM2+. Въпреки това, всички изброени решения (дори платформата FM1, която не закъсня на пазара) могат да се считат за модерни: високата степен на интеграция ви позволява да създавате цялостни системи, използвайки само няколко чипа - самият процесор (повечето от които са оборудвани с GPU, които са отлични по стандартите на интегрирани решения) и чипсет. Линията от чипсети също отговаря на съвременните изисквания - по отношение на функционалната интеграция, AMD много често изпреварва Intel, като е първият, който предоставя чиповете си с вградена поддръжка за USB 3.0 и 6 Gb / s скорост за всички SATA портове, например . Единственото нещо, което възпрепятства широкото разпространение на решения за тази платформа, беше относително ниската производителност и високата консумация на енергия на процесорната част на APU в сравнение с конкурентните решения. По-висока производителност може да се постигне чрез избор на решения за платформата AM3 +, която всъщност се връща към платформите от началото на века. А самите многомодулни процесори не са били значително актуализирани за него от 2012 г., така че те могат да се продават само поради ниски цени при относително висока цена, поради използването на вече остарялата 32 nm технология. Последното до известна степен се отнася и за APU, които по време на съществуването си „превключиха“ от споменатите стандарти само на 28 nm, което също не е пикът на технологията от дълго време - в много отношения това е причината за споменатите проблеми с консумация на енергия.

Струва си да се отбележи, че компанията никога не е смятала това състояние на нещата за „нормално“: обединяването на платформите първоначално е било планирано само за 2012 г. На практика обаче това не се случи, така че едно своеобразно "седене на два стола" продължава и до днес. Така всъщност както процесорите, така и платформите на AMD вече са остарели, така че ситуацията трябва да се промени радикално. Това планира да направи компанията.

AM4: най-накрая една платформа

AMD напълно потвърди съществуващите предположения за характеристиките на новата платформа и дори "с хълм". По-специално, към Основни функцииКомпанията AM4 разказва следното:

  • DDR4 памет
  • Пълна поддръжка на PCIe 3.0
  • USB 3.1 („пълен“, т.е. Gen2 до 10 Gb/s)
  • NVMe и SATA Express

Относно последна точка, тогава по принцип не са необходими сериозни хардуерни подобрения за неговото внедряване: това е възможно и в рамките на съществуващите платформи. По-специално, много производители дънни платкидори гамата от модели с AM3 + е актуализирана, като им се осигурява зареждане от NVMe устройства. По-важно за пълното функциониране на NVMe дисковете на максимална скоросте PCIe 3.0 поддръжка, която AM3+ изобщо нямаше, а APU-тата за FM2+ поддържаха само 24 линии от този интерфейс, някои от които "оставени" за комуникация с чипсета, а 16 може да са необходими на видеокартата. Освен това, както бе споменато по-горе, нямаше високопроизводителни процесори за FM2 +, така че платформата отдавна и твърдо се е установила в бюджетния сектор, където протоколът NVMe не е много подходящ (просто защото досега всички устройства, които го поддържат, са изключително „небюджетни“). AM4, от друга страна, се предполага, че е решение за всички пазарни сегменти, така че може да се наложи за него - особено като се има предвид жаждата на AMD за създаване на "дълголетни" платформи, което много потребители оценяват. Точно същото важи и за поддръжката на USB 3.1: засега тя не е необходимост, но може да бъде полезна в бъдеще. Отново, както бе споменато по-горе, предишна версия AMD внедри стандарта в чипсетите година по-рано от Intel, така че е логично да очакваме същото и за нова версия USB.

Приемането на DDR4 е дългоочаквана стъпка, тъй като производителността на интегрираните GPU е силно зависима от честотната лента на паметта. По-рано този проблем трябваше да бъде решен чрез увеличаване на честотите на DDR3, но този подход, меко казано, не е идеален по отношение на цената и консумацията на енергия на модулите. Всъщност, това е причината да се говори за въвеждане на поддръжка на DDR4 в AMD APU от 2013 г. (тогава имаше много предположения за две опции в предстоящия Kaveri), но дълго време новите модули памет бяха твърде скъпи, за да бъдат използвани в масови системи. В момента доставките на DDR4 вече изпреварват DDR3, така че цените са наваксали - с тенденция в полза на DDR4. Като цяло е време да се сбогуваме със старите стандарти и, очевидно, AMD планира да го направи по-рязко от Intel - припомняме, че все още не е изоставил напълно DDR3. От друга страна, последната голяма актуализация на LGA115x беше миналата година, а най-интересните продукти за AM4 ще се появят през следващата година, така че тази разлика в подходите е съвсем разбираема.

Бристол Ридж: междинно решение

Въпреки това, „разработването“ на платформата почти започна: както се очакваше, редица процесори за нея бяха пуснати точно сега и вече се доставят на големи производители. Всички те все още принадлежат към бюджетния сегмент, така че най-функционалният от чипсетите (X380) е "изцеден" от компанията досега, доставяйки само няколко евтини модификации - A320 и B350. Въпреки това на практика мнозина ще имат достатъчно от тях. Това, което нямат, е поддръжката на PCIe 3.0 - съответно само 4 или 6 PCIe 2.0 ленти. От друга страна, 10 PCIe 3.0 ленти (без да се броят тези, необходими за комуникация с чипсета) се поддържат от самите настоящи процесори/APU и наличието на мощна (за решения от този клас) графика в тези APU в евтин компютър определено ще остави PCIe процесорните ленти свободни за периферни устройства.

Като цяло, всъщност може да се наблюдава обединяването на мобилни и настолни решения: APU от семейството Bristol Ridge са наследници на вече познатия Carrizo. В допълнение към споменатите 10 PCIe 3.0 ленти (x8 + x1 + x1, последните две могат да бъдат „раздадени“ на NVMe устройство едновременно), самите те поддържат 4 USB 3.0 порта (известен още като USB 3.1 Gen1) и 2 SATA600 портове. Използването на по-младия чипсет A320 добавя към горния USB 3.1 конектор (пълна скорост, както е отбелязано по-горе), 2 USB 3.0 порта, 6 USB 2.0 порта, 4 PCIe 2.0 ленти, 2 SATA600 порта и 1 SATA Express конектор (който може да се използва като чифт SATA ). B350 има същата функционалност, но добавя още 1 USB 3.1 порт и 2 PCIe 2.0 ленти. Освен това, по добра традиция, всички решения на AMD поддържат създаването на RAID масиви от нива 0, 1 и 10.

Как се сравнява това с бюджетните предложения на Intel като H110 и B150? За да опростим разбирането, нека съберем характеристиките на платформите в таблица, като добавим към нея масивния A78 за изходящия пазар FM2+.

ЧипсетAMD A78AMD A320AMD B350Intel H110Intel B150
PCIe 3.0 ленти (общо)8/16 10 10 16 24
PCIe 2.0 ленти4 4 6 6 0
SATA600 портове6 до 6до 64 до 6
RAID 0/1/10дададаНеНе
SATA Express портове0 1 1 0 0
USB 3.1 портове0 1 2 0 0
USB 3.0 портове4 6 6 4 6
USB 2.0 портове14 6 6 6 6

И така, единственото формално слабо място на новата платформа е броят на линиите PCIe 3.0, предоставени от процесора: само 10 срещу обичайните 16 в масовия сегмент.Но това място е само слабо чао- просто в момента няма други APU модели, но в бъдеще ще се появят. В крайна сметка решенията, базирани на FM2+ (A78), може изобщо да нямат PCIe 3.0 ленти - ако инсталирате FM2 процесор в платката, която поддържа само PCIe 2.0. И при Intel платформидруг проблем: всички процесори за LGA1151 поддържат PCIe 3.0 x16, но на платки с бюджетни чипсетитакава конфигурация от линии ще бъде единствената - не се предполага, че тези линии се „разделят“ на слотове / устройства. AMD се придържа към различна практика, така че в система с A320 можете например да "задвижите" две NVMe устройства към PCIe 3.0 - но в система с H110 това е невъзможно (обаче PCIe 3.0 x2 е еднаква в честотната лента към PCIe 2.0 x4, но в много евтини платки, базирани на H110, може ли да се реализира поне такъв слот?). Колко това (както и поддръжката на SATA Express или RAID масиви) се търси в евтини системи е отделен въпрос. Но фактът остава: всъщност дори най-младите версии на новата платформа са сравними по функционалност с по-старите решения на Intel.

Що се отнася до възможностите за свързване на външни периферни устройства, чипсетите за FM2+ продължават да държат рекорда по отношение на общия брой USB портове. Но този рекорд е чисто теоретичен - всъщност просто няма търсене на толкова много USB 2.0 в крайните решения. Но четири високоскоростни USB порта понякога не са достатъчни, което „побеждава“ и Intel H110. В същото време най-младият чипсет за AM4 поддържа седем USB 3.0 порта (един от които обикновено е USB 3.1, който, както вече беше споменато по-горе, е основно резерв за бъдещето, но USB скорост 3.0 този порт може да се използва сега) - дори повече от B150. Вероятно в поредицата "200". Чипсети на IntelТой ще „поправи“ по-младите модификации, но засега не е там, а A320 и B350 вече се доставят на производителите.

Развитието на компактни компютри, базирани на процесори AMD, трябва да блести с нови цветове, тъй като част от функционалността на традиционните чипсети вече е прехвърлена към самите процесори, което до известна степен прави AM4 свързан не само с FM2+ или AM3+, но и с AM1 . В AM1 обаче функционалността на SoC беше много ограничена и нямаше възможности за нейното разширяване, но сега този проблем е отстранен. По-точно, той беше заснет в преносими компютри Carrizo преди година и не е изненадващо, че тези постижения бяха взети предвид и наследени при разработването на нова платформа за настолни компютри. Какво дава на практика? Например, без особени затруднения е възможно да се произвеждат Mini-STX платки със сменяем процесор, но "спестявайки" чипсета на чипсета - четири USB 3.0 порта и чифт SATA600 (един от които в комбинация с PCIe 3.0 x4, разумно е да се присвои на M. 2) има достатъчно. Преди беше трудно, но сега не е.

процесорAMD A12-9800AMD A12-9800EAMD A10-9700AMD A10-9700EAMD A8-9600AMD A6-9500AMD A6-9500EAMD Athlon X4 950
Технология на производство 28 nm
Стандартна/максимална честота на ядрото, GHz 3,8/4,2 3,1/3,8 3,5/3,8 3,1/3,5 3,1/3,4 3,5/3,8 3,0/3,4 3,5/3,8
Брой модули / изчислителни нишки 2/4 2/4 2/4 2/4 2/4 1/2 1/2 2/4
L1 кеш (общо), I/D, KB 192/128 192/128 192/128 192/128 192/128 96/64 96/64 192/128
L2 кеш, KB2×10242×10242×10242×10242×10241×10241×10242×1024
RAM 2×DDR4-2400
TDP, W65 35 65 35 65 65 35 65
Графични изкустваRadeon R7Radeon R7Radeon R7Radeon R7Radeon R7Radeon R5Radeon R5-
Брой графични процесори512 512 384 384 384 384 384 -
Честота std/max, MHz 1108 900 1029 847 900 1029 800 -

Но защо, с всички тези интересни функции, сме склонни да разглеждаме сегашното внедряване на платформата като междинно решение? Факт е, че процесорите, които в момента съществуват за него, са много ограничени. AMD, разбира се, хвали APU от "седмо поколение", но същото беше казано и за предишните модели. Но на практика това е просто по-нататъшно развитие на същата модулна архитектура, която дебютира през 2011 г., и същата 28 nm технологична технология, която се използва от 2014 г. Да, както показаха нашите тестове, процесорите Carrizo често (благодарение на оптимизациите) са по-бързи от Kaveri, работещи на по-висока тактова честота, и поддръжката на DDR4 памет би трябвало да ги "насърчи" малко повече. Интегрираният графичен процесор преди това беше един от най-добрите в своя клас, а от 2015 г. получи актуализиран модул за видео обработка с хардуерна поддръжка за VP9 и H.265/HEVC с резолюции до 4K. Всичко това е вярно - но води само до еволюционни промени, които не променят фундаментално класа на решението. И така, единственият Athlon X4 за новата платформа в момента, моделът с индекс 950, е ​​идентичен във всичко, с изключение на типа RAM на Athlon X4 845 за FM2+, и можете да изберете повече или по-малко близки аналози за други нови процесори. Следователно реалното стартиране на платформата AM4 се очаква едва през следващата година - във всеки случай, ако плановете на AMD бъдат изпълнени.

Дзен: какво ново?

И така, какви бяха предизвикателствата пред компанията? Основната противоречива точка на разработената модулна архитектура бяха самите модули: за да се спести транзисторният бюджет, двойката „x86 ядра“, включени в тях, зависят едно от друго, тъй като споделят някои блокове. По-специално, в първите реализации, дори декодерът на инструкциите и кешът на инструкциите бяха еднакви. Второто слабо място е системата за памет. По време на разработването на първите процесори е възможно да се направи бърз кеш от второ ниво, но L3 остава външен за основната част на процесора, така че работи асинхронно с него на по-ниски тактови честоти. В резултат на това в по-високите конфигурации на процесорите от семейството FX общият капацитет на L2 се оказа равен на L3, което принуди AMD да продължи да използва изключителната архитектура на кеш паметта. Работеше чудесно в дните на едноядрените процесори, но затрудняваше обмена на данни между изчислителните нишки в многоядрените процесори, усложнявайки алгоритмите: ако нещо не е в L3, може да е в L2 на един от модулите , или може би само в паметта. И дори единичен L2 за няколко ядра, който е толкова удобен за Core 2 Duo, не може да се използва за синхронизация: модулът, който изпълнява само един команден поток, показа най-голяма ефективност, т.е. изтегляне на „втори половини“ (всъщност , по-малка част от тях) имаше смисъл да се работи само с твърде много от него, но не и на обичайните за масивни натоварвания два или четири потока.

И в APU по-голямата част от кристала беше заета от графичното ядро, така че тези модели останаха без нито една кеш памет, дори и да е бавна, защото в противен случай процесорът щеше да се окаже твърде голям. Всъщност, когато се използват едни и същи производствени стандарти, APU се конкурираха по цена с по-старите четириядрени модели от масовата процесорна линия на Intel, а по-старите процесори с четири модула се оказаха още по-скъпи. Но в същото време може да се говори за конкуренция по отношение на производителността само чрез сравняване на четири AMD модула с четири Intel ядра - само един SIMD блок на модул добави масло в огъня. В същото време самите процесори на Intel бяха по-евтини за производство и поради характеристиките на платформите те струваха значителнопо-малко. APU се „бореха“ само с много евтини двуядрени процесори на Intel и го правеха с променлив успех. Разбира се, те имаха предимство в изпълнението на графичната част, но далеч не винаги беше в търсенето.

Какво се променя в новото поколение (както обещахме - с прости думи, без да навлизаме в техническата джунгла)? „Основният елемент“ на Zen донякъде напомня на двумодулния процесор от предишната архитектура, но със значителни подобрения. Първо, той не включва четири сдвоени "x86-ядра", а четири пълноценни и независими ядра - независими дори по отношение на кеш паметта от второ ниво, чийто общ капацитет е намалял наполовина, но сега всяко ядро ​​има свой собствен L2 (и, разбира се, собствен декодер за инструкции заедно с кеш за инструкции). Второ, кеш паметта от трето ниво се превърна в неразделна част от такава „тухла“. Очевидно той ще работи много по-бързо от предшествениците си, а капацитетът му е 8 MB. Трето, и не на последно място, AMD също успя да внедри симетрична многонишкова технология, така че всяко ядро ​​да може да изпълнява команди от не една, а две нишки.

Всъщност, както можете да видите, в своя "базов" вариант, Zen силно наподобява най-добрите масови процесори на Intel, т.е. четириядреният Core i7. В същото време такъв „модул“ през втората половина на следващата година ще бъде използван и в APU, където сега има само два „стари“ модула и изобщо без кеш от трето ниво. Графичното ядро ​​може да не достигне най-добрите решения на Intel (особено тези, оборудвани с кеш памет от четвърто ниво - AMD все още не обещава подобно нещо), но ще бъде по-производително от масово произвежданата интегрирана графика на Intel. Освен това, според наличните данни за вътрешна организацияпроцесори, компанията също така ще може да овладее бюджетна модификация с двойка ядра и L3, намалени до 4 MB, т.е. да пусне директни конкуренти за различни Core i3 и други двуядрени процесори (особено мобилни). Сега само двумодулните (по терминологията на AMD - "четириядрени") процесори могат да се конкурират с тях, а в бъдеще и "обикновените" двуядрени процесори ще направят същото.

Въпреки това не може да се каже, че компанията е успяла напълно да постигне „основен паритет“. По-специално, блоковете за работа с числа с плаваща запетая и други SIMD инструкции са променени в по-малка степен, отколкото бихме искали. Те нямат нормална поддръжка за работа с 256-битови вектори, т.е. не трябва да очаквате високи резултати при AVX2 код. От друга страна, в момента е преждевременно да се каже нещо за производителността - новата микроархитектура ще дебютира в готови продукти едва през следващата година. Тогава ще има пълна яснота с техните тактови честоти, цени и производителност при реални задачи. Засега можем само да оценим плановете на AMD.

И те също намериха място за феновете на високата производителност на процесора, тъй като ще има поне две опции за оформление на готовите продукти (и ако вземем предвид възможността за пускане на двуядрени модели, които лесно могат да намерят своето място в бюджетния сегмент , след това три): с изключение на APU, където, както вече беше казано по-горе, един четириядрен Zen „модул“ ще бъде в съседство с GPU, също се планира да се пуснат „чисти“ CPU - с два модула. Тоест, такива решения ще получат 8 ядра, способни да изпълняват едновременно 16 изчислителни нишки и оборудвани с кеш памет от трето ниво с капацитет 16 MB. При L3 не е напълно ясно дали ще бъде един обем, достъпен за всички ядра на "композитен" процесор, или два отделни блока (което е присъщо на "слепването"), но капацитетът ще бъде точно такъв. В същото време топ процесорите ще останат съвместими със същата платформа AM4, което е важно конкурентно предимствопреди процесорите на Intel за LGA2011-3 и техните наследници, с масова линия механично несъвместими. Да, разбира се, казаното по-горе за производителността на векторните инструкции ще бъде вярно и контролерът на паметта в тези нови модели ще остане двуканален, а не четириканален, но последното има своите предимства: платките ще бъдат по-евтини . Освен това, това ще бъдат същите платки като за евтините APU, т.е. дългоочакваната единична платформа на AMD вероятно ще се използва дори по-широко от LGA115x на Intel. И ако компанията успее да го „поправи“ за пет години (осъществявайки поне съвместимост „отгоре надолу“), превръщайки го в „дълъг черен дроб“ от клас AM3, толкова по-добре за много потребители.

Разбира се, възниква логичен въпрос: ако всички промени са толкова логични и очаквани, тогава защо „чакането“ се проточи толкова дълго? В края на краищата, в добър смисъл, такива устройства все още са необходими "вчера", а компанията планира да ги достави едва "утре". Има проблем, но той не засяга самото развитие, а само производството. Всъщност всичко, което AMD предлагаше доскоро, е 32 nm технологичен процес, който е достатъчен само за FX. В най-добрия случай достигайки нивото на Intel Sandy Bridge, който също е на повече от пет години. Последни модели APU обаче използват 28nm стандарти, но това не е много по-добро от 32nm. Затова се планира "голям скок" в производството - преходът към 14 nm технологичен процес. Преходът ще се осъществи с известно закъснение от Intel (които използват тази технология от две години), но разбираемо и разбираемо. Като цяло беше невъзможно да се направят такива процесори, без да се усвоят нови производствени стандарти - а усвояването им отнема време. Искаме да вярваме, че AMD ще успее.

Обща сума

И така, какво получаваме? Първо - най-накрая! - преминаването към единна платформа, което не се е случвало от пет години. И в този случай можем да говорим за „голям скок“: според плановете AM4 трябва да бъде по-гъвкав от Intel LGA115x. Второ, значителна промяна в микроархитектурата - с увеличаване на производителността и общата ефективност на процесорите, базирани на нея. Трето, рязко подобряване на производствените стандарти, което само по себе си е добро и без което подобни промени не биха били възможни. Тоест, както можете да видите, AMD планира да премахне всички недостатъци на днешните системи за масово производство с един замах. ще работи ли Само практиката ще покаже това - засега можем да оценим само планове и предварителна информация. Въпреки това, под някаква формаплатформата AM4 вече съществува и в своя ценови сегмент има редица предимства пред конкурентните разработки. По принцип те са наследени от своите предшественици (това не е изненадващо - трудно е произвежданите в момента APU да бъдат наречени "нови"), но с добавяне (поне потенциално) на възможност за надграждане и по-дълъг жизнен цикъл. А окончателен отговор на въпроса колко успешен ще бъде преходът ще получим догодина. Бих искал да вярвам, че отговорът ще бъде положителен - така поне по-интересно :)

През 2017 г. AMD представи процесори Ryzen с новата микроархитектура Zen. Днес редакторите на сайта ще анализират подробно Zen микроархитектурата, проследявайки как забавянето и пропускането на инструкции са се променили след K10.

Освен от обичайните начиниза увеличаване на производителността на процесора (увеличаване на тактовата честота, увеличаване на ширината на пътя на изпълнение, разширяване на капацитета на IU и векторизиране на инструкциите), има неочевиден начин - намаляване на времената на инструкциите, тоест намаляване на времето за изпълнение на инструкциите. Например, намаляването наполовина на времето, необходимо за изпълнение на операция за разделяне, условно би било равно на удвояване на тактовата честота на процесора при извършване на разделяне (с много предположения). По този начин намаляването на времето за изпълнение на инструкциите може да бъде доста по ефективен начин, макар и много ограничен и специфичен (тъй като за да се увеличи скоростта на целия процесор, е необходимо да се намалят времената на всички инструкции, докато в действителност времената само на определени инструкции обикновено намаляват, което ускорява процесора само в тесен набор от задачи).
Общо има два най-важни момента: латентност и реципрочна пропускателна способност. Където забавянето се изразява в цикли, които са необходими за изпълнение на инструкцията, а празнината е броят на циклите, които трябва да бъдат пропуснати, за да се изпълни следваща инструкцияв този IU. Нека сравним времената на някои инструкции за K10, Bulldozer и Zen, като използваме референтните данни на Agner Fog.

Таблиците ще бъдат изградени по следния начин: инструкцията и операндите ще бъдат посочени в колоната "Инструкция" (m, m32, m64, m128, m256 - памет; r, r32, r64 - RON; mm - MMX регистри; xmm - SSE регистри; ymm - регистри AVX); колони K10, Bulldozer и Zen директно ще посочат времената в цикли за тези микроархитектури според схемата "забавяне (пропускане)".

Инструкции за X86

Инструкция

MOV: Прехвърлянето на данни от паметта към регистрите за Zen на ниво K10 е 3 цикъла, докато за Bulldozer е 4 цикъла.
XCHG: Обменът на данни между регистрите е "безплатен" за Zen (с интервал от 0,33 цикъла), докато K10 и Bulldozer имат съответно 2 и 1 цикъла. Обменът на данни между регистър и памет в Zen е по-голям, отколкото в K10 - 30 цикъла срещу 21, но по-малко, отколкото в Bulldozer - 50.
PUSH: Необходим е 1 часовник за всички участници, за да бутнат число в стека.
POP: Изваждането на число от горната част на стека в Zen отнема половин часовник, докато преди отнемаше 1 часовник.
ДОБАВЯНЕ: Операцията за събиране на K10, Bulldozer и Zen отнема 1 такт, но трябва да се отбележи, че K10 пропуска 1/3 такт, Bulldozer пропуска 1/2, а Zen пропуска 1/4 такт.
Подобна е ситуацията с изваждане (SUB), промяна на знака на число (NEG), увеличение (INC), намаляване (DEC), логическо И (И), логическо ИЛИ (ИЛИ), логическо изключващо ИЛИ (XOR), бит инверсия (НЕ) .
MUL: Умножението без знак на Zen вече е два пъти по-бързо, отколкото на Bulldozer - 3 цикъла срещу 6.
IMUL: Умножаването на Zen отнема само 3 цикъла, докато на Bulldozer отнема 6, а на K10 отнема 4.
DIV: деленето без знак също се ускорява: Дзен изисква 14-46 цикъла; Булдозер - 16-75; К10-15-78.
IDIV: Операцията за разделяне е значително по-бърза в Zen - 14-47 цикъла срещу 22-79 за Bulldozer.
Обобщавайки междинния резултат, основните инструкции от набора X86 започнаха да се изпълняват на Zen по-бързо, отколкото на техните предшественици, т.е. Zen, дори при същата честота като своите предшественици, ще покаже по-голяма производителност (с преобладаването на представените инструкции в кода).

Инструкции за X87

Към днешна дата наборът от инструкции X87 почти никога не се използва в съвременните програми и е оставен в процесорите за съвместимост (същият „+“ на архитектурата x86). Този набор от инструкции не е разработван от дълго време - нито се добавят нови инструкции, нито регистри.

Инструкция

FLD: Зареждането на реално число в стека в Zen стана по-бързо - 1 часовник срещу 2 часовника, но разликата се увеличи - в K10 и Bulldozer разликата беше 0,5 часовника, а в Zen - 1 часовник.
FST: при копиране на реално число от стека ситуацията е подобна на FLD.
FILD: Зареждането на цяло число в стека в Zen вече е по-бързо, отколкото в Bulldozer - 8 цикъла срещу 12, но по-бавно, отколкото в K10 (6 цикъла).
FIST: при копиране на цяло число от стека ситуацията е подобна на FILD.
FISTP: с четене на цяло число от стека, ситуацията е подобна на FILD.
FADD: добавянето на реални числа в Zen отнема 5 цикъла, докато в Bulldozer - 5-6, а в K10 - 4.
FSUB: при изваждането на реални числа ситуацията е подобна на FADD.
FMUL: при умножението на реални числа ситуацията е подобна на FADD.
FDIV: разделянето на реални числа наистина стана по-бързо - както по отношение на забавяне, така и на пропускане: Zen извършва операцията в 8-15 цикъла, докато Bulldozer - 10-42 и K10 - 31.
FSQRT: Извличането на квадратен корен също е по-бързо: Zen извършва операцията в 8-21 цикъла, докато Bulldozer отнема 10-53, а K10 отнема 35.
FXTRACT: Извличането на експонентата и мантисата на Zen е по-бавно от това на Bulldozer - пропуска се с 2 такта, като същевременно се поддържа същата латентност от 10 такта.
FCOS: Изчислението на косинус в Zen е по-бързо, отколкото в Bulldozer - 50-115 цикъла срещу 160.
FSIN: с изчисляването на синуса ситуацията е подобна на FCOS.
Както беше отбелязано по-горе, наборът от инструкции X87 не е еволюирал и е запазен за съвместимост - това може да се види във времето за изпълнение на инструкциите в Zen, където скоростта на изпълнение на много инструкции, макар и по-бърза от тази в Bulldozer, е по-ниска от тази в K10, което е издаден през 2007 г. От разгледаните инструкции само разделянето на реални числа FDIV и извличането на корен квадратен FSQRT получи значително ускорение.

MMX инструкции

Наборът от инструкции MMX беше обявен през 1997 г. и предлагаше осем 64-битови mm регистъра и 57 инструкции. Към днешна дата този набор от инструкции е остарял и не се развива - оставен модерни процесориза съвместимост.

Инструкция

MOVD: прехвърлянето на данни към Zen, в зависимост от операндите, става по-бързо или остава на ниво K10, например: прехвърлянето от RON към mm регистри в Zen отнема 3 цикъла, докато в K10 отнема 6 цикъла.
MOVQ: Прехвърлянето на четири думи между mm регистри в Zen е два пъти по-бързо, отколкото в K10 - 1 такт срещу 2 (по подобен начин пропускане - 0,25 такта срещу 0,5).

С логическо ИЛИ (POR), логическо И (PAND), побитово логическо НЕ (PANDN), ситуацията е подобна на PXOR.
PMADDWD: Умножението с четири думи в Zen е със същата скорост като в K10 (но по-бързо отколкото в Bulldozer).
PCMPEQB: Проверката за равенство на байтовете Zen отнема 1 такт, докато K10 и Bulldozer отнемат 2 такта.
Както можете да видите, от разгледаните инструкции, значителна част започна да се изпълнява по-бързо в Дзен, отколкото в неговите предшественици.

SSE инструкции

Наборите инструкции за SSE (SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2) станаха широко разпространени и бяха активно разработени доскоро (преди появата на AVX). Тези набори от инструкции решиха основните недостатъци на MMX (работа само с цели числа и невъзможността за паралелна работа с MMX и X87) и предоставиха осем (по-късно 16) 128-битови регистъра. Голям брой инструкции (около 300), 128-битови регистри, работа с реални числа и удобство (в сравнение със стека в X87) направиха възможно изоставянето на MMX и X87. Нека да разгледаме някои инструкции от комплектите SSE.

Инструкция

MOVD: прехвърлянето на данни към Zen, в зависимост от операндите, става по-бързо или остава на ниво K10, например прехвърлянето от RON към xmm регистри в Zen отнема 3 цикъла, докато в K10 отнема 6 цикъла.
MOVQ: Прехвърлянето на четири думи между xmm регистри в Zen е 2,5 пъти по-бързо, отколкото в K10 - 1 такт срещу 2,5.
PXOR: побитово логическо XOR в Zen се извършва в 1 цикъл срещу 2 в K10.
ADDPS: паралелното събиране на четири двойки числа с плаваща запетая в Zen отнема 3 цикъла, докато в K10 - 4, а в Bulldozer - 5-6.
Същото важи и за инструкциите за събиране на реални числа (ADDSS), паралелно изваждане на реални числа (SUBPS) и паралелно умножение на реални числа (MULPS и MULSS).
DIVPS: паралелното деление на реални числа в Zen стана значително по-бързо, отколкото в K10 - 10 цикъла срещу 18 (подобно с прескачането).
SQRTPS: Извличането на корен квадратен от четири числа отнема 9-10 часовника за Zen, докато K10 отнема 21 часовника, а Bulldozer отнема 14-15 часовника.
ANDPS: Побитовата операция И в Zen отнема 1 цикъл, докато в K10 и Bulldozer отнема 2 цикъла.
По същия начин, с операциите побитово логическо ИЛИ (ORPS) и побитово логическо изключително ИЛИ (XORPS).
Инструкциите на AVX не бяха включени от нашата редакционна колегия поради факта, че те отсъстват в K10 и следователно няма да е възможно да се проследи развитието на микроархитектурите.

Заключение

Както можете да видите, AMD е работила старателно върху микроархитектурата Zen, променяйки не само основната концепция, броя на IO, декодери и т.н., но също така намалява времето за изпълнение на много инструкции, което също ще има положителен ефект върху производителността в различни приложения. В същото време е важно да се разбере, че не всички инструкции са се „ускорили“, например, ако класическите X86 инструкции в по-голяма степен (от разглежданите) започнаха да се изпълняват по-бързо в Zen в сравнение с техните предшественици, тогава Инструкциите на X87 практически не получиха никакво ускорение (което отново предполага, че наборът от инструкции на X87 е остарял, въпреки че остава необходим за съвместимост). Векторните инструкции (MMX и SSE) също са по-бързи. По този начин AMD не просто „копира“ части от K10 и Bulldozer в Zen, но значително преработи IU, правейки ги по-бързи (ще бъде интересно да сравним времето на Intel и AMD).

Останалите материали за микроархитектурата Дзен са събрани.

На една пресечка от мястото, където сега се провежда годишната конференция IDF 2016, AMD беше домакин на собствено малко събитие, на което покани избрани представители на медиите и анализатори. Лесно е да се досетите, че основната и единствена тема на "частното парти" на AMD беше микропроцесорната архитектура Zen.

И така, AMD, чрез своя лидер Лиза Су, даде да се разбере, че всичко е наред с дългоочакваните процесори Zen, доставките на ограничени партиди чипове към партньорите вече са започнали, а появата на настолни процесори AMD Zen (с кодово име Summit Ridge) на рафтовете на магазините се очаква през първото тримесечие на следващата година. Интересното е, че компанията се насочва директно към сегмента на високопроизводителни настолни процесори, докато настоящите чипове на AMD са по-подходящи за използване в бюджетни системи.

„Ние се фокусираме върху процесори и графики за системи с висока производителност,“ каза главният изпълнителен директор на AMD Лиза Су, преди да премине към изброяване на последните постижения на компанията.

Сред тези постижения беше доставката на чипове за игрови конзоли PlayStation 4 и Xbox One(както и One S и предстоящия Project Scorpio), както и пускането на пазара на невероятно мощната графична карта Radeon RX480 само за $200.

Изпълнен с гордост от работата си, главният инженер на компанията Марк Пейпърмастър се зае да изброи основните силни страни на процесорите, базирани на архитектурата Zen. Той отбеляза, че разработването на архитектурата е извършено "от нулата" с фокус върху "производителност, честотна лента и енергийна ефективност". Броят на инструкциите за такт (IPC), изпълнявани от микропроцесора, се е увеличил с 40% в сравнение с моделите от сегашното поколение. В същото време консумацията на енергия е намаляла (колко не е уточнено). Това беше постигнато чрез 14-nm технологичен процес, използващ вертикално разположени затворни транзистори (FinFET - Fin Field Effect Transistor), известни също като транзистори с триизмерна структура на затвора или 3D транзистори. Също така, AMD най-накрая успя да въведе поддръжка за SMT многонишкова технология за обработка на данни, която гарантира, че инструкциите от различни независими нишки се изпълняват от няколко функционални модула едновременно.

„Като най-малкият играч, ние трябва да бъдем по-бързи, демонстрира б относноповече гъвкавост и находчивост“, казаха от Papermaster.

Задълбочавайки се в техническите детайли на микроархитектурата AMD Zen, компанията споменава увеличение на производителността на планировчика (x1.75) и увеличение на изчислителните ресурси (x1.5), 8 MB L3 кеш и 512 KB L2 кеш на ядро. Имайте предвид, че AMD обещава петкратно увеличение на честотната лента на кеша в сравнение с предишната архитектура на Excavator.






За средния потребител всички тези цифри означават по-високо ниво на производителност при изпълнение на трудоемки задачи (четете - възпроизвеждане на 4K видео, игри, включително VR) и намалено потребление на енергия, тоест по-висока автономност на мобилните компютри. На хартия всичко изглежда страхотно и наистина изглежда като самия скок, който ще позволи на AMD, ако не да заобиколи, то поне да настигне Intel, въпреки че много параметри остават да бъдат известни. Например, няма данни за топлинната мощност, спрямо които да може да се оцени енергийната ефективност. И, разбира се, AMD все още не е готова да говори за работни честоти и цени. Mark Papermaster обеща да разкрие повече технически подробности за Zen архитектурата на предстоящата конференция Hot Chips.

Първият процесор на AMD, базиран на микроархитектурата Zen, ще бъде настолен модел с кодово име Summit Ridge. Тя ще получи осем процесорни ядра и ще може едновременно да изпълнява до шестнадесет нишки от команди. Проектиран да се побере в процесорен сокет AM4, процесорът поддържа DDR4 памет и следващото поколение I/O интерфейси.

Компанията възлага големи надежди и на Zen архитектурата в други сегменти. По-специално, компанията очаква да се върне към по-печелившия сървърен сегмент. Сървърните процесори с кодово име Naples ще имат 32 ядра и ще могат да обработват до 64 потока инструкции. Те ще бъдат налични от второто тримесечие на 2017 г. В бъдеще процесорите от семейството Zen ще се използват в конвертируеми мобилни компютри с пасивна система за охлаждане, както и вградена технология. Между другото, AMD вече работи усилено върху своя наследник, архитектурата Zen+.

Презентацията включваше и демонстрация на живо на процесорите Summit Ridge на AMD. Компанията донесе инженерна извадка от 8-ядрения процесор Summit Ridge в съответствие с конкурентния 8-ядрен процесор Intel Core i7-6900K (Broadwell-E). За сравнение използвахме тестови инструменти за 3D моделиране на софтуера Blender. Инженерната проба на 8-ядрения процесор Summit Ridge работеше на 3 GHz, така че работната честота на Intel Core i7-6900K също беше намалена до 3 GHz. Това беше направено с цел изравняване на шансовете на съперничещите страни. Системата, базирана на процесора AMD Summit Ridge, изобрази сцената с половин секунда по-бързо от своя конкурент Intel Core i7-6900K. Презентацията също така включваше демонстрация на съвместната работа на AMD Summit Ridge и AMD R9 Fury X в Deux Ex: Човечеството разделенопри 4K графична резолюция. Разбира се, на присъстващите не беше показан точният брой кадри в секунда, издадени от системата, но като цяло играта вървеше гладко.

Главният анализатор на изследователската компания Tirias Research, който успя да присъства на презентацията, нарече AMD Summit Ridge „най-интересният процесор от компанията през последните 10 години“.