Úvod Za posledných pár rokov AMD stratil takmer všetky predtým získané pozície na trhu procesorov stolné počítače. S rodinou jadier Bulldozer spoločnosť uviazla vo svete 32nm a 28nm planárnych tranzistorových čipov, zatiaľ čo Intel opakovane robil architektonické vylepšenia, prešiel na 3D tranzistory a tiež zaviedol výrobné procesy s 22nm a 14nm štandardmi. Výsledkom bolo, že v sortimente AMD jednoducho nezostali žiadne ponuky na produktívne počítače a Intel v skutočnosti mohol zaujať monopolné postavenie. AMD sa však našťastie rozhodlo nezmieriť sa so súčasnou situáciou a posledné roky venovalo práci na novom dizajne procesora – mikroarchitektúre Zen. Sľubuje všetko, čo by nadšenci chceli vidieť v modernom procesore: vysokú špecifickosť, dobrú energetickú účinnosť, moderná technológia výroba a atraktívna cena. AMD Ryzen sú prvé procesory na novej mikroarchitektúre a ak vývojári naozaj splnili všetky svoje sľuby, tak dnes uvidíme triumfálny návrat AMD na trh.

Zen je obrovským krokom vpred oproti minulým mikroarchitektúram AMD. Nejde o ďalší vývoj Buldozéra, ale o úplne nový a nezávislý projekt, ktorý dosiahol bezprecedentné zvýšenie efektivity. V dôsledku toho práca AMD hovorí o 52-percentnom zvýšení IPC (počet inštrukcií vykonaných na takt) v porovnaní s mikroarchitektúrou Excavator. Okrem toho Ryzen po prvýkrát pre AMD predstavuje podporu technológie SMT (Simultaneous Multi Threading), ktorá umožňuje vykonávanie dvoch výpočtových vlákien na jednom jadre. Zároveň je Ryzen tiež prvým procesorom AMD, ktorý bol vydaný na modernej 14nm procesnej technológii s použitím FinFET tranzistorov, čo prispieva k dobytie vysokých frekvencií s dobrou energetickou účinnosťou. Ďalšou dôležitou zmenou je prechod na modernejšiu platformu, ktorá je zameraná na prácu s dual-channel DDR4 SDRAM.

Rad procesorov Ryzen 7, ktorý AMD dnes uvádza na trh, obsahuje tri osemjadrové procesory v cene od 330 do 500 USD. Všetky sú podobné v základných charakteristikách, ale líšia sa frekvenciami. Podarilo sa nám dostať na testy stredný model v rodine Ryzen 7 1700X za 400 dolárov, ktorý bude konkurovať Core i7-6800K alebo Core i7-7700K. Zostavy založené na nových procesoroch AMD sú dobré v tom, že základné dosky s potrebným konektorom Socket AM4 sú výrazne lacnejšie ako základné dosky pre vlajkové procesory Intel, a preto môže byť konfigurácia založená na Ryzen 7 1700X skutočne veľmi atraktívnou voľbou pre stolný osobný počítač. . Hlavné je, že všetko, čo sa AMD podarilo sľúbiť ohľadom výkonu a iných spotrebiteľských kvalít, sa naozaj napĺňa.

Inými slovami, dnes môžeme byť svedkami najveľkolepejšieho podujatia na trhu procesorov za posledných päť rokov. Skutočná konkurencia sa môže skutočne vrátiť do sféry desktopových procesorov, a to bude celkom schopné posunúť citeľne zastavený pokrok. To najzaujímavejšie preto nebudeme odkladať na neskôr, ale hneď prejdeme k technickým detailom a potom k testom.

Zen mikroarchitektúra v skratke

Aby ste pochopili myšlienky nového dizajnu procesora, musíte vedieť, že pri vývoji mikroarchitektúry Zen dali inžinieri AMD prednosť štyrom hlavným aspektom. Po prvé, výkon. Inžinieri sa snažili nielen dosiahnuť výrazné zlepšenie rýchlosti vykonávania jednovláknovej záťaže, ale snažili sa čo najviac zvýšiť paralelizmus architektúry. Po druhé, priepustnosť. Nové procesory výrazne zlepšili vyrovnávaciu pamäť a algoritmy predbežného načítania a prepracovali sa vykonávacie kanály, aby sa predišlo prekážkam a núteným prestojom. Po tretie, efektívnosť. Ďalšou najvyššou prioritou bola optimalizácia špecifického výkonu na spotrebovaný watt. Zen plne využíva aktívne a nečinné riadenie spotreby AMD a plne využíva 14nm procesnú technológiu FinFET. A po štvrté, škálovateľnosť. Nové procesory Ryzen sa vyznačujú modulárnym dizajnom, pričom hlavným stavebným blokom je štvorjadrový blok CCX (Core Complex). Tieto bloky sú spojené novou vysokorýchlostnou zbernicou Infinity Fabric, vďaka čomu je Zen dizajnom, ktorý je možné implementovať do procesorov rôznej zložitosti a na rôzne účely.

Pozrime sa na všetky tieto funkcie trochu podrobnejšie.

Pokiaľ ide o výkon, mikroarchitektúra Zen robí to, čo spoločnosť nazýva „kvantový skok“ v rýchlosti vykonávania pokynov v porovnaní s predchádzajúcimi návrhmi. V prvom rade je to spôsobené tým, že jadrá Zen už medzi sebou nezdieľajú žiadne zdroje, ako tomu bolo v Bulldozer, sú úplne nezávislé a navyše podporujú technológiu SMT, ktorá umožňuje vykonávať dve vlákna na jednom jadre súčasne (podobne ako Hyper-Threading) . Každé jadro navyše dostalo vlastnú mikrooperačnú vyrovnávaciu pamäť, ktorá výrazne znižuje réžiu pri dekódovaní inštrukcií, kompletne prepracovanú vyrovnávaciu pamäť rýchleho spätného zápisu prvej úrovne s nízkou spotrebou energie, vlastnú jednotku FPU pre každé jadro a vyhradenú L2 cache, ako aj množstvo ďalších optimalizácií.

Vzhľadom na skutočnosť, že veľkosť okna plánovača sa zväčšila o 75 percent, vo všeobecnosti môžu plánovače poslať na vykonanie jeden a pol krát viac pokynov ako to bolo v jadrách bagrov. Zároveň je dekodér rozšírený minimálne jedenapolkrát, vďaka čomu môže Zen poslať svojim výkonným zariadeniam oveľa viac práce. Okrem toho Zen predstavil mikrooperačnú vyrovnávaciu pamäť, ktorá umožňuje procesoru zaobísť sa bez opakovaných prístupov do vyrovnávacej pamäte L2 a L3 a opakovaného dekódovania inštrukcií pri práci s opakujúcimi sa úsekmi kódu. Výrazne sa zmenila schéma predikcie prechodu, teraz využíva hardvérovú neurónovú sieť, čo výrazne zvyšuje percento správne odobratých vetiev. Plné využitie všetkých dostupných zdrojov je navyše podporované podporou SMT, ktorá umožňuje aplikáciám, ktoré podporujú paralelné výpočty, vytvárať dvakrát toľko vlákien.



Produktívny motor vždy potrebuje dostatočný prísun paliva a mikroarchitektúra Zen venuje tomuto aspektu veľkú pozornosť. Nemožno sa preto čudovať, že hierarchia vyrovnávacej pamäte sa v nej trochu zmenila. Vyrovnávacia pamäť inštrukcií L1 narástla na 64 KB a vyrovnávacia pamäť L1 pre dáta bola zapísaná späť. L2 cache sa stala individuálnou pre každé jadro s objemom 512 KB. A vyrovnávacia pamäť L3 dostala objem 8 MB na každé štyri jadrá, pre ktoré je zdieľaná v rámci Core Complex. Obsahuje inteligentné algoritmy predbežného načítania nový systém ukladanie do vyrovnávacej pamäte môže poskytnúť výpočtovým jadrám až päťkrát viac údajov ako v Excavator.



Dôležitú úlohu pri implementácii architektúry Zen zohráva aj 14nm procesná technológia. Pre fyzickú implementáciu procesorov Ryzen si AMD zvolilo variáciu procesnej technológie GlobalFoundries, ktorá je zameraná na dizajny s vysokou hustotou. To umožnilo, aby jadro Ryzen malo relatívne malú plochu, fungovalo pri dosť nízkych napájacích napätiach a v konečnom dôsledku poskytovalo priaznivú závislosť spotreby energie od výkonu. Okrem toho boli v Zene aplikované všetky minulé vývojové trendy spoločnosti zamerané na zvýšenie energetickej účinnosti CPU: dynamické napájanie a vypínanie rôznych uzlov procesora, dynamická zmena frekvencie. Priamo v mikroarchitektúre možno nájsť aj riešenia zamerané na úsporu energie. Čiastočne tomu pomáha vyrovnávacia pamäť micro-op a navyše správca CPU používa špeciálny mechanizmus zásobníka na generovanie opakovane použiteľných adries.

Vďaka optimalizácii tohto druhu má mikroarchitektúra Zen veľmi široký záber, v budúcnosti by sa mala stať základom celej rodiny procesorových produktov AMD: pre notebooky, desktopy aj servery.



Škálovateľnosť Zen čiastočne závisí od skutočnosti, že procesory sú zostavené zo stavebných blokov CCX, ktoré kombinujú 4 jadrá a môžu vykonávať 8 vlákien. Každý CCX má 512 KB vyrovnávacej pamäte L2 na jadro a celkovú vyrovnávaciu pamäť L3 8 MB. Súčasné procesory Ryzen 7, ktoré AMD dnes odhaľuje, sú postavené z dvoch CCX a majú 8 jadier a 16 vlákien. CCX sú vzájomne prepojené špeciálnou zbernicou Infinity Fabric.

Takýto stohovaný dizajn Zen umožní AMD v budúcnosti vydať procesory s rôznym počtom jadier a vlákien, iným množstvom vyrovnávacej pamäte, zamerané na rôzne aplikácie a trhové segmenty.



Významnú úlohu v tom zohráva zbernica Infinity Fabric, ktorá je založená na HyperTransport a umožňuje rýchlo a s minimálnym úsilím zostaviť procesorové čipy rôznych konfigurácií. Vďaka vysokej priepustnosti a prioritizácii prevádzky sa Infinity Fabric na túto úlohu dobre hodí. Zbernica ľahko zvládne prenos dát medzi CCX, systémová pamäť a ďalšie radiče, ktoré sú prezentované v jadre procesora Ryzen. Okrem toho sa parametre jednotlivých CCX spravujú aj cez Infinity Fabric.



Na tej istej zbernici sa zhromažďujú najmä telemetrické informácie o stave jednotlivých jadier, ich teplote a spotrebe a cez ňu sa riadia napätia a frekvencie. V skutočnosti možno Infinity Fabric považovať aj za súčasť vlastnej technológie SenseMI od AMD.


Technológia AMD SenseMI

Dôležitou súčasťou procesorov Ryzen je distribuovaná sieť snímačov prúdu, napätia, spotreby a teploty, ktorá umožňuje presne sledovať stav procesora. Táto telemetria sa zhromažďuje cez zbernicu Infinity Fabric každú milisekundu, čo umožňuje flexibilné ovládanie matrice procesora pri zachovaní jej vysokej odozvy. Technológia SenseMI funguje ako inteligentný doplnok tohto mechanizmu. Po prvé, riadi procesor cez zbernicu Infinity Fabric tak, aby optimalizoval jeho okamžitý výkon a výkonové charakteristiky. Po druhé, obsahuje aj niektoré funkcie predbežného načítania a predikcie vetvenia. Vo všeobecnosti možno technológiu SenseMI vnímať ako rozklad niekoľkých algoritmov na rôzne účely.

Mechanizmus čistá sila je zodpovedný za úsporu energie a umožňuje znížiť frekvenciu a napätie tých procesorových jednotiek (alebo dokonca jadier), ktorých príspevok k konečnej rýchlosti riešenia problému na ničom nezávisí. Inými slovami, vďaka Pure Power sa procesor stáva úspornejším bez straty výkonu.



Mechanizmus Zvýšenie presnosti rieši opačný problém Pure Power. Pomocou telemetrických dát zozbieraných cez zbernicu Infinity Fabric dokáže po malých krokoch po 25 MHz zvyšovať frekvenciu jednotlivých jadier procesora, ak to nepovedie k tomu, že procesor prekročí stanovené limity teploty a spotreby. Inými slovami, Precision Boost je flexibilné prispôsobenie frekvencie procesora aktuálnym podmienkam, podobne ako fungujú moderné grafické karty.



Technológia Rozšírený frekvenčný rozsah (XFR)- Ide o mechanizmus automatického pretaktovania procesora, ktorý priťahuje pozornosť nadšencov v závislosti od parametrov chladiaceho systému. XFR je implementované len v procesoroch, ktoré majú v názve koncovku X. V nich dokáže pri splnení množstva podmienok dodatočne zvýšiť taktovaciu frekvenciu nad limity stanovené v rámci Precision Boost. Vo väčšine prípadov sa XFR aktivuje, ak sú teploty jadier procesora ďaleko od limitných hodnôt, avšak okrem absolútnych hodnôt teplôt sa XFR zameriava aj na ich deriváty.



Predikcia neurónovej siete je ďalším aspektom technológie SenseMI. Znamená to, že architektúra Zen má skutočnú učiacu sa neurónovú sieť v reálnom čase, ktorá sa zaoberá predpovedaním toho, ako sa bude aplikácia správať v blízkej budúcnosti. Takáto predpoveď má zmysel, aby sa proaktívne pripravili pokyny na vykonanie a údaje pre ne potrebné.



A poslednou časťou SmartMI je mechanizmus Smart Prefetch. Predbežne načítava požadované údaje do vyrovnávacej pamäte L1 a L2 procesora na základe informácií o tom, ako aplikácia do tohto bodu pracovala. Tým sa eliminujú možné výpadky procesora, ku ktorým môže dôjsť v dôsledku predčasného načítania dát.



Stručne povedané, nie je pochýb o tom, že mikroarchitektúra Zen predstavuje obrovský krok vpred od buldozéra. A nejde len o to, že nové procesory využívajú modernú procesnú technológiu a tradičný x86 dizajn s plnohodnotnými širokými jadrami bez zdieľaných blokov a podporou multi-threadingu (SMT). Pribudlo aj množstvo ďalších vylepšení, vďaka ktorým sa počet inštrukcií vykonaných jedným jadrom za takt zvýšil viac ako jedenapolnásobne. Podporuje to vylepšená predikcia vetvenia, objavenie sa vyrovnávacej pamäte mikrooperácií, schopnosť odosielať až šesť mikrooperácií za hodinu (oproti štyrom), 60 % nárast vyrovnávacej pamäte plánovača, dvojnásobné zvýšenie rýchlosti dokončenie a rezignácia mikrooperácií, jedenapolnásobné zvýšenie hĺbky frontov na nakladanie a vykladanie, možnosť vykonávať až štyri operácie s pohyblivou rádovou čiarkou za cyklus (oproti trom), viacnásobné zvýšenie priepustnosti všetky vyrovnávacie pamäte a zväčšenie veľkosti vyrovnávacej pamäte L1, vylepšenia na úrovni predbežného načítania údajov a množstvo ďalších vecí.

Testovací procesor: AMD Ryzen 7 1700X

Dnes, 2. marca 2017, AMD uvádza na trh prvú várku svojich prelomových procesorov Ryzen. A toto je skutočne historická udalosť: na trhu procesorov už veľmi dlho neboli žiadne produkty, ktorým by bola zverená taká záťaž očakávaní. Nie je to vtip – AMD sa chystá konkurovať starším procesorom Intel o výkonné desktopy, no zároveň zníži cenovú latku takmer o polovicu.

Počas prvej fázy uvedenia Ryzenu na trh sa AMD chystá vsadiť na svoje osemjadrové procesory, klasifikované ako rodina Ryzen 7. Ide o najdrahšie desktopové nosiče novej mikroarchitektúry Zen s cenami od 330 do 500 USD. Ale napriek tomu relatívne vysoká cena Spoločnosť očakáva takmer prudký dopyt po novom produkte a vážne sa naň pripravila. Produkty Ryzen 7 sú už skladom v popredných predajniach a AMD celkovo predvyrobilo asi milión procesorov.

Pri umiestňovaní nových produktov sa AMD drží trochu iných princípov ako Intel. Spoločnosť jednoznačne stavia na väčšom masovom charaktere. Zároveň vidí Ryzen 7 1800X ako dvakrát lacnejšiu alternatívu pre Core i7-6900K. Ryzen 7 1700X nie je proti osemjadru, ale proti šesťjadru s podobnou cenou jadro procesora i7-6800K. Ryzen 7 1700 je tiež ohlásený ako priamy konkurent pre štvorjadrový Core i7-7700K. Inými slovami, stará taktika AMD, ktorá sa snažila vyrovnať ponuky Intelu s lepším počtom jadier za nižšiu cenu, sa odráža aj v novej zostave. Jadrá AMD sú však teraz oveľa výkonnejšie ako predtým a rodina Ryzen 7 vyzerá naozaj veľmi silne.

Aby sme sa zoznámili s novým radom procesorov, dostali sme od AMD stredný model, Ryzen 7 1700X, ktorý je zaujímavý, pretože ho možno použiť na zostavenie konfigurácií s nie príliš vysokými nákladmi - od 80 do 100 tisíc rubľov.



Nezabúdajte, že procesory Ryzen sú osadené v špeciálnej novej pätici Socket AM4, ktorá sa teraz stáva základom pre celý rad desktopových procesorov AMD. A to znamená, že staré základné dosky nie sú vhodné - potrebujeme nové založené na čipsetoch AMD X370, B350 atď.

Takto určuje Ryzen 7 1700X diagnostická utilita CPU-Z.



Pred nami je nový 8-jadrový procesor AMD s kódovým označením Summit Ridge and Zen microarchitecture, ktorý vyniká podporou SMT a schopnosťou spúšťať 16 vlákien súčasne, 512 KB L2 cache na jadro a L3 cache v dvoch častiach po 8 MB.

Nominálna frekvencia Ryzen 7 1700X je nastavená na 3,4 GHz, no vo väčšine prípadov môžete prácu tohto procesora pozorovať na frekvencii 3,5 GHz – prácu technológie Precision Boost ovplyvňuje. Zároveň sa pri nízkoprietokovej záťaži môže frekvencia zvýšiť na 3,8 GHz a ak budete mať šťastie, tak až na 3,9 GHz kvôli XFR.

Napájacie napätie nášho Ryzen 7 1700X pri záťaži kolísalo medzi 1,25-1,275 V. AMD hovorí, že štandardné napätie pre rôzne Ryzeny 7 je možné nastaviť vo veľmi širokom rozsahu a zvyčajne sa pohybuje od 1,2 do 1,3625 V. To znamená, že v porovnaní so 14nm Procesory Intel, uvidíme viac vysoké napätia. Preto teplotný režim Ryzen 7 1700X v nominálnej hodnote nespôsobuje veľké obavy. Pri záťaži sme pozorovali zahrievanie až na 76-78 stupňov podľa tepelného senzora zabudovaného v jadre. V pokoji sú teploty okolo 45 stupňov.

Platforma Socket AM4 a nové čipsety

Ako už bolo spomenuté, procesory rodiny Ryzen sú zamerané na využitie zásadne novej platformy a nového konektora Socket AM4. Dôvodom je predovšetkým skutočnosť, že AMD potrebovalo zaviesť podporu pre pamäte DDR4, ktoré si teraz vydobyli miesto priemyselného štandardu. A zároveň, s využitím momentu, bolo rozhodnuté prekresliť celú platformu tak, aby procesory vyzerali ako SoC. Inými slovami, na integrovaný severný mostík procesora bola prenesená ďalšia sada radičov, čo z čipsetov novej generácie urobilo extrémne jednoduché zariadenia.



Vo výsledku tak neprekvapí, že nová pätica procesora AM4 dostala zvýšený počet pinov – teraz ich je 1331. To znamená, že Ryzen nie je kompatibilný so žiadnymi starými základnými doskami. AMD navyše zmenilo požiadavky na umiestnenie montážnych otvorov pre chladiace systémy na základných doskách, a preto Ryzen vyžaduje nové chladiče, alebo aspoň nové úchyty pre staré. Preto aj napriek tomu, že Ryzen sú na prvý pohľad podobné svojim predchodcom, majú podobné rozmery a vonkajší dizajn, celý ekosystém pre nich musí byť úplne aktualizovaný.

V procesoroch Bulldozer bol v čipe procesora implementovaný pamäťový radič. V APU poslednej generácie sa na hlavný čip presunul aj ovládač pre grafiku. PCI zbernica expresné. V Ryzene pribudli do procesora ďalšie PCI Express pruhy, USB a SATA porty. V skutočnosti spoločnosť AMD teraz vytvorila situáciu, keď procesor môže pracovať bez akýchkoľvek ďalších čipových súprav, čo umožňuje vytvárať mimoriadne jednoduché a kompaktné základné dosky.

Začať však stojí za to, že integrovaný pamäťový radič v procesoroch Ryzen je úplne nový. Je navrhnutý pre prácu s dvojkanálovou pamäťou DDR4 SDRAM a podporuje iba takúto pamäť. Neexistuje žiadna spätná kompatibilita s DDR3 SDRAM. Oficiálne pamäťový radič Ryzen podporuje moduly DDR4 až do 2666 MHz, pre ktoré môžu byť na základných doskách Socket AM4 k dispozícii dva alebo štyri sloty. Použiť sa dajú aj pamäte s frekvenciou vyššou ako DDR4-2666 s Ryzenom, no autori procesora v tomto prípade nedávajú žiadne záruky.

Používanie vysokorýchlostných pamäťových modulov v Socket AM4 však môže spôsobiť problémy. Maximálna frekvencia DDR4, ktoré je možné získať v Ryzen bez zmeny základnej frekvencie BCLK, je len 3200 MHz. Prevádzka pamäte DDR4-2933 alebo DDR4-3200 je navyše možná len pri použití dvojice modulov. Inými slovami, pokiaľ ide o frekvenčné možnosti pamäťového radiča, Ryzen je oveľa horší ako súčasné procesory Intel pre platformu LGA 1151, ktoré voľne dobývajú režimy DDR4-4000 a vyššie. Zatiaľ však existuje určitá nádej, že situáciu možno napraviť prostredníctvom nových verzií systému BIOS pre základné dosky.

Okrem vstavaného pamäťového radiča s podporou dvojkanálovej DDR4 SDRAM ponúka Ryzen:

16 liniek PCI Express 3.0 pre grafickú kartu (v prípade potreby ich možno rozdeliť do dvoch slotov podľa vzorca 8x + 8x);
4 pruhy PCI Express 3.0 na pripojenie k čipovej súprave alebo pre iné zariadenia;
4 porty USB 3.0;
4 pruhy PCI Express 3.0 pre úložisko NVMe (možno prekonfigurovať na 2 pruhy PCI Express 3.0 pre úložisko NVMe a dva porty SATA).

Len z procesora Ryzen sa tak získa kompletný systém na čipe.

Pre typické stolné systémy však budú možnosti rozšírenia dostupné v procesore pravdepodobne nedostatočné. Preto je možné k procesoru pripojiť jednu zo sád logiky - X370, B350 alebo A320, ktorá pridá niektoré ďalšie veci do zadaného zoznamu, cez linky PCI Express vyčlenené na tento účel. A ak to nie je potrebné, potom je možné Ryzen vybaviť špeciálnymi zjednodušenými čipsetmi Mini-ITX X300 alebo A300, ktoré síce nespotrebúvajú procesorové rady PCI Express 3.0, ale do zoznamu funkcií nepridávajú takmer nič.

Prevažnú časť vlastností platformy Socket AM4 určuje procesor Ryzen. Čipové sady v novej platforme zohrávajú čisto vedľajšiu úlohu a v skutočnosti od nich z hľadiska funkčnosti platformy len málo závisí.

Ani starší čipset X370, ktorý bude pravdepodobne použitý vo väčšine základných dosiek nadšencov, toho veľa neprináša: ďalšie dva porty USB 3.1, šesť portov USB 3.0 a USB 2.0, osem portov SATA, z ktorých štyri možno premeniť na dva SATA Express rozhrania a osem ďalších pomalých PCI Express 2.0 pruhov. Navyše v platforme Socket AM4 použitie jedného alebo druhého čipsetu buď umožňuje alebo zakazuje pretaktovanie, rozdelenie grafických liniek PCI Express 3.0 x16 a režimy RAID pre porty SATA. Napríklad v rovnakom X370 ako v staršom čipsete je povolené pretaktovanie, konfigurácie SLI alebo CrossfireX a polia RAID úrovní 0, 1 a 10.



Spolu s X370 môže pokročilých používateľov zaujať aj jednoduchšia logická sada B350. Stále umožňoval pretaktovanie procesora a RAID polia a hlavný rozdiel oproti staršej verzii sa týka nemožnosti rozdeliť grafickú zbernicu procesora na dva sloty. Okrem toho pod nôž padla časť portov USB 3.0 a SATA, ktorých sú v čipsete dva, respektíve šesť, plus počet liniek PCI Express 2.0 sa zredukoval na šesť.



Ďalšou zaujímavou alternatívou je čipset X300, ktorý je špeciálne navrhnutý pre jednoduché kompaktné systémy. Na schopnostiach procesora nepridáva absolútne nič, no umožňuje rozdelenie grafickej zbernice PCI Express 3.0 x16 na dva sloty a umožňuje pretaktovanie procesora.

Podrobné informácie o tom, aké funkcie ponúkajú v kombinácii s Ryzenom niektoré čipsety, sme zhrnuli v nasledujúcej tabuľke.



Hoci čipsety nesú označenie AMD, pri ich vývoji zohrala primárnu rolu ASMedia, známa rôznymi radičmi. Práve vďaka nej mohla AMD ako prvá priniesť na trh čipsety s podporou portov USB 3.1 so šírkou pásma 10 Gb/s. Avšak vrodená podpora Konektory typu C zatiaľ čo čipsety AMD nie. Aby sa na doske objavil pohodlný symetrický USB konektor, výrobcovia základných dosiek budú musieť nájsť ďalší ovládač čipu.

Vďaka podpore USB 3.1 vyzerajú čipsety pre platformu Socket AM4 moderne, no o ich schopnostiach si netreba príliš klamať. Zatiaľ čo logické sady Intel radu 200 dokážu poskytnúť až 30 vysokorýchlostných portov (PCIe 3.0, SATA a USB 3.0), aj staršie AMD X370 má takýchto portov o polovicu menej. Čiastočne to kompenzujú možnosti severného mosta zabudovaného v procesore, no napriek tomu platforma Intel umožňuje vytvárať flexibilnejšie konfigurácie s viacerými možnosťami pripojenia ďalších zariadení.

Na testovanie sme dostali mamičku doska ASUS Hrdina Crosshair IV.


Toto základná doska vychádza zo staršieho čipsetu AMD X370 a jeho potenciál využíva na maximum. Doska podporuje rozdelenie grafickej zbernice PCI Express 3.0 na dva sloty a konfigurácie založené na technológiách SLI a CrossfireX. Oba grafické sloty na tejto doske sú vystužené kovovými rámami SafeSlot a sú široko rozmiestnené, aby sa do nich zmestili masívne a výkonné GPU.

Doska podporuje pretaktovanie a jej nastavenia pretaktovania sú robené tak, aby chod procesora na vyšších frekvenciách nerobil problémy. Na chladenie komponentov systému slúži technológia Fan Xpert, ktorá umožňuje ovládať všetkých päť ventilátorov, ktoré sú pripojené k doske. Rovnako ako v prípade najnovších dosiek ROG pre LGA 1151 má ASUS Crosshair IV Hero vyhradené hlavičky pre čerpadlo na chladenie kvapaliny, ako aj snímače teploty a prietoku chladiacej kvapaliny. Nechýba ani špeciálny konektor pre vysokovýkonné ventilátory.



Dôležitou vlastnosťou systémov založených na Ryzen je, že M.2 slot pre NVMe disky sa pripája priamo k PCI Express 3.0 procesorovým linkám. Presne toto sa robí na Crosshair IV Hero. Neexistujú žiadne obmedzenia rýchlosti - M.2 má štyri požadované pruhy PCIe. Zároveň je samotný slot M.2 presunutý preč od procesora a grafických kariet - tam, kde bude pre neho jednoduchšie organizovať dostatočné chladenie.

Doska je vybavená dnes módnym RGB podsvietením, ktoré sa ovláda cez aplikáciu ASUS Aura RGB. K Crosshair IV Hero je možné pripojiť aj ďalšie LED pásiky.

Integrovaná zvuková karta je založená na exkluzívnom kodeku S1220 najnovšej generácie, ktorý poskytuje odstup signálu od šumu 113 dB. Tento kodek funguje v spojení s prémiovým ESS Sabre DAC, čo vám celkovo umožňuje získať kvalitu zvuku porovnateľnú s kvalitou lacného diskrétneho zvukové karty. Zvukovú cestu navyše sprevádza program Sonic Studio III, ktorý uľahčuje ovládanie audio streamov. Dá sa napríklad použiť na odosielanie zvukov z hry do slúchadiel, hudby do reproduktorov a zvuku z videa do televízora.



Tak teda stručne špecifikácie ASUS Crosshair IV Hero vyzerá takto:



Gigabitovú sieť na doske predstavuje bežný radič Intel, ktorý je vybavený programom GameFirst na uprednostňovanie sieťovej prevádzky. Okrem toho má doska dodatočný slot M.2, do ktorého sa zmestí WiFi ovládač.



Zadný panel dosky je husto vyplnený portami, plus hardvérové ​​tlačidlá Clear CMOS a BIOS flashback. Hlavná oblasť je však obsadená mnohými portami USB, medzi ktorými je 10 Gb / s USB vstup 3.1 vo variantoch typu A a typu C. Mimochodom, doska poskytuje aj výstup pre port USB 3.1, ktorý sa nachádza na prednom paneli skrinky.

Odporúčaná cena ASUS Crosshair IV Hero je 255 dolárov.

Ako sme testovali

Testovanie procesora AMD Ryzen 7 1700X prebehlo v plnom súlade s predpismi výrobcu: vlajkový produkt AMD bol proti celému súčasnému radu procesorov Core i7. Okrem toho sme do testov nezabudli zaradiť aj starší procesor rady AMD FX.

v konečnom dôsledku úplný zoznam komponenty zapojené do testovacích systémov dostali túto formu:

Procesory:

AMD Ryzen 7 1700X (Summit Ridge, 8 jadier + SMT, 3,4-3,8 GHz, 16 MB L3);
AMD FX-9590 (Vishera, 8 jadier, 4,7-5,0 GHz, 8 MB L3);
Intel Core i7-7700K (Kaby Lake, 4 jadrá + HT, 4,2-4,5 GHz, 8 MB L3);
Intel Core i5-7600K (Kaby Lake, 4 jadrá, 3,8-4,2 GHz, 8 MB L3);
Intel Core i7-6900K (Broadwell-E, 8 jadier + HT, 3,2-4,0 GHz, 20 MB L3);
Intel Core i7-6800K (Broadwell-E, 6 jadier + HT, 3,4-3,8 GHz, 15 MB L3).

Chladič CPU: Noctua NH-U14S.
Základné dosky:

ASUS Crosshair IV Hero (Socket AM4, AMD X370);
ASUS 970 PRO Gaming/Aura (Socket AM3+, AMD 970 + SB950);
ASUS Maximus IX Hero (LGA1151, Intel Z270);
ASUS X99-Deluxe (LGA2011-v3, Intel X99).

Pamäť:

2 x 8 GB DDR4-3000 SDRAM, 15-17-17-35 (Corsair Vengeance LPX CMK16GX4M2A3000C15).
4 × 4 GB DDR4-3000 SDRAM, 15-17-17-35 (G.Skill F4-3000C15Q-16GRR).
2 × 8 GB DDR3-2133 SDRAM, 9-11-11-31 (G.Skill F3-2133C9D-16GTX).

Grafická karta: NVIDIA GeForce GTX 1080 (8 GB/256-bit GDDR5X, 1607-1733/10000 MHz).
Diskový subsystém: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Napájanie: Corsair RM850i ​​​​(80 Plus Gold, 850 W).

Testovanie sa uskutočnilo v operačný systém Microsoft Windows 10 Enterprise Build 14393 s použitím nasledujúcej sady ovládačov:

Ovládač čipovej sady AMD Crimson ReLive Edition 17.2.1;
Ovládač čipovej sady Intel 10.1.1.38;
Intel riadiaci motor Ovládač rozhrania 11.6.0.1030;
Intel Turbo zrýchlenie Max Technology 3.0 1.0.0.1029;
NVIDIA GeForce Ovládač 378,66.

Výkon

Integrovaný výkon

Na vyhodnotenie výkonu procesorov pri bežných úlohách sme použili testovací balík BAPCo SYSmark 2014 SE, ktorý simuluje prácu užívateľa v reálnych bežných moderných kancelárske programy a aplikácie na vytváranie a spracovanie digitálneho obsahu. Najnovšie verzie tohto benchmarku fungujú na štyroch scenároch: Office Productivity ( kancelárska práca: príprava textov, spracovanie tabuliek, práca s email a navštevovanie internetových stránok), Tvorba médií (práca na multimediálnom obsahu – tvorba reklamy pomocou vopred nasnímaných digitálnych obrázkov a videí), Dátová/Finančná analýza (spracovanie archívu s finančnými údajmi, ich Štatistická analýza a prognózovanie investícií na základe určitého modelu) a Responzivita (analýza odozvy systému pri spúšťaní aplikácií, otváranie súborov, práca s internetovým prehliadačom s veľkým počtom otvorených kariet, multitasking, kopírovanie súborov, dávkové operácie s fotografiami, šifrovanie a archivácia súborov a inštalácia programov).















AMD oponuje Ryzen 7 1700X voči šesťjadrovému procesoru Core i7-6800K, ale ako vidíme, podľa integrovaného indikátora v SYSmark 2014 SE je nový produkt AMD stále podradený, čo dokazuje úroveň výkonu Core i5. . Problémom je, že väčšina bežných aplikácií zostáva jednovláknová a pri takejto záťaži je Ryzen stále slabší ako architektúry Intelu, aj keď nie o veľa. Živú ilustráciu toho možno vidieť vo výsledkoch spustenia skriptu Office Productivity. V zložitom viacvláknovom zaťažení, najmä počítacieho charakteru, je výkon Ryzen 7 1700X v poriadku. Takže v subteste Data / Financial Analysis nový Ryzen 7 1700X nielenže prekonáva šesťjadrový Core i7-6800K, ale ukazuje sa aj silnejší ako osemjadrový Intel Core i7-6900K.

Na vyhodnotenie komplexného výkonu v hernom 3D sme použili test Futuremark 3DMark Professional Edition 2.2.3509, v ktorom sme použili scénu Time Spy 1.0.






Tento benchmark je dobre optimalizovaný pre multi-threading, takže Ryzen 7 1700X v ňom ukazuje veľmi dobrú rýchlosť. Mikroarchitektúra Zen umožnila AMD vyrobiť plnohodnotný osemjadrový procesor a jeho výkon má bližšie k Core i7-6900K ako k jeho priamemu konkurentovi Core i7-6800K.

Aplikačné testy

Úlohou, ktorá najcitlivejšie reaguje na zvyšujúci sa paralelizmus procesorov, je už tradične finálne vykreslenie v 3D návrhových a simulačných balíkoch. Rýchlosť vykresľovania sme testovali v dvoch obľúbených aplikáciách: Autodesk 3ds max 2017, kde sme merali čas potrebný na vykreslenie v rozlíšení 1920 × 1080 pomocou vykresľovania mental ray štandardnej scény Hummer; a v Blenderi 2.78a, kde sa skontrolovalo trvanie zostavovania finálneho modelu z Blender Cycles Benchmark rev4.






Ryzen 7 1700X plní svoje sľuby a poskytuje vykresľovací výkon, ktorý bol predtým možný len s osemjadrovými procesormi Intel. Treba však pripomenúť, že Ryzen 7 1700X stojí asi dva a pol krát lacnejšie ako Core i7-6900K.

Ďalšou testovacou úlohou je spracovanie obrazu. Používa sa tu Adobe Lightroom 6.8 a Adobe Photoshop CC 2017. V prvom prípade sa testuje výkon pri dávkovom spracovaní série snímok vo formáte RAW. Testovací scenár zahŕňa následné spracovanie a export do JPEG v rozlíšení 1920 × 1080 a maximálnej kvalite dvoch stoviek 12-megapixelových RAW snímok zhotovených digitálnym fotoaparátom Nikon D300. V druhom - výkon pri spracovaní jednotlivých grafických obrázkov. Na tento účel sa meria priemerný čas vykonania testovacieho skriptu, ktorý je kreatívne prepracovaným rýchlostným testom Retouch Artists Photoshop Speed ​​​​Test, ktorý zahŕňa typické spracovanie štyroch 24-megapixelových obrázkov nasnímaných digitálnym fotoaparátom.






Aplikácie Adobe pre fotografov – s funkciami. Vo Photoshope sa veľa filtrov a operácií stále vykonáva v režime s jedným vláknom. Lightroom začal aktívne využívať inštrukcie AVX2. Oboje je zlé pre mikroarchitektúru Zen, takže v oboch testovacích úlohách procesor Ryzen 7 1700X stráca aj na štvorjadrový Core i5, nehovoriac o procesoroch Intel vyššej triedy.

Spracovanie videa, podobne ako vykresľovanie, sa však považuje za úlohu, ktorej výkon sa dobre mení so zvyšujúcim sa paralelizmom procesora. Tu sme na testovanie použili štyri úlohy. Adobe po účinkoch CC 2017 - test rýchlosti vykresľovania ray tracingu. Meria sa čas, ktorý systém potrebuje na vykreslenie v rozlíšení 1920 ×. [e-mail chránený] vopred pripravené video. Adobe Premiere Pro CC 2017 – testovanie výkonu pre nelineárne úpravy videa. Meria čas vykresľovania na H.264 Blu-ray pre projekt obsahujúci záznam HDV 1080p25 s rôznymi použitými efektmi. x264 r2744 - testovanie rýchlosti prekódovania videa do formátu H.264/AVC. Ak chcete zhodnotiť výkon, originál [e-mail chránený] Video súbor AVC s bitovou rýchlosťou približne 30 Mb/s. A x265 2.2+17 8bpp - testovanie rýchlosti prekódovania videa do sľubného formátu H.265/HEVC. Na vyhodnotenie výkonu sa používa rovnaký video súbor ako pri teste rýchlosti transkódovania kódovača x264.












Pri práci s videom, ako aj vo finálnom vykreslení je na tom Ryzen 7 1700X veľmi dobre. Skutočne môže konkurovať Core i7-6900K za 1 000 USD, vďaka čomu je nový produkt AMD hračkou. perfektná voľba pre používateľov, ktorí vytvárajú multimediálny obsah.

Na meranie rýchlosti procesorov pri kompresii informácií sme zvolili dva archivátory: 7-zip 16.04 a WinRAR 5.40. V oboch prípadoch bol čas potrebný na kompresiu adresárov s rôznymi súbormi s celkovým objemom 1,7 GB meraný s maximálnym stupňom kompresie.






Pre rýchla práca Pre archivátory je dôležitá dobrá priepustnosť a nízka latencia pamäťového subsystému. Pamäťový radič procesorov Ryzen dopadol mimoriadne neúspešne a tak sa v týchto testoch dá Ryzen 7 1700X porovnávať len so štvorjadrami Intelu.

Výkon prehliadača Microsoft Edge bol testovaný v špecializovanom teste WebXPRT 2015, ktorý implementuje algoritmy, ktoré sa skutočne používajú v internetových aplikáciách v HTML5 a JavaScripte.



Úloha je jednovláknová, ale Ryzen 7 1700X sa drží dobre, na druhom mieste za procesormi Intel založenými na mikroarchitektúre Kaby Lake.

Na záver sme testovali rýchlosť kryptografických algoritmov v utilite VeraCrypt 1.19. Tu bol použitý benchmark zabudovaný v programe, ktorý využíva trojité šifrovanie Serpent-Twofish-AES.



Úloha je jednovláknová a implementácia inštrukčnej sady AES spoločnosťou Zen je veľmi efektívna. Výsledok na seba nenechá dlho čakať: Ryzen 7 1700X je na prvom mieste.

Herný výkon

Donedávna bol výkon platforiem vybavených modernými procesormi v drvivej väčšine súčasných hier určovaný možnosťami grafického subsystému. Odohráva sa však na viacerých v posledných rokoch rastúca produktivita herné grafické karty viedlo k tomu, že teraz je výkon často obmedzený ani nie tak grafickou kartou, ako skôr centrálna procesorová jednotka. A ak sme predtým, aby sme pochopili herný potenciál konkrétneho procesora, museli použiť znížené rozlíšenia, potom s modernými grafickými kartami to nie je vôbec potrebné.

Na dokončenie nášho testovacieho systému procesorov nám NVIDIA poskytla svoj najnovší akcelerátor GeForce GTX 1080, ktorý sa vďaka svojmu nevídane vysokému výkonu dobre hodí pre 4K rozlíšenia a virtuálnu realitu a ešte viac pre FullHD. Vďaka tomu sme mohli upustiť od herných testov v rozlíšení 1280 × 800, ktoré sa u našich čitateľov často nestretli s pochopením. Teraz je možné dokonale vysledovať závislosť snímkovej frekvencie od výkonu CPU v absolútne reálnych a nie umelo vytvorených podmienkach: vo FullHD rozlíšení 1920 × 1080 a s maximálnym nastavením kvality obrazu. Tento prístup sme prijali.






























Hry nedávajú veľa dôvodov na optimizmus, pokiaľ ide o Ryzen. Nie, samozrejme, nejde o procesory radu FX, ktorých herný výkon sa už stal dôvodom na posmech. Ryzen 7 1700X poskytuje v súčasnej fáze viac ako prijateľnú úroveň herného výkonu a určite bez pochybností vytiahne grafické karty triedy GeForce GTX 1080. Ak sa ale pozriete na ukazovatele relatívneho výkonu, ukáže sa, že akékoľvek súčasné procesory Intel Core i7 a dokonca aj Core i5 majú vyšší herný potenciál – pri vysokej grafickej kvalite je to vidieť aj v najbežnejšom rozlíšení FullHD. Dôvody tohto stavu sú dobre známe: pomalý pamäťový radič Ryzen a slabšia časť FPU ako procesory Intel.

Treba však ešte raz zdôrazniť, že momentálne výkon Ryzen 7 1700X dokonale postačuje na poskytovanie vysokých snímkových frekvencií v hrách. A preto by sa nemal považovať za nedostatočne produktívny herný CPU. Nový produkt AMD má navyše osem plnohodnotných jadier, čo môže byť dobrou pomôckou v nových herných projektoch, ktoré síce nesmelo, ale stále smerujú k plnému využívaniu multithreadingu a prechodu na DirectX 12.

Spotreba energie

Situácia v spotrebe energie je ďalšou zaujímavou časťou dnešného testovania. AMD posunulo svoje procesory na moderný 14nm proces a optimalizovalo architektúru s jasným zameraním na energetickú efektívnosť. Výsledkom je, že spoločnosť teraz hovorí, že osemjadrové Ryzeny sa zmestia do 95-wattového TDP. To znamená, že by mali byť výrazne úspornejšie ako procesory Intel LGA 2011-3 s typickým odvodom tepla 140 wattov. Má situáciu s reálna spotreba energie miesto, kde môže Ryzen 7 1700X vyhrať jasné víťazstvo nad konkurenciou? Skontrolujme to.

Používané nami v testovací systém Nový digitálny blok Power Corsair RM850i ​​vám umožňuje kontrolovať spotrebovaný a výstupný elektrický výkon, ktorý používame na meranie. Nižšie uvedený graf zobrazuje celkovú spotrebu systémov (bez monitora), meranú "po" napájaní, čo je súčet spotreby všetkých komponentov zapojených do systému. Účinnosť samotného napájania sa v tomto prípade neberie do úvahy.



Na voľnobeh vyzerá platforma Socket AM4 naozaj veľmi hospodárne. A to nie je prekvapujúce, Ryzen využíva pokročilé technológie na úsporu energie a sprievodné čipsety sa nelíšia v špeciálnych energetických apetítoch.



No pri vykresľovaní v Blenderi vyzerá situácia so spotrebou trochu inak, ako sa očakávalo. Pri záťaži vyžaduje systém s Ryzen 7 1700X približne rovnaké množstvo energie ako platforma založená na Core i7-6900K. A to vyvoláva pochybnosti, či sa Ryzen 7 naozaj zmestí do 95-wattového TDP.

A takto vyzerá situácia so spotrebou na maximum možné zaťaženie: v utilite Prime 28.10, ktorá aktívne využíva extrémne energeticky náročné inštrukcie FMA a AVX2.



Čo sa týka spotreby, Ryzen 7 1700X stále dokáže trochu zaostávať za Core i7-6900K. Tu samozrejme nejde o rozdiel 30 percent, ktorý je uvedený v špecifikáciách, ale o rozdiel na úrovni len niekoľkých wattov. Teoreticky sa mal Ryzen 7 1700X priblížiť Core i7-7700K, ktorého TDP je nastavené na 91W, no v praxi je ponuka AMD citeľne žravejšia.

Pretaktovanie

Ryzen stíha, žiaľ, zle. Je zrejmé, že nominálne frekvencie týchto procesorov sú už z výroby zdvihnuté na limit. Preto nie je potrebné počítať s tým, že produktivita sa dá jednoduchými manipuláciami ešte zvýšiť.
Stabilné maximum, ktoré sa nám s našou inštanciou Ryzen 7 1700X podarilo dosiahnuť, bolo len 3,85 GHz, čiže nad turbo režim sa nám podarilo ísť len o málo. Procesor nezobral vyššiu frekvenciu.



A už vtedy, aby systém v Prime 95 28.10 obstál v teste stability, bolo treba napätie procesora zdvihnúť viac než vážne – až na 1,5 V. Skutočnosť, že dlhodobá prevádzka 14-nm čipu pri toto napätie nepovedie k degradácii polovodičového kryštálu, existujú opodstatnené pochybnosti.

Navyše teplotný režim s takým zdanlivo nevýznamným zrýchlením sa ukázal ako nie príliš priaznivý. Napriek tomu, že Ryzen má pod vekom spájku, nie pastu, tepelný senzor zabudovaný v čipe procesora zaznamenal zahriatie až na 99 stupňov.

závery

Všetci sme v to skutočne dúfali a stalo sa to: AMD áno. Nové procesory Ryzen sa od Bulldozer zásadne líšia. Mikroarchitektúra v nich bola úplne aktualizovaná a teraz je Ryzen 7 produktom na vysokej úrovni. Ako sme sľúbili, výkon s jedným vláknom v novom produkte vzrástol približne jedenapolkrát a spotreba energie sa znížila približne rovnako. V dôsledku toho sa AMD ukázalo ako vysoko výkonný osemjadrový procesor, ktorý možno skutočne postaviť na rovnakú úroveň s návrhmi Intelu pre platformu LGA 2011-3. Okrem toho sa zdá, že AMD má vzhľadom na svoj návrat na trh veľmi ambiciózne plány, pretože sa snaží prelomiť zavedené ceny a začať ponúkať vysokokvalitné osemjadrá za bezprecedentnú cenu. nízke ceny.

Výsledkom je, že nová platforma AMD by mohla byť veľmi atraktívnym riešením pre tých používateľov, ktorí vyžadujú vysoký viacvláknový výkon. Ako ukázali naše rozsiahle testy, najlepšie skóre Ryzen 7 sa ukazuje pri práci s digitálnym obsahom – pri renderingu a pri spracovaní videa. A to znamená, že profesionáli a fanúšikovia, ktorí si vyberajú konfigurácie na prácu, nie na zábavu, by mali vážne zvážiť výber procesorov Ryzen 7. Toto odporúčanie však neplatí pre fotografov: s grafickými editormi sa nová mikroarchitektúra AMD ukazuje bez ohľadu na to.

Pokiaľ ide o masívnejšie aplikácie počítačov - hier, potom pre nich Ryzen zďaleka nie je najlepšia voľba. V dizajne nových procesorov AMD sú dve slabiny: pamäťový radič a relatívne slabé FPU. Aj to a ďalšie v herných úlohách má veľmi veľký význam. Preto v nich osemjadrové procesory AMD vydávajú iba výkon úrovne Core i5. Samozrejme, v žiadnom prípade to nie je veta, pretože taká rýchlosť vo všeobecnosti pre moderné grafických kariet celkom dosť.

A napriek tomu na základe výsledkov recenzie môžeme povedať, že Ryzen 7 je pre AMD jasným úspechom. Firma sa vracia do vyšších cenových segmentov a viac zatiaľ netreba. Dúfajme, že teraz sa inžinierom spoločnosti podarí dodržať harmonogram, ktorý si sami stanovili a každý rok vydajú vylepšené verzie Zen, v ktorých budú postupne napravené všetky úzke miesta tejto mikroarchitektúry.

AMD na vlastnej strane tento týždeň pozvalo vybraných členov tlače a analytikov, aby prišli a diskutovali o ďalšej úrovni dátového zenu. V tejto časti diskutujeme o oznámeniach o mikroarchitektúre, ktoré boli urobené, a tiež vidíme, ako sa porovnáva s predchádzajúcimi generáciami základných návrhov AMD.

AMD Zen

Predikcia, dekódovanie, radenie a vykonávanie

Najprv sa ponorme priamo do vývojového diagramu, ako je znázornené:

Ak sa na začiatku zameriame iba na ľavú stranu, môžeme vidieť väčšinu detailov mikroarchitektúry na vysokej úrovni, vrátane základných vyrovnávacích pamätí, nového začlenenia op-cache, niektorých podrobností o dekodéroch a dispečeroch, plánovačoch, vykonávacích portoch a načítavaní. /uskladacie opatrenia. Niekoľko snímok ďalej v prezentácii hovorí o priepustnosti vyrovnávacej pamäte.

Po prvé, jedným z veľkých odklonov od predchádzajúcich návrhov mikroarchitektúry AMD je prítomnosť mikrooperačnej vyrovnávacej pamäte (možno stojí za zmienku, že tieto snímky niekedy hovoria o tom, kedy to znamená mikro-op, čo vytvára trochu zmätku). Konštrukcia Bulldozer AMD nemala operačnú vyrovnávaciu pamäť, čo si vyžadovalo získavanie podrobností z iných vyrovnávacích pamätí na implementáciu bežne používaných mikro operácií. Intel implementoval podobné usporiadanie počas niekoľkých generácií s veľkým efektom (niektoré z nich boli pre Conroea hlavné kroky), takže vidieť to tu je pre AMD dosť sľubné. Neboli sme informovaní o rozsahu alebo rozsahu tejto vyrovnávacej pamäte a AMD môže tieto informácie časom poskytnúť.

Okrem očakávaných „vylepšení predikcie pobočiek“, ktoré sú také vágne, ako to znie, AMD ešte neodhalila dekódovacie zariadenia v Zene, ale naznačila, že dokážu dekódovať štyri inštrukcie za cyklus, aby sa dostali do frontu operácií. Tento front, s operačnou vyrovnávacou pamäťou môže poskytnúť plánovačom 6 operácií/cyklus. Dôvody, prečo môže front poslať viac za cyklus, je ten, že dekodér môže poskytnúť inštrukciu, ktorá potom skončí v dvoch mikrooperáciách (čo uľahčuje definovanie inštrukcií a mikrooperácií). Tento mikrooperačný front však pomáha napájať jednotlivé celočíselné segmenty a segmenty s pohyblivou rádovou čiarkou do CPU. Na rozdiel od Intelu, ktorý používa kombinovaný plánovač pre INT/FP, graf AMD naznačuje, že v súčasnosti zostanú oddelené s vlastnými plánovačmi.

Na strane INT jadra sa budú vykonávať operácie ALU, ako aj operácie AGU/načítanie a ukladanie. Zariadenia na načítanie/ukladanie môžu vykonať 2 16-bajtové načítania a jedno 16-bajtové úložisko na cyklus s použitím 32 KB 8-cestnej sady dátovej vyrovnávacej pamäte L1 asociatívneho záznamu. AMD z toho výslovne urobila vyrovnávaciu pamäť spätného zápisu, a nie vyrovnávaciu pamäť zápisu, ktorú sme videli v Bulldozere, čo bolo zdrojom veľkého času nečinnosti v určitých kódoch. AMD tiež uvádza, že načítanie/ukladanie bude mať nižšiu latenciu v cache, ale nevysvetlilo, do akej miery sa zlepšili.

Strana FP jadra poskytne dva multiporty a dva ADD porty, ktoré by mali umožniť dve kombinované operácie FMAC alebo jeden 256-bitový AVX na cyklus. Kombinácia segmentov INT a FP znamená, že AMD ide o široké jadro a chce využiť značné množstvo paralelizmu na úrovni inštrukcií. Do akej miery to bude závisieť od vyrovnávacích pamätí a vyrovnávacích pamätí na zmenu poradia – v súčasnosti neboli poskytnuté žiadne skutočné údaje o vyrovnávacích pamätiach, okrem toho, že do jadier bude pridané väčšie okno plánovača inštrukcií +75 % pre operácie zmeny poradia a o +50 % širšia šírka otázok pre potenciál priepustnosť. Širšie jadrá, ceteris paribus, umožnia AMD súčasne pracovať s viacerými vláknami a potenciálne využívať viacero vlákien s lineárnym a prirodzene nízkym IPC.

Čo môžeme od spoločnosti očakávať v roku 2017?

AMD sa pred časom podelilo so širokou verejnosťou o ďalší údaj o novej mikroarchitektúre Zen, ako aj platforme AM4, ktorá by sa (spolu s novými procesormi a APU) mala stať v budúcom roku hlavným produktom spoločnosti pre desktopový trh. Je jasné, že predbežné informácie nie sú vyčerpávajúce, ale sú celkom zaujímavé, pretože umožňujú približne pochopiť, čo od nových produktov očakávať (a čo nie). To bol dôvod na napísanie tohto materiálu, venovaného nie mikroarchitektonickým jemnostiam (samozrejme dôležitým, ale nie všetkým), ale povedzme spotrebiteľským charakteristikám novej platformy.

Aktuálne problémy

Ako sme písali pred takmer dvoma rokmi, situácia s desktopovými platformami AMD vyzerá posledných pár rokov trochu zvláštne. V skutočnosti sa hlavné udalosti odohrali na poli APU (ako spoločnosť nazýva procesory s integrovanou grafikou), kde sa od roku 2011 vystriedalo dve a pol platforiem: FM1, FM2 a s poslednou kompatibilnou zhora nadol FM2+. Všetky uvedené riešenia (dokonca aj platforma FM1, ktorá ešte nie je na trhu neskoro) však možno považovať za moderné: vysoký stupeň integrácie vám umožňuje vytvárať kompletné systémy s použitím iba niekoľkých čipov – samotného procesora (väčšina z ktorých sú vybavené GPU, ktoré sú vynikajúce podľa štandardov integrovaných riešení) a čipovou sadou. Rad čipových súprav spĺňa aj moderné požiadavky - z hľadiska integrácie funkčnosti AMD veľmi často predbehlo Intel, keď ako prvé poskytlo svojim čipom integrovanú podporu pre USB 3.0 a rýchlosť 6 Gb/s pre všetky SATA porty, napr. . Jediné, čo bránilo širokému rozšíreniu riešení pre túto platformu, bol relatívne nízky výkon a vysoká spotreba procesorovej časti APU v porovnaní s konkurenčnými riešeniami. Vyšší výkon bolo možné dosiahnuť výberom riešení pre platformu AM3+, ktorá v skutočnosti siaha až k platformám zo začiatku storočia. A samotné viacmodulové procesory preň neboli od roku 2012 výraznejšie aktualizované, takže sa mohli predávať len kvôli nízkym cenám za relatívne vysoké náklady, kvôli použitiu už zastaranej 32 nm procesnej technológie. To posledné sa do istej miery týkalo aj APU, ktoré počas svojej existencie „prešli“ zo spomínaných štandardov len na 28 nm, čo tiež nie je dávno technologický vrchol – v mnohých ohľadoch práve to spôsobilo spomínané problémy s spotreba energie.

Stojí za zmienku, že spoločnosť nikdy nepovažovala tento stav za „normálny“: zjednotenie platforiem bolo pôvodne plánované len na rok 2012. To sa však v praxi nestalo, takže akési „sedenie na dvoch stoličkách“ trvá dodnes. V skutočnosti sú teda procesory aj platformy AMD zastarané, takže situáciu treba radikálne zmeniť. To je to, čo spoločnosť plánuje urobiť.

AM4: konečne jedna platforma

AMD plne potvrdilo doterajšie predpoklady o vlastnostiach novej platformy, a to dokonca „s kopcom“. Najmä do kľúčové vlastnosti Spoločnosť AM4 sa týka nasledovného:

  • Pamäť DDR4
  • Plná podpora PCIe 3.0
  • USB 3.1 („plné“, t.j. Gen2 až 10 Gb/s)
  • NVMe a SATA Express

Čo sa týka posledný bod, potom v zásade neboli na jeho implementáciu potrebné vážne hardvérové ​​​​vylepšenia: je to možné aj v rámci existujúcich platforiem. Najmä mnohí výrobcovia základné dosky dokonca aj rad modelov s AM3+ bol aktualizovaný, čo umožňuje zavádzanie z diskov NVMe. Dôležitejšie pre plné fungovanie NVMe diskov najvyššia rýchlosť je podpora PCIe 3.0, ktorú AM3+ vôbec nemala a APU pre FM2+ podporovali iba 24 riadkov tohto rozhrania, z ktorých niektoré „odišli“ na komunikáciu s čipsetom a 16 mohla vyžadovať grafická karta. Navyše, ako už bolo spomenuté vyššie, neexistovali žiadne výkonné procesory pre FM2+, takže platforma sa dlho a pevne etablovala v rozpočtovom sektore, kde protokol NVMe nie je príliš relevantný (jednoducho preto, že doteraz sú všetky disky, ktoré ho podporujú, výlučne „nerozpočtové“). AM4, na druhej strane, má byť riešením pre všetky segmenty trhu, takže to môže byť nevyhnutné - najmä vzhľadom na túžbu AMD po vytváraní "dlhovekých" platforiem, čo mnohí používatelia vysoko oceňujú. Presne to isté platí pre podporu USB 3.1: nateraz to nie je nutnosť, no v budúcnosti sa to môže hodiť. Opäť, ako je uvedené vyššie, predošlá verzia AMD implementovalo štandard do čipsetov o rok skôr ako Intel, takže je logické očakávať to isté Nová verzia USB.

Prijatie DDR4 je dlho očakávaným krokom, pretože výkon integrovaných GPU do veľkej miery závisí od šírky pásma pamäte. Predtým sa tento problém musel riešiť zvýšením frekvencií DDR3, no tento prístup, mierne povedané, nie je ideálny z hľadiska ceny a spotreby modulov. V skutočnosti sa preto od roku 2013 hovorí o zavedení podpory DDR4 v APU AMD (vtedy sa veľa predpokladalo o dvoch možnostiach v pripravovanom Kaveri), ale nové pamäťové moduly boli dlho príliš drahé na to, aby sa dali použiť v hromadné systémy. V súčasnosti už zásielky DDR4 prevyšujú DDR3, takže ich ceny dohnali – trend je v prospech DDR4. Vo všeobecnosti je čas rozlúčiť sa so starými štandardmi a AMD to zjavne plánuje urobiť prudšie ako Intel - pripomíname, že ešte úplne neopustil DDR3. Na druhej strane, posledná veľká aktualizácia LGA115x bola minulý rok a najzaujímavejšie produkty pre AM4 sa objavia budúci rok, takže tento rozdiel v prístupoch je celkom pochopiteľný.

Bristol Ridge: prechodné riešenie

„Nábeh“ platformy sa však už takmer začal: podľa očakávania bolo práve teraz vydaných množstvo procesorov pre ňu, ktoré sa už dodávajú veľkým výrobcom. Všetky stále patria do rozpočtového segmentu, takže spoločnosť potlačila najfunkčnejší čipset (X380) dodaním iba niekoľkých lacných úprav - A320 a B350. Napriek tomu ich v praxi budú mať mnohí dosť. Čo nemajú, je podpora PCIe 3.0 – iba 4 alebo 6 pruhov PCIe 2.0. Na druhej strane, 10 liniek PCIe 3.0 (nepočítajúc tie potrebné na komunikáciu s čipovou sadou) je podporovaných samotnými súčasnými procesormi/APU a prítomnosť výkonnej (pre riešenia tejto triedy) grafiky v týchto APU v lacnom počítači určite ponechá PCIe procesorové pruhy voľné pre periférie.

Vo všeobecnosti možno pozorovať zjednotenie mobilných a desktopových riešení: APU rodiny Bristol Ridge sú dedičmi už známeho Carriza. Okrem spomínaných 10 PCIe 3.0 pruhov (x8 + x1 + x1, posledné dva je možné „darovať“ súčasne NVMe disku) samotné podporujú 4 porty USB 3.0 (alias USB 3.1 Gen1) a 2 SATA600 porty. Použitie mladšieho čipsetu A320 pridáva k vyššie uvedenému konektoru USB 3.1 (plná rýchlosť, ako je uvedené vyššie), 2 porty USB 3.0, 6 portov USB 2.0, 4 pruhy PCIe 2.0, 2 porty SATA600 a 1 konektor SATA Express (ktorý možno použiť ako pár SATA). B350 má rovnakú funkčnosť, ale pridáva 1 ďalší port USB 3.1 a 2 linky PCIe 2.0. Okrem toho, podľa dobrej tradície, všetky riešenia AMD podporujú vytváranie polí RAID úrovní 0, 1 a 10.

Ako je to v porovnaní s rozpočtovými ponukami spoločnosti Intel, ako sú H110 a B150? Aby sme zjednodušili pochopenie, zhromaždíme charakteristiky platforiem v tabuľke a pridáme k nej masívny A78 pre odchádzajúci trh FM2+.

Čipová súpravaAMD A78AMD A320AMD B350Intel H110Intel B150
Pruhy PCIe 3.0 (celkom)8/16 10 10 16 24
PCIe 2.0 pruhy4 4 6 6 0
SATA600 porty6 do 6do 64 do 6
RAID 0/1/10ÁnoÁnoÁnoNieNie
SATA Express porty0 1 1 0 0
Porty USB 3.10 1 2 0 0
Porty USB 3.04 6 6 4 6
USB 2.0 porty14 6 6 6 6

Jediným formálne slabým miestom novej platformy je teda počet liniek PCIe 3.0 poskytovaných procesorom: iba 10 oproti bežným 16 v masovom segmente. zbohom- je to tak, že momentálne neexistujú žiadne iné modely APU, ale v budúcnosti sa objavia. Nakoniec riešenia založené na FM2+ (A78) nemusia mať pruhy PCIe 3.0 vôbec – ak do dosky nainštalujete procesor FM2, ktorý podporoval iba PCIe 2.0. A pri platformy Intelďalší problém: všetky procesory pre LGA1151 podporujú PCIe 3.0 x16, ale na doskách s rozpočtové čipsety takáto konfigurácia liniek bude jediná - nemá sa „rozdeľovať“ tieto linky do slotov / zariadení. AMD sa drží inej praxe, takže v systéme s A320 môžete napríklad "nahnať" dva NVMe disky do PCIe 3.0 - ale v systéme s H110 je to nemožné (PCIe 3.0 x2 je však rovnaké v šírke pásma na PCIe 2.0 x4, ale v mnohých Lacných doskách založených na H110 je možné implementovať aspoň takýto slot?). Do akej miery je toto (rovnako ako podpora polí SATA Express alebo RAID) žiadané v nízkonákladových systémoch, je samostatná otázka. Faktom však zostáva: v skutočnosti sú aj najmladšie verzie novej platformy funkčne porovnateľné so staršími riešeniami Intel.

Čo sa týka možností pripojenia externých periférií, rekord v celkovom počte USB portov naďalej držia čipsety pre FM2+. Tento rekord je ale čisto teoretický – v skutočnosti po toľkých USB 2.0 vo finálnych riešeniach jednoducho nie je dopyt. Štyri vysokorýchlostné USB porty však niekedy nestačia, čím „prekoná“ aj Intel H110. Najmladší čipset pre AM4 zároveň podporuje sedem portov USB 3.0 (jeden z nich je všeobecne USB 3.1, ktorý, ako už bolo spomenuté vyššie, je najmä rezervou do budúcnosti, ale rýchlosť USB 3.0, tento port je možné použiť teraz) - dokonca viac ako B150. Možno v sérii "200". čipsety Intel„Opraví“ mladšie úpravy, ale zatiaľ to tam nie je a A320 a B350 sa už dodávajú výrobcom.

Vývoj kompaktných počítačov založených na procesoroch AMD by mal žiariť novými farbami, keďže časť funkcionality tradičných čipsetov už bola prenesená na samotné procesory, čím sa AM4 do istej miery spája nielen s FM2+ alebo AM3+, ale aj s AM1. . V AM1 však bola funkčnosť SoC veľmi obmedzená a neexistovali žiadne možnosti na jeho rozšírenie, ale teraz je tento problém odstránený. Presnejšie povedané, pred rokom sa natáčalo v notebookoch Carrizo a nie je prekvapujúce, že tieto výdobytky boli zohľadnené a zdedené pri vývoji novej desktopovej platformy. Čo to dáva v praxi? Bez zvláštnych ťažkostí je napríklad možné vyrobiť dosky Mini-STX s vymeniteľným procesorom, ale „šetrením“ na čipsetu – štyri porty USB 3.0 a dvojica SATA600 (z toho jeden v kombinácii s PCIe 3.0 x4, je rozumné priradiť k M. 2) je toho dosť. Kedysi to bolo ťažké, ale teraz už nie.

CPUAMD A12-9800AMD A12-9800EAMD A10-9700AMD A10-9700EAMD A8-9600AMD A6-9500AMD A6-9500EAMD Athlon X4 950
Technológia výroby 28 nm
Frekvencia jadra std/max, GHz 3,8/4,2 3,1/3,8 3,5/3,8 3,1/3,5 3,1/3,4 3,5/3,8 3,0/3,4 3,5/3,8
Počet modulov / výpočtových vlákien 2/4 2/4 2/4 2/4 2/4 1/2 1/2 2/4
L1 cache (celkom), I/D, KB 192/128 192/128 192/128 192/128 192/128 96/64 96/64 192/128
L2 cache, kB2×10242×10242×10242×10242×10241×10241×10242×1024
RAM 2× DDR4-2400
TDP, W65 35 65 35 65 65 35 65
Grafické umenieRadeon R7Radeon R7Radeon R7Radeon R7Radeon R7Radeon R5Radeon R5-
Počet GPU512 512 384 384 384 384 384 -
Frekvencia std/max, MHz 1108 900 1029 847 900 1029 800 -

Prečo však so všetkými týmito zaujímavými funkciami máme tendenciu považovať súčasnú implementáciu platformy za prechodné riešenie? Faktom je, že procesory, ktoré preň v súčasnosti existujú, sú veľmi obmedzené. AMD si samozrejme APU „siedmej generácie“ pochvaľuje, no to isté sa hovorilo aj o predchádzajúcich modeloch. Ale v praxi je to len ďalší vývoj rovnakej modulárnej architektúry, ktorá debutovala v roku 2011, a rovnakej 28 nm procesnej technológie, ktorá sa používa od roku 2014. Áno, ako ukázali naše testy, procesory Carrizo sú často (vďaka optimalizácii) rýchlejšie ako Kaveri pracujúce na vyššej taktovacej frekvencii a podpora pamätí DDR4 by ich mala „povzbudiť“ ešte o niečo viac. Integrovaný GPU bol predtým jedným z najlepších vo svojej triede a od roku 2015 dostal aktualizovanú jednotku na spracovanie videa s hardvérovou podporou pre VP9 a H.265/HEVC s rozlíšením až 4K. To všetko je pravda – ale vedie to len k evolučným zmenám, ktoré zásadne nemenia triedu riešenia. Takže jediný Athlon X4 pre novú platformu v súčasnosti, model s indexom 950, je vo všetkom identický okrem typu RAM s Athlon X4 845 pre FM2+ a môžete si vybrať viac či menej blízke analógy pre iné nové procesory. Reálne spustenie platformy AM4 sa preto očakáva až budúci rok – v každom prípade, ak sa plány AMD naplnia.

Zen: Čo je nové?

Aké výzvy teda spoločnosť čelila? Primárnym kontroverzným bodom vyvinutej modulárnej architektúry boli samotné moduly: aby sa ušetril rozpočet na tranzistor, pár „x86 jadier“ v nich zahrnutých závisí od seba, pretože zdieľajú niektoré bloky. Najmä v prvých implementáciách boli dokonca aj dekodér inštrukcií a vyrovnávacia pamäť inštrukcií rovnaké. Druhým slabým miestom je pamäťový systém. V čase vývoja prvých procesorov bolo možné urobiť rýchlu vyrovnávaciu pamäť druhej úrovne, no L3 zostala externá hlavnej časti procesora, takže s ňou pracovala asynchrónne na nižších taktovacích frekvenciách. Výsledkom bolo, že vo vyšších konfiguráciách procesorov rodiny FX sa celková kapacita L2 rovnala L3, čo prinútilo AMD naďalej používať exkluzívnu architektúru vyrovnávacej pamäte. Fungovalo to skvele v časoch jednojadrových procesorov, ale sťažovalo výmenu údajov medzi výpočtovými vláknami vo viacjadrových procesoroch, čo komplikovalo algoritmy: ak niečo nie je v L3, môže to byť v L2 jedného z modulov. , alebo možno len v pamäti. A dokonca ani jeden L2 pre pár jadier, ktorý je pre Core 2 Duo taký pohodlný, sa nedal použiť na synchronizáciu: modul, ktorý vykonával iba jeden príkazový prúd, vykazoval najväčšiu efektivitu, t. j. sťahovanie „druhých polovíc“ (v skutočnosti , menšia časť z nich) mala zmysel pracovať len s príliš veľkým množstvom, ale nie na obvyklých pre masívne zaťaženie dvoch alebo štyroch tokov.

A v APU väčšinu kryštálu zaberalo grafické jadro, takže tieto modely zostali úplne bez jedinej vyrovnávacej pamäte, aj keď bola pomalá, pretože inak by sa procesor ukázal byť príliš veľký. V skutočnosti pri použití rovnakých výrobných štandardov APU cenovo konkurovali starším štvorjadrovým modelom masovej rady procesorov Intel a staršie procesory so štyrmi modulmi sa ukázali byť ešte drahšie. O konkurencii z hľadiska výkonu by sa ale zároveň dalo hovoriť len porovnaním štyroch modulov AMD so štyrmi jadrami Intel – olej do ohňa prilial iba jeden SIMD blok na modul. Samotné procesory Intel boli zároveň lacnejšie na výrobu a vzhľadom na vlastnosti platforiem aj drahšie podstatne menej. APU „bojovali“ len s veľmi lacnými dvojjadrovými procesormi Intel a darilo sa im to so striedavým úspechom. Samozrejme mali výhodu vo výkone grafickej časti, no tá nebola ani zďaleka vždy žiadaná.

Čo sa mení v novej generácii (ako sme sľúbili – zjednodušene povedané, bez toho, aby sme museli ísť do technickej džungle)? „Základný prvok“ Zen trochu pripomína dvojmodulový procesor predchádzajúcej architektúry, ale s výraznými vylepšeniami. Po prvé, nezahŕňa štyri spárované „x86-jadrá“, ale štyri plnohodnotné a nezávislé jadrá – nezávislé aj z hľadiska vyrovnávacej pamäte druhej úrovne, ktorej celková kapacita sa znížila na polovicu, no teraz má každé jadro svoju L2. (a samozrejme vlastný dekodér inštrukcií spolu s vyrovnávacou pamäťou inštrukcií). Po druhé, vyrovnávacia pamäť tretej úrovne sa stala neoddeliteľnou súčasťou takejto „tehly“. Podľa všetkého bude fungovať oveľa rýchlejšie ako jeho predchodcovia a jeho kapacita je 8 MB. Do tretice a v neposlednom rade sa AMD podarilo implementovať aj technológiu symetrického multithreadingu, takže každé jadro môže vykonávať príkazy nie z jedného, ​​ale z dvoch vlákien.

V skutočnosti, ako môžete vidieť, vo svojom „základnom“ variante sa Zen silne podobá na špičkové procesory Intel v masovej sérii, teda na štvorjadrový Core i7. Zároveň sa takýto „modul“ bude v druhej polovici budúceho roka používať aj v APU, kde sú už len dva „staré“ moduly a vôbec bez vyrovnávacej pamäte tretej úrovne. Grafické jadro síce nedosiahne špičkové riešenia Intelu (najmä tie, ktoré sú vybavené cache štvrtej úrovne – AMD zatiaľ nič také nesľubuje), ale bude produktívnejšie ako sériovo vyrábané integrované grafiky Intelu. Navyše, podľa dostupných údajov o vnútorná organizácia procesory, bude spoločnosť schopná zvládnuť aj úpravu rozpočtu s dvojicou jadier a L3 zníženou na 4 MB, teda vydať priamych konkurentov pre rôzne Core i3 a ďalšie dvojjadrové procesory (najmä mobilné). Teraz im môžu konkurovať iba dvojmodulové (v terminológii AMD – „štvorjadrové“) procesory a v budúcnosti to budú robiť aj „bežné“ dvojjadrové procesory.

Nedá sa však povedať, že by sa spoločnosti plne podarilo dosiahnuť „core parity“. Predovšetkým bloky pre prácu s číslami s pohyblivou rádovou čiarkou a ďalšími pokynmi SIMD sa zmenili v menšej miere, ako by sme chceli. Nemajú normálnu podporu pre prácu s 256-bitovými vektormi, t.j. nemali by ste očakávať vysoké výsledky v kóde AVX2. Na druhej strane je zatiaľ predčasné hovoriť o výkone – nová mikroarchitektúra bude debutovať v hotových produktoch až budúci rok. Potom budú úplne jasné ich rýchlosti hodín, ceny a výkon v skutočných úlohách. Zatiaľ môžeme len hodnotiť plány AMD.

A našli si miesto aj pre milovníkov vysokého výkonu procesora, pretože hotové výrobky budú mať aspoň dve možnosti rozloženia (a ak vezmeme do úvahy možnosť vydania dvojjadrových modelov, ktoré si ľahko nájdu svoje miesto v segmente rozpočtu , potom tri): okrem APU, kde, ako už bolo povedané vyššie, jeden štvorjadrový Zen "modul" bude susediť s GPU, sa plánuje aj vydanie "čistých" CPU - s dvoma modulmi. To znamená, že takéto riešenia dostanú 8 jadier schopných súčasne vykonávať 16 výpočtových vlákien a vybavené vyrovnávacou pamäťou tretej úrovne s kapacitou 16 MB. Pri L3 nie je úplne jasné, či pôjde o jeden zväzok dostupný pre všetky jadrá „kompozitného“ procesora, alebo o dva samostatné bloky (čo k „lepeniu“ neodmysliteľne patrí, no kapacita bude taká akurát. Špičkové procesory zároveň zostanú kompatibilné s rovnakou platformou AM4, čo je dôležité konkurenčná výhoda pred procesormi Intel pre LGA2011-3 a ich nástupcov, s hromadnou líniou mechanicky nekompatibilnou. Áno, samozrejme, to, čo bolo povedané vyššie o výkone vektorových inštrukcií, bude pravda a pamäťový radič v týchto nových modeloch zostane dvojkanálový, nie štvorkanálový, ale druhý má svoje výhody: dosky budú lacnejšie . Navyše pôjde o rovnaké dosky ako pre lacné APU, t. j. dlho očakávaná jediná platforma AMD bude pravdepodobne využívaná ešte širšie ako LGA115x od Intelu. A ak sa to spoločnosti podarí na päť rokov „opraviť“ (uvedomujúc si aspoň kompatibilitu „zhora nadol“), čím sa z neho stane „dlhá pečeň“ triedy AM3, tým lepšie pre mnohých spotrebiteľov.

Samozrejme, vyvstáva logická otázka: ak sú všetky zmeny také logické a očakávané, prečo sa to „čakanie“ naťahovalo tak dlho? Veď v dobrom slova zmysle sú takéto zariadenia potrebné ešte „včera“ a firma ich plánuje dodať až „zajtra“. Je tu problém, ale netýka sa samotného vývoja – iba výroby. V skutočnosti všetko, čo bolo AMD donedávna dostupné, je 32 nm procesná technológia, ktorá stačí len na FX. V najlepšom prípade dosahuje úroveň Intel Sandy Bridge, ktorý je tiež starý viac ako päť rokov. Najnovšie modely APU však používajú 28nm štandardy, ale to nie je oveľa lepšie ako 32nm. Preto sa vo výrobe plánuje „veľký skok“ – prechod na 14 nm procesnú technológiu. Prechod prebehne s určitým oneskorením od Intelu (ktorý túto procesnú technológiu používa už dva roky), ale je pochopiteľný a zrozumiteľný. Vo všeobecnosti bolo nemožné vyrobiť takéto procesory bez zvládnutia nových výrobných štandardov – a ich zvládnutie si vyžaduje čas. Chceme veriť, že AMD uspeje.

Celkom

Čo teda získame? Najprv - konečne! - prechod na jednotnú platformu, čo sa nestalo päť rokov. A v tomto prípade môžeme hovoriť o „veľkom skoku“: podľa plánov by AM4 mala byť všestrannejšia ako Intel LGA115x. Po druhé, významná zmena v mikroarchitektúre - so zvýšením výkonu a celkovej efektivity procesorov na nej založených. Po tretie, výrazné zlepšenie výrobných noriem, čo je samo o sebe dobré a bez ktorého by takéto zmeny neboli možné. To znamená, ako môžete vidieť, AMD plánuje jedným ťahom odstrániť všetky nedostatky súčasných systémov hromadnej výroby. Bude to fungovať? To ukáže až prax – zatiaľ môžeme hodnotiť len plány a predbežné informácie. však v nejakej forme platforma AM4 už existuje a vo svojom cenovom segmente má oproti konkurenčnému vývoju množstvo výhod. V podstate sú zdedené po svojich predchodcoch (to nie je prekvapujúce – je ťažké nazvať v súčasnosti vyrábané APU „nové“), no s pridanou (aspoň potenciálne) upgradovateľnosťou a dlhším životným cyklom. A dostaneme definitívnu odpoveď na otázku, nakoľko úspešný bude prechod budúci rok. Rád by som veril, že odpoveď bude kladná - teda aspoň zaujímavejšia :)

V roku 2017 AMD predstavilo procesory Ryzen s novou mikroarchitektúrou Zen. Dnes redaktori stránky podrobne analyzujú mikroarchitektúru Zen a sledujú, ako sa zmenilo oneskorenie a preskakovanie pokynov od K10.

Okrem toho zaužívané spôsoby na zvýšenie výkonu procesora (zvýšenie taktovacej frekvencie, zväčšenie šírky vykonávacej cesty, rozšírenie kapacity IU a vektorizácia inštrukcií) existuje jednoznačný spôsob – zníženie časovania inštrukcií, teda skrátenie času vykonávania inštrukcií. Napríklad skrátenie času potrebného na vykonanie operácie delenia na polovicu by sa konvenčne rovnalo zdvojnásobeniu rýchlosti hodín procesora pri vykonávaní delenia (s množstvom predpokladov). Zníženie časovania vykonávania inštrukcií teda môže byť dosť efektívnym spôsobom, aj keď veľmi obmedzene a špecificky (keďže pre zvýšenie rýchlosti celého procesora je potrebné znížiť časovanie všetkých inštrukcií, pričom v skutočnosti väčšinou klesajú časovania len určitých inštrukcií, čím sa procesor zrýchli len v úzkom rozsah úloh).
Celkovo existujú dve najdôležitejšie časovania: latencia a recipročná priepustnosť. Kde je oneskorenie vyjadrené v cykloch, ktoré sú potrebné na vykonanie inštrukcie, a medzera je počet cyklov, ktoré sa musia preskočiť na vykonanie ďalší pokyn v tejto IU. Porovnajme načasovanie niektorých inštrukcií pre K10, Bulldozer a Zen s použitím referenčných údajov Agnera Foga.

Tabuľky budú zostavené nasledovne: inštrukcia a operandy budú uvedené v stĺpci "Inštrukcia" (m, m32, m64, m128, m256 - pamäť; r, r32, r64 - RON; mm - registre MMX; xmm - SSE registre;ymm - registre AVX); stĺpce K10, Bulldozer a Zen budú priamo indikovať časovanie v cykloch pre tieto mikroarchitektúry podľa schémy „oneskorenie (preskočenie)“.

X86 pokyny

Inštrukcia

MOV: Prenos dát z pamäte do registrov pre Zen na úrovni K10 sú 3 cykly, zatiaľ čo pre Bulldozer sú to 4 cykly.
XCHG: Výmena dát medzi registrami je pre Zen „zadarmo“ (s odstupom 0,33 cyklu), kým K10 a Bulldozer majú 2 a 1 cyklus. Výmena dát medzi registrom a pamäťou v Zene je väčšia ako v K10 – 30 cyklov oproti 21, ale menej ako v Bulldozéri – 50.
PUSH: Všetkým účastníkom trvá 1 hodinu, kým vložia číslo do zásobníka.
POP: Vytiahnutie čísla z hornej časti zásobníka v Zene trvá pol hodiny, kým predtým to trvalo 1 hodinu.
ADD: Operácia pridávania K10, buldozéra a Zen trvá 1 hodinu, ale treba poznamenať, že K10 preskočí 1/3 hodiny, buldozér preskočí 1/2 a Zen preskočí 1/4 hodiny.
Podobne je to s odčítaním (SUB), zmenou znamienka čísla (NEG), prírastkom (INC), dekrementom (DEC), logickým AND (AND), logickým OR (OR), logickým výlučným OR (XOR), bitom inverzia (NIE) .
MUL: Násobenie bez znamienka na Zene je teraz dvakrát rýchlejšie ako na Bulldozéri – 3 cykly oproti 6.
IMUL: Násobenie na Zene trvá iba 3 cykly, zatiaľ čo na Buldozéri 6 a na K10 4.
DIV: delenie bez znamienka sa tiež zrýchlilo: Zen vyžaduje 14-46 cyklov; Buldozér - 16-75; K10-15-78.
IDIV: Operácia delenia je výrazne rýchlejšia v Zene – 14-47 cyklov oproti 22-79 pre buldozér.
Ak zhrnieme medzivýsledok, hlavné inštrukcie zo sady X86 sa začali vykonávať na Zen rýchlejšie ako na ich predchodcoch, to znamená, že Zen, dokonca aj na rovnakej frekvencii ako jeho predchodcovia, bude vykazovať vyšší výkon (s prevahou prezentovaných pokyny v kóde).

Pokyny X87

K dnešnému dňu sa inštrukčná sada X87 takmer nikdy nepoužíva v moderných programoch a v procesoroch je ponechaná na kompatibilitu (rovnaké „+“ architektúry x86). Tento súbor inštrukcií sa dlho nevyvíjal – nepridávajú sa ani nové inštrukcie, ani registre.

Inštrukcia

FLD: Načítanie reálneho čísla do zásobníka v Zene sa zrýchlilo - 1 hodina oproti 2 hodinám, ale medzera sa zväčšila - v K10 a Bulldozer bola medzera 0,5 hodiny a v Zen - 1 hodina.
FST: pri kopírovaní reálneho čísla zo zásobníka je situácia podobná ako pri FLD.
FILD: Načítanie celého čísla do zásobníka v Zene je teraz rýchlejšie ako v Bulldozéri – 8 cyklov oproti 12, ale pomalšie ako v K10 (6 cyklov).
FIST: pri kopírovaní celého čísla zo zásobníka je situácia podobná ako pri FILD.
FISTP: pri čítaní celého čísla zo zásobníka je situácia podobná ako pri FILD.
FADD: sčítanie reálnych čísel v Zene trvá 5 cyklov, zatiaľ čo v buldozéri - 5-6 a v K10 - 4.
FSUB: pri odčítaní reálnych čísel je situácia podobná ako pri FADD.
FMUL: s násobením reálnych čísel je situácia podobná ako pri FADD.
FDIV: delenie reálnych čísel sa skutočne zrýchlilo - z hľadiska oneskorenia aj preskakovania: Zen vykonáva operáciu v 8-15 cykloch, zatiaľ čo buldozér - 10-42 a K10 - 31.
FSQRT: Extrakcia druhej odmocniny je tiež rýchlejšia: Zen vykoná operáciu v 8-21 cykloch, zatiaľ čo Bulldozer trvá 10-53 a K10 trvá 35.
FXTRACT: Extrakcia Zenovho exponentu a mantisy je teraz pomalšia ako pri Bulldozere – preskočená o 2 hodiny pri zachovaní rovnakej latencie 10 hodín.
FCOS: Výpočet kosínusu v Zene je rýchlejší ako v Bulldozéri – 50-115 cyklov oproti 160.
FSIN: s výpočtom sínusu je situácia podobná ako pri FCOS.
Ako je uvedené vyššie, inštrukčná sada X87 sa nevyvíjala a je zachovaná z dôvodu kompatibility - to je možné vidieť na čase vykonávania inštrukcie v Zen, kde je rýchlosť vykonávania mnohých inštrukcií, hoci je rýchlejšia ako v Bulldozéri, nižšia ako v K10, ktorá vyšla v roku 2007. Z uvažovaných inštrukcií dostalo výrazné zrýchlenie len delenie reálnych čísel FDIV a extrakcia druhej odmocniny FSQRT.

Pokyny pre MMX

Inštrukčná sada MMX bola ohlásená v roku 1997 a ponúkala osem 64-bitových mm registrov a 57 inštrukcií. K dnešnému dňu je tento súbor pokynov zastaraný a nevyvíja sa - ponechaný v moderné procesory kvôli kompatibilite.

Inštrukcia

MOVD: prenos dát do Zen sa v závislosti od operandov buď zrýchlil alebo zostal na úrovni K10, napríklad: prenos z registrov RON do mm v Zen trvá 3 cykly, zatiaľ čo v K10 trvá 6 cyklov.
MOVQ: Prenos quad slov medzi mm registrami v Zen je dvakrát rýchlejší ako v K10 – 1 hodina oproti 2 (podobne preskočenie – 0,25 hodiny oproti 0,5).

S logickým OR (POR), logickým AND (PAND), bitovo logickým NOT (PANDN) je situácia podobná ako pri PXOR.
PMADDWD: Násobenie štyroch slov v Zene je rovnako rýchle ako v K10 (ale rýchlejšie ako v Bulldozéri).
PCMPEQB: Kontrola rovnosti bajtov Zen trvá 1 hodinu, zatiaľ čo K10 a buldozér trvá 2 hodiny.
Ako vidíte, z uvažovaných pokynov sa značná časť začala v Zene vykonávať rýchlejšie ako v jeho predchodcoch.

Pokyny SSE

Inštrukčné sady SSE (SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2) sa rozšírili a až donedávna (pred príchodom AVX) sa aktívne rozvíjali. Tieto inštrukčné sady riešili hlavné nevýhody MMX (práca len s celými číslami a nemožnosť paralelnej práce s MMX a X87) a poskytovali osem (neskôr 16) 128-bitových registrov. Veľké množstvo inštrukcií (asi 300), 128-bitové registre, práca s reálnymi číslami a jednoduchosť obsluhy (v porovnaní so zásobníkom v X87) umožnili opustiť MMX a X87. Pozrime sa na niekoľko návodov zo súprav SSE.

Inštrukcia

MOVD: prenos dát do Zen sa v závislosti od operandov buď zrýchlil alebo zostal na úrovni K10, napríklad prenos z registrov RON do xmm v Zen trvá 3 cykly, zatiaľ čo v K10 trvá 6 cyklov.
MOVQ: Prenos quad slov medzi xmm registrami v Zen je 2,5-krát rýchlejší ako v K10 – 1 hodiny oproti 2,5.
PXOR: bitové logické XOR v Zen sa vykonáva v 1 cykle oproti 2 v K10.
ADDPS: paralelné sčítanie štyroch párov čísel s pohyblivou rádovou čiarkou v Zene trvá 3 cykly, zatiaľ čo v K10 - 4 a v Bulldozéri - 5-6.
To isté platí pre inštrukcie na sčítanie reálnych čísel (ADDSS), paralelné odčítanie reálnych čísel (SUBPS) a paralelné násobenie reálnych čísel (MULPS a MULSS).
DIVPS: paralelné delenie reálnych čísel v Zene sa výrazne zrýchlilo ako v K10 - 10 cyklov proti 18 (podobne ako pri preskakovaní).
SQRTPS: Extrakcia druhej odmocniny štyroch čísel trvá 9-10 hodín pre Zen, zatiaľ čo K10 trvá 21 hodín a Bulldozer trvá 14-15 hodín.
ANDPS: Bitová operácia AND v Zen trvá 1 cyklus, zatiaľ čo v K10 a Bulldozer trvá 2 cykly.
Podobne s operáciami bitového logického OR (ORPS) a bitového logického exkluzívneho OR (XORPS).
Návod AVX naša redakčná rada nezaradila z dôvodu, že v K10 chýbajú, a preto nebude možné sledovať vývoj mikroarchitektúr.

Záver

Ako môžete vidieť, AMD dôkladne zapracovalo na mikroarchitektúre Zen, zmenilo nielen koncept jadra, počet IO, dekodérov atď., ale znížilo aj časovanie vykonávania mnohých inštrukcií, čo bude mať tiež pozitívny vplyv na výkon. v rôzne aplikácie. Zároveň je dôležité pochopiť, že nie všetky inštrukcie sa „zrýchlili“, napríklad ak sa klasické inštrukcie X86 vo väčšej miere (z uvažovaných) začali v Zene vykonávať rýchlejšie v porovnaní s ich predchodcami, potom Inštrukcie X87 prakticky nezískali žiadne zrýchlenie (čo opäť naznačuje, že inštrukčná sada X87 je zastaraná, aj keď je stále potrebná pre kompatibilitu). Vektorové inštrukcie (MMX a SSE) sú tiež rýchlejšie. AMD teda v Zene nielen „okopírovalo“ časti K10 a Bulldozer, ale výrazne prerobilo IU, čím ich zrýchlilo (bude zaujímavé porovnať časovanie Intelu a AMD).

Zozbierané sú zvyšné materiály na mikroarchitektúre Zen.

Jeden blok od miesta, kde sa práve koná výročná konferencia IDF 2016, usporiadala spoločnosť AMD svoje vlastné malé podujatie, na ktoré pozvalo vybraných zástupcov médií a analytikov. Je ľahké uhádnuť, že hlavnou a jedinou témou „súkromnej párty“ AMD bola architektúra mikroprocesorov Zen.

AMD teda prostredníctvom svojej vedúcej predstaviteľky Lisy Su objasnilo, že s dlho očakávanými procesormi Zen je všetko v poriadku, dodávky limitovaných sérií čipov partnerom už začali a objavenie sa desktopových procesorov AMD Zen (kódové označenie Summit Ridge) na pultoch predajní sa očakáva v prvom štvrťroku budúceho roka. Zaujímavosťou je, že spoločnosť cieli priamo na segment vysokovýkonných desktopových procesorov, zatiaľ čo súčasné čipy AMD sú vhodnejšie na použitie v rozpočtových systémoch.

„Zameriavame sa na procesory a grafiku pre vysokovýkonné systémy,“ povedala generálna riaditeľka AMD Lisa Su predtým, ako prešla k zoznamu nedávnych úspechov spoločnosti.

Medzi tieto úspechy patrila dodávka čipov pre herné konzoly PlayStation 4 a Xbox One(rovnako ako One S a pripravovaný Project Scorpio), ako aj uvedenie neuveriteľne výkonnej grafickej karty Radeon RX480 len za 200 dolárov.

Hlavný inžinier spoločnosti Mark Papermaster, naplnený hrdosťou na svoju prácu, sa zaviazal vymenovať hlavné silné stránky procesorov založených na architektúre Zen. Poznamenal, že vývoj architektúry sa uskutočnil „od nuly“ so zameraním na „výkon, šírku pásma a energetickú efektívnosť“. Počet inštrukcií na takt (IPC) vykonaných mikroprocesorom vzrástol o 40 % v porovnaní s modelmi súčasnej generácie. Zároveň sa znížila spotreba energie (o koľko nie je uvedené). To bolo dosiahnuté pomocou 14-nm procesnej technológie s použitím vertikálne umiestnených hradlových tranzistorov (FinFET - Fin Field Effect Transistor), známych aj ako tranzistory s trojrozmernou hradlovou štruktúrou alebo 3D tranzistory. Taktiež sa AMD konečne podarilo zaviesť podporu pre technológiu viacvláknového spracovania dát SMT, ktorá zabezpečuje, že inštrukcie z rôznych nezávislých vlákien sú vykonávané niekoľkými funkčnými modulmi súčasne.

„Ako najmenší hráč musíme byť rýchlejší, ukážte b o väčšiu flexibilitu a vynaliezavosť,“ povedal Papermaster.

Po ponorení sa do technických detailov mikroarchitektúry AMD Zen spoločnosť spomenula zvýšenie výkonu plánovača (x1,75) a zvýšenie výpočtových zdrojov (x1,5), 8 MB vyrovnávacej pamäte L3 a 512 KB vyrovnávacej pamäte L2 na jadro. Všimnite si, že AMD sľubuje päťnásobné zvýšenie šírky pásma cache v porovnaní s predchádzajúcou architektúrou Excavator.






Všetky tieto čísla znamenajú pre bežného spotrebiteľa vyššiu úroveň výkonu pri vykonávaní prác náročných na prácu (čítanie - prehrávanie 4K videa, hry vrátane VR) a zníženú spotrebu energie, teda vyššiu autonómiu mobilných počítačov. Na papieri všetko vyzerá skvele a skutočne vyzerá ako samotný skok, ktorý AMD umožní, ak nie obísť, tak aspoň dobehnúť Intel, aj keď mnohé parametre ešte nie sú známe. Neexistujú napríklad údaje o tepelnom výkone, na základe ktorých by sa dala posúdiť energetická účinnosť. A samozrejme, AMD ešte nie je pripravené hovoriť o prevádzkových frekvenciách a cenách. Mark Papermaster sľúbil, že na nadchádzajúcej konferencii Hot Chips odhalí ďalšie technické detaily o architektúre Zen.

Prvý procesor AMD založený na mikroarchitektúre Zen bude desktopový model s kódovým označením Summit Ridge. Dostane osem procesorových jadier a bude môcť súčasne vykonávať až šestnásť vlákien príkazov. Procesor navrhnutý pre päticu procesora AM4 podporuje pamäť DDR4 a ďalšiu generáciu I/O rozhraní.

Spoločnosť tiež vkladá veľké nádeje do architektúry Zen v iných segmentoch. Spoločnosť očakáva najmä návrat k ziskovejšiemu segmentu serverov. Serverové procesory s kódovým označením Naples budú mať 32 jadier a budú schopné spracovať až 64 tokov inštrukcií. Dostupné budú od druhého štvrťroka 2017. V budúcnosti sa budú procesory rodiny Zen používať v konvertibilných mobilných počítačoch s pasívnym chladiacim systémom, ako aj vstavanou technológiou. Mimochodom, AMD už tvrdo pracuje na svojom nástupcovi, architektúre Zen+.

Súčasťou prezentácie bolo aj živé demo procesorov Summit Ridge od AMD. Spoločnosť priniesla inžiniersku vzorku 8-jadrového procesora Summit Ridge priamo na hlavu s konkurenčným 8-jadrovým procesorom Intel Core i7-6900K (Broadwell-E). Na porovnanie sme použili testovacie 3D modelovacie nástroje softvéru Blender. Technická vzorka 8-jadrového procesora Summit Ridge bežala na frekvencii 3 GHz, takže aj prevádzková frekvencia Intel Core i7-6900K bola znížená na 3 GHz. Stalo sa tak s cieľom vyrovnať šance súťažiacich strán. Systém založený na procesore AMD Summit Ridge vykreslil scénu o pol sekundy rýchlejšie ako jeho konkurent Intel Core i7-6900K. Súčasťou prezentácie bola aj ukážka tímovej práce AMD Summit Ridge a AMD R9 Fury X v Deux Ex: Ľudstvo rozdelené v grafickom rozlíšení 4K. Prítomným sa samozrejme neukázal presný počet snímok za sekundu vydaný systémom, ale vo všeobecnosti hra prebehla hladko.

Hlavný analytik výskumnej spoločnosti Tirias Research, ktorý sa mohol zúčastniť prezentácie, označil AMD Summit Ridge za „najzaujímavejší procesor od spoločnosti za posledných 10 rokov“.