Mennyire fontos az L3 gyorsítótár az AMD processzorok számára?

Valójában érdemes a többmagos processzorokat dedikált memóriával felszerelni, amelyet az összes elérhető mag megoszt. Ebben a szerepkörben a gyors L3 gyorsítótár jelentősen felgyorsíthatja a leggyakrabban kért adatokhoz való hozzáférést. Ekkor a magoknak, ha van ilyen lehetőség, nem kell hozzáférniük a lassú főmemóriához (RAM, RAM).

Legalábbis elméletben. Nemrég AMD bejelentette az Athlon II X4 processzort, amely egy Phenom II X4 modell L3 gyorsítótár nélkül, utalva arra, hogy nincs rá szükség. Úgy döntöttünk, hogy közvetlenül összehasonlítunk két processzort (L3 gyorsítótárral és anélkül), hogy megnézzük, hogyan befolyásolja a gyorsítótár a teljesítményt.

Kattintson a képre a nagyításhoz.

Hogyan működik a gyorsítótár?

Mielőtt belemerülnénk a tesztekbe, fontos megértenünk néhány alapvető dolgot. A gyorsítótár elve meglehetősen egyszerű. A gyorsítótár puffereli az adatokat a lehető legközelebb a processzor feldolgozási magjaihoz, hogy csökkentse a CPU-kéréseket a távolabbi és lassabb memóriába. A modern asztali platformokon a gyorsítótár-hierarchia három olyan szintet foglal magában, amelyek megelőzik a hozzáférést véletlen hozzáférésű memória. Ráadásul a második és különösen a harmadik szint gyorsítótárai nem csak adatpufferelést szolgálnak. Céljuk, hogy megakadályozzák a CPU busz túlterhelését, amikor a magoknak információcserére van szükségük.

Találatok és kihagyások

A gyorsítótár-architektúra hatékonyságát a találatok százalékában mérik. A gyorsítótár által kielégíthető adatkérések találatnak minősülnek. Ha ez a gyorsítótár nem tartalmazza a szükséges adatokat, akkor a kérést továbbítja a memóriafolyamat mentén, és a rendszer egy hiányosságot számol. Természetesen a kihagyások több időt vesznek igénybe az információ megszerzéséhez. Ennek eredményeként "buborékok" (leállás) és késések jelennek meg a számítási folyamatban. A találatok viszont lehetővé teszik a maximális teljesítmény fenntartását.

Gyorsítótár írás, exkluzivitás, koherencia

A helyettesítési házirendek határozzák meg, hogy a gyorsítótár hogyan áll rendelkezésre az új bejegyzések számára. Mivel a gyorsítótárba írt adatoknak előbb-utóbb meg kell jelenniük a fő memóriában, a rendszerek ezt megtehetik a gyorsítótárba írással egyidejűleg (átírás), vagy megjelölhetik az adatterületet "piszkosnak" (visszaírás), és kiírja a memóriába, hogy mikor kerül ki a gyorsítótárból.

Az adatok több gyorsítótár szinten kizárólagosan, azaz redundancia nélkül tárolhatók. Ekkor nem talál azonos adatsorokat két különböző gyorsítótár-hierarchiában. Vagy a gyorsítótárak működhetnek inkluzívan, vagyis a gyorsítótár alsó szintjei garantáltan tartalmazzák a gyorsítótár felső szintjein (a processzormaghoz közelebb) lévő adatokat. Az AMD Phenom exkluzív L3 gyorsítótárat használ, míg az Intel egy inkluzív gyorsítótár stratégiát követ. A koherencia protokollok konzisztens és naprakész adatokat biztosítanak a magok, a gyorsítótár szintek és még a processzorok között is.

Gyorsítótár mérete

A nagyobb gyorsítótár több adatot tud tárolni, de általában növeli a késleltetést. Ezenkívül a nagy gyorsítótár jelentős számú processzortranzisztort fogyaszt, ezért fontos megtalálni az egyensúlyt a tranzisztorok "költségvetése", a szerszám mérete, az energiafogyasztás és a teljesítmény / késleltetés között.

Az asszociativitás

A RAM-ban lévő rekordok közvetlenül hozzárendelhetők a gyorsítótárhoz, vagyis csak egy pozíció van a gyorsítótárban a RAM-ból származó adatok másolatának, vagy lehetnek n-utas asszociatívak, azaz n lehetséges hely van a gyorsítótárban ahol ezek az adatok tárolhatók. Több magas fokozat Az asszociativitás (akár teljesen asszociatív gyorsítótárakig) biztosítja a legjobb gyorsítótárazási rugalmasságot, mivel a gyorsítótárban meglévő adatokat nem kell felülírni. Más szóval, a magas n-fokú asszociativitás magasabb találati arányt garantál, de növeli a késleltetést, mivel több időbe telik az összes ilyen asszociáció tesztelése egy találatra. Általános szabály, hogy a legmagasabb fokú asszociáció az utolsó gyorsítótárazási szintnél indokolt, mivel ott a maximális kapacitás elérhető, és a gyorsítótáron kívüli adatok keresése azt eredményezi, hogy a processzor lassú RAM-hoz fog hozzáférni.

Néhány példaképpen a Core i5 és i7 32 KB L1 gyorsítótárat használ 8 irányú asszociativitással az adatokhoz és 32 KB L1 gyorsítótárat 4 irányú asszociativitással az utasításokhoz. Érthető, hogy az Intel gyorsabban szeretné elérni az utasításokat, és az adatok L1 gyorsítótárában maximális a találati százalék. L2 gyorsítótár Intel processzorok 8 irányú asszociativitással rendelkezik, és az Intel L3 gyorsítótára még intelligensebb, mivel 16 irányú asszociativitást valósít meg a találatok maximalizálása érdekében.

Az AMD azonban más stratégiát követ a Phenom II X4 processzorokkal, amelyek L1 gyorsítótárat használnak kétirányú asszociativitással a késleltetés csökkentése érdekében. Az esetleges kihagyások kompenzálására megduplázták a gyorsítótár kapacitását: 64 KB az adatok és 64 KB az utasítások. Az L2 gyorsítótár 8 irányú asszociativitással rendelkezik, mint az Intel dizájn, de az AMD L3 gyorsítótár 48 irányú asszociativitással működik. Az egyik vagy másik gyorsítótár-architektúra kiválasztásának döntése azonban nem ítélhető meg a teljes CPU architektúra figyelembevétele nélkül. Teljesen természetes, hogy a teszteredmények gyakorlati jelentőséggel bírnak, és a célunk ennek az egész összetett, többszintű gyorsítótár-struktúrának a gyakorlati tesztelése volt.

Minden modern processzor rendelkezik egy dedikált gyorsítótárral, amely tárolja a processzor utasításait és adatait, és szinte azonnal használatra kész. Ezt a szintet általában az első gyorsítótár-szintnek vagy L1-nek nevezik, és először a 486DX processzorokkal vezették be. A közelmúltban az AMD processzorok szabványosították, hogy magonként 64 000 L1 gyorsítótárat használnak (adatokhoz és utasításokhoz), míg az Intel processzorok 32 000 L1 gyorsítótárat használnak magonként (adatokhoz és utasításokhoz is).

Az első szintű gyorsítótár először a 486DX processzorokon jelent meg, utána lett összetett függvény minden modern CPU.

A második szintű (L2) gyorsítótár a Pentium III megjelenése után minden processzoron megjelent, bár ennek első implementációi a csomagon a Pentium Pro processzorban voltak (de nem chipen). A modern processzorok akár 6 MB-os L2-chip gyorsítótárral is fel vannak szerelve. Általában az ilyen térfogatot a processzor két magja között osztják fel Intel Core 2 duó pl. A normál L2 konfigurációk 512 KB vagy 1 MB gyorsítótárat biztosítanak magonként. A kisebb L2 gyorsítótárral rendelkező processzorok általában az alacsonyabb árszintbe tartoznak. Az alábbiakban a korai L2 gyorsítótár-megvalósítások diagramja látható.

A Pentium Pro processzorcsomagjában volt az L2 gyorsítótár. A Pentium III és az Athlon következő generációi az L2 gyorsítótárat külön SRAM chipeken keresztül valósították meg, ami akkoriban (1998, 1999) nagyon gyakori volt.

A 180 nm-ig terjedő technológiai technológia későbbi bejelentése lehetővé tette a gyártóknak, hogy végre integrálják az L2 gyorsítótárat a processzorlemezbe.


A korai kétmagos processzorok egyszerűen a meglévő terveket használták, amikor két szerszámot telepítettek egy csomagba. Az AMD bevezetett egy kétmagos processzort egy monolit matricán, hozzáadott egy memóriavezérlőt és egy kapcsolót, az Intel pedig egyszerűen összeszerelt két egymagos vágófejet egy csomagban az első kétmagos processzorához.


Első alkalommal kezdték el megosztani az L2 gyorsítótárat két bekapcsolt számítási mag között Core processzorok 2 duó. Az AMD továbbment, és a semmiből építette meg első négymagos Phenomját, míg az Intel ismét néhány vágófejet használt az első négymagos processzorához, ezúttal két kétmagos Core 2-es dimenziót, hogy csökkentsék a költségeket.

Az L3 gyorsítótár az Alpha 21165 processzor (96 kB, 1995-ben bevezetve) vagy az IBM Power 4 (256 kB, 2001) kezdetei óta létezik. Az x86-alapú architektúrákban azonban először jelent meg az L3 gyorsítótár Intel modellek Itanium 2, Pentium 4 Extreme (Gallatin, mindkét processzor 2003-ban) és Xeon MP (2006).

Az első megvalósítások csak egy újabb szintet biztosítottak a gyorsítótár-hierarchiában, bár a modern architektúrák az L3 gyorsítótárat nagy és megosztott pufferként használják a magok közötti adatcseréhez. többmagos processzorok. Ezt hangsúlyozza a magas n-fokú asszociativitás is. Jobb egy kicsit tovább keresni az adatokat a gyorsítótárban, mint olyan helyzetbe kerülni, amikor több mag nagyon lassú hozzáférést használ a fő RAM-hoz. Az AMD először az L3 gyorsítótárat mutatta be asztali processzoron a már említett Phenom vonal mellett. A 65 nm-es Phenom X4 2 MB megosztott L3 gyorsítótárat tartalmazott, míg a jelenlegi 45 nm-es Phenom II X4 6 MB megosztott L3 gyorsítótárat tartalmaz. Az Intel Core i7 és i5 processzorok 8 MB L3 gyorsítótárat használnak.

A modern négymagos processzorok külön L1 és L2 gyorsítótárral rendelkeznek minden maghoz, valamint egy nagy L3 gyorsítótárat, amelyet minden mag megoszt. Általános gyorsítótár Az L3 adatcserét is lehetővé tesz, amelyen a magok párhuzamosan dolgozhatnak.


Különféle feladatok végrehajtásakor a szükséges információblokkokat a RAM-ból megkapja a számítógép processzora. Ezek feldolgozása után a CPU a számítások eredményeit a memóriába írja, és a következő adatblokkokat fogadja feldolgozásra. Ez addig folytatódik, amíg a feladat be nem fejeződik.

A fenti folyamatokat nagyon nagy sebességgel hajtják végre. Azonban még a leggyorsabb RAM sebessége is lényegesen kisebb, mint bármely gyenge processzor sebessége. Minden egyes művelet, legyen az információ írása vagy olvasás belőle, sok időt vesz igénybe. A RAM sebessége tízszer kisebb, mint a processzor sebessége.

Az információfeldolgozás sebességének ilyen különbsége ellenére a PC processzora nem tétlen, és nem várja meg, hogy a RAM kiadja és fogadja az adatokat. A processzor mindig működik, és mindezt a gyorsítótár jelenlétének köszönhetően.

A gyorsítótár a RAM egy speciális fajtája. A processzor gyorsítótárat használ a számítógép fő RAM-jából származó információk azon másolatainak tárolására, amelyek a közeljövőben valószínűleg elérhetők lesznek.

Lényegében a cache memória nagy sebességű memóriapufferként működik, amely olyan információkat tárol, amelyekre a processzornak szüksége lehet. Így a processzor tízszer gyorsabban kapja meg a szükséges adatokat, mint a RAM-ból történő kiolvasáskor.

A fő különbség a gyorsítótár és a normál puffer között a beépített logikai funkciók. A puffer véletlenszerű adatokat tárol, amelyek feldolgozása általában az "első vétel, először kiadott" vagy "első vétel, utolsó kiadás" séma szerint történik. A gyorsítótár olyan adatokat tartalmaz, amelyekhez a közeljövőben valószínűleg hozzáférnek. Ezért az „okos gyorsítótárnak” köszönhetően a processzor teljes sebességgel tud működni, és nem várja meg, amíg a lassabb RAM-ból lekérik az adatokat.

Az L1 L2 L3 gyorsítótár fő típusai és szintjei

A gyorsítótár statikus véletlen elérésű memória (SRAM) chipek formájában készül, amelyekre telepítve van alaplap vagy a processzorba építve. Más típusú memóriákhoz képest a statikus memória nagyon nagy sebességgel tud működni.

A gyorsítótár sebessége egy adott chip térfogatától függ, minél nagyobb a chip térfogata, annál nehezebb elérni Magassebesség munkájáért. Tekintettel erre a tulajdonságra, a processzor gyártása során a gyorsítótár-memória több kis blokk, úgynevezett szint formájában történik. Manapság a legelterjedtebb a háromszintű gyorsítótárrendszer L1, L2, L3:

Az első szintű L1 gyorsítótár - a legkisebb térfogatú (csak néhány tíz kilobájt), de a leggyorsabb és a legfontosabb. A processzor által leggyakrabban használt adatokat tartalmazza, és késedelem nélkül fut. Általában az L1 memórialapkák száma megegyezik a processzormagok számával, és minden mag csak a saját L1 chipéhez fér hozzá.

L2 gyorsítótár sebességében gyengébb az L1 memóriánál, de a mennyiségben nyer, amit már több száz kilobájtban mérnek. Ideiglenes tárolásra szolgál. fontos információ, amelyhez való hozzáférés valószínűsége kisebb, mint az L1 gyorsítótárban tárolt információké.

Harmadik szintű L3 gyorsítótár - a három szint közül a legnagyobb volumenű (több tíz megabájtot is elérhet), ugyanakkor a leglassabb a sebessége is, ami még mindig jelentősen meghaladja a RAM sebességét. Az L3 gyorsítótár meg van osztva az összes processzormag között. Az L3 memóriaszint azon fontos adatok ideiglenes tárolására szolgál, amelyek elérésének valószínűsége valamivel kisebb, mint az első két L1, L2 szinten tárolt információé. Ez biztosítja a processzormagok egymás közötti kölcsönhatását is.

Egyes processzormodellek két szintű gyorsítótárral készülnek, amelyben az L2 egyesíti az L2 és L3 összes funkcióját.

Ha nagy mennyiségű gyorsítótár hasznos.

A nagy mennyiségű gyorsítótár jelentős hatást fog érezni archiváló programok használatakor, 3D játékokban, videófeldolgozás és kódolás során. A viszonylag "könnyű" programokban és alkalmazásokban a különbség gyakorlatilag nem észrevehető ( irodai programok, játékosok stb.).

Minden felhasználó jól ismeri a számítógép olyan elemeit, mint az adatok feldolgozásáért felelős processzor, valamint az ezek tárolásáért felelős véletlen hozzáférésű memória (RAM vagy RAM). De valószínűleg nem mindenki tudja, hogy van processzor-gyorsítótár (Cache CPU), vagyis magának a processzornak a RAM-ja (az úgynevezett szuper-RAM memória).

Mi az oka annak, hogy a számítógép-fejlesztők speciális memóriát használjanak a processzorhoz? Nem elég a RAM egy számítógéphez?

Igazán, hosszú ideje a személyi számítógépek mindenféle cache-memória nélkül működtek. De mint tudod, a processzor a személyi számítógép leggyorsabb eszköze, és sebessége a CPU minden új generációjával nőtt. Jelenleg sebességét másodpercenként milliárdnyi műveletben mérik. Ugyanakkor a szabványos RAM nem növelte jelentősen a teljesítményét fejlődése során.

Általánosságban elmondható, hogy a memóriachipekhez két fő technológia létezik: a statikus memória és a dinamikus memória. Anélkül, hogy szerkezetük részleteibe belemélyednénk, csak annyit mondunk, hogy a statikus emlékezet a dinamikus emlékezettel ellentétben nem igényel regenerációt; ezen kívül 4-8 tranzisztort használnak egy bit információhoz a statikus memóriában, míg 1-2 tranzisztort a dinamikus memóriában. Ennek megfelelően a dinamikus memória sokkal olcsóbb, mint a statikus memória, ugyanakkor sokkal lassabb. Jelenleg a RAM chipeket dinamikus memória alapján gyártják.

A processzorok sebessége és a RAM arányának hozzávetőleges alakulása:

Így, ha a processzor folyamatosan információt vesz a RAM-ból, akkor lassúra kell várnia dinamikus memória, és állandóan tétlen lenne. Ugyanebben az esetben, ha statikus memóriát használnának RAM-ként, akkor a számítógép költsége többszörösére nőne.

Ezért született egy ésszerű kompromisszum. A RAM nagy része dinamikus maradt, míg a processzor saját, statikus memóriachipekre épülő gyors gyorsítótárat kapott. A térfogata viszonylag kicsi - például az L2 gyorsítótár térfogata csak néhány megabájt. Itt azonban érdemes megjegyezni, hogy az első összes RAM-ja IBM számítógépek A számítógép 1 MB-nál kisebb volt.

Emellett a gyorsítótárazási technológia bevezetésének célszerűségét az is befolyásolja, hogy különböző alkalmazások, amelyek a RAM-ban vannak, különböző módon terhelik a processzort, és ennek eredményeként sok olyan adat van, amely elsőbbségi feldolgozást igényel a többihez képest.

A gyorsítótár története

Szigorúan véve, mielőtt a gyorsítótár a személyi számítógépekbe került volna, több évtizeden át sikeresen használták szuperszámítógépekben.

Először jelent meg egy mindössze 16 KB-os gyorsítótár az i80386 processzorra épülő PC-ben. A mai processzorok különböző szintű gyorsítótárat használnak, az elsőtől (a legkisebb méretű leggyorsabb gyorsítótár - általában 128 KB) a harmadikig (a legnagyobb méretű leglassabb gyorsítótár - akár több tíz MB-ig).

Eleinte a processzor külső cache memóriája külön chipen helyezkedett el. Ez azonban idővel oda vezetett, hogy a gyorsítótár és a processzor között elhelyezkedő busz szűk keresztmetszetté vált, lelassítva az adatcserét. A modern mikroprocesszorokban a cache memória első és második szintje is magában a processzormagban található.

Sokáig csak két szintű gyorsítótár volt a processzorokban, de az Intel Itanium CPU-ban először jelent meg egy harmadik szintű gyorsítótár, amely minden processzormagra jellemző. Vannak négyszintű gyorsítótárral rendelkező processzorok fejlesztései is.

A gyorsítótár működésének felépítése és elvei

Napjainkig a gyorsítótár-memória szervezésének két fő típusa ismert, amelyek a kibernetika területén az első elméleti fejlesztésekből – a Princeton és a Harvard architektúrákból – származnak. A Princeton architektúra egyetlen memóriaterületet foglal magában az adatok és parancsok tárolására, míg a Harvard architektúrája külön. A legtöbb processzor személyi számítógépek Az x86 sor külön gyorsítótártípust használ. Ráadásul be modern processzorok egy harmadik típusú gyorsítótár is megjelent - az úgynevezett asszociatív fordítási puffer, amelyet a címfordítás felgyorsítására terveztek virtuális memória operációs rendszer fizikai memóriacímeire.

Leegyszerűsítve a cache memória és a processzor közötti interakciós séma a következőképpen írható le. Először a processzor számára szükséges információk meglétét a leggyorsabban ellenőrzik - az első szintű gyorsítótárban, majd - a második szintű gyorsítótárban, és így tovább. Ha szükséges információ nincs gyorsítótár egyik szinten sem, akkor azt mondják hibáról, vagy cache missről. Ha egyáltalán nincs információ a gyorsítótárban, akkor a processzornak ki kell vennie azt a RAM-ból vagy akár a RAM-ból külső memória(Val vel merevlemez).

Az a sorrend, amelyben a processzor információt keres a memóriában:

A processzor így keres információt

A gyorsítótár működésének és a processzor számítási egységeivel, valamint a RAM-mal való interakciójának vezérlésére egy speciális vezérlő található.

A processzormag, a gyorsítótár és a RAM interakciójának megszervezésének sémája:

A gyorsítótár-vezérlő a legfontosabb kapcsolat a processzor, a RAM és a gyorsítótár között.

Meg kell jegyezni, hogy az adatgyorsítótár egy összetett folyamat, amely számos technológiát és matematikai algoritmust használ. A gyorsítótárazásban használt alapfogalmak közül kiemelhető a gyorsítótár írási módja és a cache memória asszociativitásának architektúrája.

Gyorsítótár írási módszerek

Két fő módszer létezik az információk gyorsítótárba írására:

  1. Visszaírási módszer (fordított írás) - az adatok először a gyorsítótárba íródnak, majd mikor bizonyos feltételekés a RAM-ban.
  2. Az átírási módszer (íráson keresztül) - az adatok egyszerre íródnak a RAM-ba és a gyorsítótárba.

Gyorsítótár asszociativitási architektúra

A gyorsítótár asszociativitási architektúrája határozza meg a RAM-ból származó adatok gyorsítótárhoz való hozzárendelésének módját. A gyorsítótárazási asszociativitás architektúrának a következő fő változatai vannak:

  1. Közvetlenül leképezett gyorsítótár - a gyorsítótár egy meghatározott területe felelős a RAM egy meghatározott területéért
  2. Teljesen asszociatív gyorsítótár – bármely gyorsítótár-terület társítható bármely RAM-területhez
  3. Vegyes gyorsítótár (készlet-asszociatív)

A különböző gyorsítótár-asszociációs architektúrák jellemzően különböző gyorsítótárszinteken használhatók. A közvetlen RAM-leképezett gyorsítótár a leggyorsabb gyorsítótárazási lehetőség, ezért ezt az architektúrát általában nagy gyorsítótárak esetén használják. Egy teljesen asszociatív gyorsítótár viszont kevesebb gyorsítótári hibával (kihagyással) rendelkezik.

Következtetés

Ebben a cikkben megismerkedett a gyorsítótár-memória fogalmával, a gyorsítótár-architektúrával és a gyorsítótárazási módszerekkel, megtudta, hogyan befolyásolja ez egy modern számítógép teljesítményét. A cache memória jelenléte jelentősen optimalizálhatja a processzor teljesítményét, csökkentheti az üresjárati idejét, és ennek következtében növelheti a teljes rendszer teljesítményét.

A 90-es évek vége óta minden processzor rendelkezik belső gyorsítótárral (vagy csak gyorsítótárral). A gyorsítótár egy nagy sebességű memória, amely a processzor által közvetlenül feldolgozott utasításokat és adatokat továbbítja.

A modern processzorok kétszintű beépített gyorsítótárral rendelkeznek - az első (L1) és a második (L2). Az L1 gyorsítótár tartalmával a processzor valamivel gyorsabb, az L2 gyorsítótár pedig általában valamivel nagyobb. A cache-memória elérése várakozási állapot nélkül történik, pl. Az első szintű gyorsítótár (a chip gyorsítótár) ugyanazon a frekvencián fut, mint a processzor.

Ez azt jelenti, hogy ha a processzor számára szükséges adatok a gyorsítótárban vannak, akkor nincs késés a feldolgozásban. Ellenkező esetben a processzornak adatokat kell kapnia a fő memóriából, ami jelentősen csökkenti a rendszer teljesítményét.

Annak érdekében, hogy minőségileg megértsük mindkét szintű gyorsítótár működési elvét, nézzünk meg egy hazai helyzetet egy példa segítségével.

Minden nap, ugyanabban az időben jössz a kávézóba ebédelni, és mindig ugyanahhoz az asztalhoz ülsz. Mindig rendelj standard készlet három tanfolyamból.

A pincér kiszalad a konyhába, a séf tálcára teszi, majd hozzák a rendelésedet. És így mondjuk a harmadik napon a pincér, hogy ne szaladjon még egyszer a konyhába, a megbeszélt időpontban egy kész meleg ebéddel tálcán találkozik.

Nem vár a rendelésre, és sok időt takarít meg. Az edényeket tartalmazó tálca az első szintű gyorsítótár. De a negyedik napon hirtelen egy újabb ételt, mondjuk desszertet akarsz hozzáadni.

Bár a megbeszélt időpontban már várt rád egy tálcás rendeléssel, a pincérnek mégis a konyhába kellett futnia desszertért.

Az ötödiken pedig ismét egy három tételből álló menü. A hatodikán - ismét egy desszert, de különbözik az előzőtől. A pincér pedig, mivel nem tudja, milyen desszertet szeretne rendelni (és egyáltalán nem tudja, hogy fog-e rendelni valamit), úgy dönt, megteszi a következő lépést: az asztala mellé tesz egy szekrényt, ahol többféle desszert található.

És ha kifejezi a vágyát, minden kéznél van, nem kell a konyhába rohannia. A desszerttároló egy második szintű gyorsítótár.

Az L1 gyorsítótár mérete (16-128 KB) és az L2 (64 KB-tól 512 KB-ig, a Pentium III Cheop és az AMD Opteron esetében akár 4 MB) jelentősen befolyásolja a processzor teljesítményét.

Az Intel Pentium III processzorok és az erre épülő Celeron processzorok L1 gyorsítótár mérete 32 KB. Az Intel Pentium 4, valamint az arra épülő Celeron és Cheop verziók mindössze 20 KB-osak. AMD processzorok A Duron, az Athlon (beleértve az XP/MP-t) és az Opteron, valamint a VIA S3 128 KB L1 gyorsítótárat tartalmaz.

A modern kétmagos processzorok minden maghoz külön-külön rendelkeznek első szintű gyorsítótárral, így néha a 128x2-es számot láthatjuk a gyorsítótár leírásában. Ez azt jelenti, hogy minden processzormag 128 KB L1 gyorsítótárral rendelkezik.

Az L1 gyorsítótár mérete fontos a nagy teljesítmény eléréséhez a legtöbb gyakori feladatban ( irodai alkalmazások, játékok, a legtöbb szerveralkalmazás stb.). Hatékonysága különösen hangsúlyos a streaming számításoknál (például videó képfeldolgozásnál).

Többek között ez az egyik oka annak, hogy a Pentium 4 viszonylag alacsony hatékonyságú a legtöbb általános alkalmazáshoz (bár ezt kompenzálja a magas órajel). Az L1 gyorsítótár mindig a processzor belső frekvenciáján működik (információt cserél a processzormaggal).

Ezzel szemben az L2 gyorsítótár be különböző modellek processzorok különböző frekvenciákon (és ennek megfelelően a teljesítményen) működnek. Az Intel Pentium II-től kezdve sok processzor L2 gyorsítótárat használt, amely a processzor belső frekvenciájának felével futott.

Ezt a megoldást az elavult Intel Pentium III processzorok (550 MHz-ig) és az elavult AMD Athlon processzorok használják (egyeseknél a belső L2 gyorsítótár a processzormag frekvenciájának harmadán működött). Az L2 gyorsítótár mennyisége is eltérő a különböző processzoroknál.

A régebbi és néhány újabb Intel Pentium III processzor 512 KB L2 gyorsítótárral rendelkezik, míg a többi Pentium III 256 KB. A Pentium III alapú Intel Celeron processzor 128 és 256 KB L2 gyorsítótárral érkezett, míg a Pentium 4 alapú processzor csak 128 KB-val. Az Intel Pentium 4 Xeon változatának különböző változatai akár 4 MB L2 gyorsítótárral is rendelkeznek.

Az új Pentium 4 processzorok (egyes sorozatok 2000 MHz-es frekvenciájúak, és mindegyik magasabb frekvenciára) 512 KB L2 gyorsítótárral rendelkezik, a Pentium 4 többi része 256 KB-os. A (Pentium 4-en alapuló) Cheop processzorok 256 vagy 512 KB L2 gyorsítótárral rendelkeznek.

Ezen kívül a harmadik szintű L3 cache memóriával is rendelkeznek. Az integrált L3 gyorsítótár a gyors rendszerbusszal kombinálva nagy sebességű adatkapcsolatot képez a rendszermemóriával.

Általános szabály, hogy csak a szervermegoldások processzorai vagy az „asztali” processzorok speciális modelljei vannak felszerelve L3 gyorsítótárral. Az L3 cache memóriát például olyan processzorsorok birtokolják, mint a Xeon DP, Itanium 2, Xeon MP.

Az AMD Duron processzor 128 KB L1 gyorsítótárral és 64 KB L2 gyorsítótárral rendelkezik. Az Athlon processzorok (kivéve a régebbieket), az Athlon MP és a legtöbb Athlon XP változat 128 KB L1 gyorsítótárral és 256 KB L2 gyorsítótárral, a legújabb Athlon XP (2500+, 2800+, 3000+ és újabb) pedig 512 KB L2 gyorsítótárral rendelkezik. . Az AMD Opteron 1 MB L2 gyorsítótárat tartalmaz.

Az Intel Pentium D, Intel Pentium M, Intel Core 2 Duo processzorok legújabb modelljei 6 MB L2 gyorsítótárral, a Core 2 Quad pedig 12 MB L2 gyorsítótárral érkeznek.

A legújabb Intel Core i7 processzor ebben az írásban 64 KB L1 gyorsítótárral rendelkezik mind a 4 maghoz, és 256 KB L2 memóriával minden maghoz. Az első és a második szint cache memóriája mellett a processzornak van egy közös gyorsítótára is a harmadik szint összes magjához, ami 8 MB-nak felel meg.

Olyan processzorokhoz, amelyek eltérő L2 gyorsítótár méretűek lehetnek (vagy abban az esetben Intel Xeon MP - L3) ugyanarra a modellre, ezt a méretet eladáskor kell megadni (persze a processzor ára ettől függ). Ha a processzort "dobozos" kiszerelésben árulják (dobozba szállítás), az általában a gyorsítótár méretét jelzi.

A normál felhasználói feladatoknál (beleértve a játékokat is) az L2 gyorsítótár sebessége fontosabb, mint a mérete; szerverfeladatoknál éppen ellenkezőleg, a hangerő fontosabb. A legproduktívabb szerverek, különösen azok, amelyek nagy mennyiségű (több gigabájt) RAM-mal rendelkeznek, a maximális mennyiséget és csúcssebesség L2 gyorsítótár.

A Pentium III processzorok Cheop változatai továbbra is felülmúlhatatlanok ezekben a paraméterekben. ( Xeon processzor Az MP még mindig termelékenyebb a szerverfeladatokban, mint a Pentium III Xeon, magának a processzornak és a memóriabusznak a magasabb órajelének köszönhetően. , valamint lehetővé teszi az adatfeldolgozás során fellépő várakozási idő minimalizálását is. Ebben a döntő szerepet a processzorchipben elhelyezett második szintű cache memória játssza.

Melyik a legpiszkosabb hely a számítógépen? kosárra gondolsz? Felhasználói mappák? Hűtőrendszer? Nem tippeltem! A legpiszkosabb hely a gyorsítótár! Hiszen állandóan takarítani kell!

Valójában a számítógépeken sok gyorsítótár található, és nem hulladéklerakóként szolgálnak, hanem a berendezések és alkalmazások gyorsítójaként. Honnan származik a "szisztémás szemétcsatorna" hírnevük? Nézzük meg időről időre, mi az a gyorsítótár, hogyan történik, hogyan működik és miért.

A cache memória fogalma és típusai

Az Esh vagy cache memória a gyakran használt adatok speciális tárolója, amelyhez több tíz-, száz- és ezerszer gyorsabban lehet hozzáférni, mint a RAM-hoz vagy más adathordozóhoz.

Az alkalmazások (webböngészők, audio- és videolejátszók, adatbázis-szerkesztők stb.), operációs rendszer-összetevők (bélyegkép-gyorsítótár, DNS-gyorsítótár) és hardver (CPU L1-L3 gyorsítótár, GPU-framebuffer stb.) saját gyorsítótárral rendelkeznek. meghajtó pufferek). Különféle módon valósítják meg - szoftveresen és hardveresen.

  • A program-gyorsítótár csak egy különálló mappa vagy fájl, ahová például letölthetők a meglátogatott oldalak képei, menüi, szkriptjei, multimédiás tartalmai és egyéb tartalmai. Ez az a mappa, ahová a böngésző először belép, amikor újra megnyit egy weboldalt. Néhány tartalom cseréje innen helyi raktár felgyorsítja a betöltését és .

  • A merevlemezeken különösen a gyorsítótár egy különálló, 1-256 Mb kapacitású RAM chip, amely az elektronikai kártyán található. A mágneses rétegből kiolvasott és a RAM-ba még nem betöltött információkat kap, valamint a leggyakrabban kért adatokat operációs rendszer.

  • Modern processzor 2-3 fő gyorsítótár-memóriát (más néven scratch-memóriát) tartalmaz, amelyek hardvermodulok formájában vannak elhelyezve ugyanazon a chipen. A leggyorsabb és legkisebb mennyiségben (32-64 Kb) az 1-es gyorsítótárszint (L1) – ugyanazon a frekvencián fut, mint a processzor. Az L2 sebesség és kapacitás tekintetében a középső helyen áll (128 Kb-tól 12 Mb-ig). És az L3 a leglassabb és legterjedelmesebb (legfeljebb 40 Mb), bizonyos modelleken hiányzik. Az L3 sebessége csak alacsony gyorsabb társaihoz képest, de több százszor gyorsabb, mint a legproduktívabb RAM.

A processzor scratchpad memóriája a folyamatosan használt, RAM-ból pumpált adatok és gépi kód utasítások tárolására szolgál. Minél nagyobb, annál gyorsabb a processzor.

Manapság a gyorsítótárazás három szintje már nem jelenti a határt. A Sandy Bridge architektúra megjelenésével az Intel egy további (a visszafejtett mikroutasítások tárolására szolgáló) gyorsítótárat vezetett be a termékeibe. A legnagyobb teljesítményű CPU-k pedig negyedik szintű gyorsítótárral is rendelkeznek, külön mikroáramkör formájában.

Sematikusan a cache L0-L3 szintek interakciója így néz ki (például Intel Xeon):

Emberi nyelv arról, hogyan működik mindez

A gyorsítótár működésének megértéséhez képzeljünk el egy embert, aki egy asztalnál dolgozik. A folyamatosan használt mappák és dokumentumok az asztalon vannak ( gyorsítótárban). Ahhoz, hogy hozzáférjen hozzájuk, csak nyújtsa ki a kezét.

A papírok, amelyekre ritkábban van szüksége, a közelben, a polcokon tárolódnak ( RAM-ban). Ahhoz, hogy megszerezze őket, fel kell állnia, és néhány métert gyalogolnia kell. És amivel egy személy jelenleg nem dolgozik, az archiválásra került ( merevlemezre rögzítve).

Minél szélesebb az asztal, annál több dokumentum fér el rajta, ami azt jelenti, hogy a munkavállaló át tudja venni gyors hozzáférés további információkhoz minél nagyobb a gyorsítótár kapacitása, elméletileg annál gyorsabban működik a program vagy eszköz).

Néha hibázik – olyan papírokat tart az asztalon, amelyek téves információkat tartalmaznak, és ezeket felhasználja munkája során. Ennek eredményeként a munkája minősége romlik ( a gyorsítótár hibák szoftver- és hardverhibákhoz vezetnek). A helyzet kijavításához a munkavállalónak ki kell dobnia a hibás dokumentumokat, és a megfelelőket a helyükre kell tennie ( cache memória törlése).

Az asztal korlátozott területű ( a gyorsítótár korlátozott). Néha bővíthető például egy második tábla mozgatásával, néha nem (a gyorsítótár mérete növelhető, ha a program ilyen lehetőséget biztosít; a hardveres gyorsítótár nem módosítható, mivel hardverben van megvalósítva) .

Egy másik módja annak, hogy felgyorsítsuk a hozzáférést több dokumentumhoz, mint amennyit a táblázat elfér, ha keresünk egy asszisztenst, aki a polcról kiszolgálja a papírt a dolgozónak (az operációs rendszer a fel nem használt RAM egy részét lefoglalhatja az eszközadatok gyorsítótárazására). De még mindig lassabb, mint levenni őket az asztalról.

A kéznél lévő dokumentumoknak relevánsaknak kell lenniük az aktuális feladatokhoz. Ez magának a munkavállalónak a felelőssége. Rendszeresen takarítani kell a papírokat (a cache-memóriából az irreleváns adatok kinyomtatása az azt használó alkalmazások "vállára" esik; egyes programoknak van automatikus gyorsítótár-ürítési funkciója).

Ha a dolgozó elfelejti a munkahelyi rendet és a dokumentációt naprakészen tartani, készíthet magának asztaltakarítási ütemtervet, és azt emlékeztetőül használhatja. Legvégső esetben ezt bízza egy asszisztensre (ha egy gyorsítótár-memóriától függő alkalmazás lassabb lett, vagy gyakran tölt be elavult adatokat, használjon ütemezett gyorsítótár-tisztító eszközöket, vagy tegye ezt manuálisan néhány naponta).

Valójában mindenhol találkozunk "gyorsítótárazási funkciókkal". Ez a jövőre szánt termékek vásárlása, és különféle műveletek, amelyeket futólag, egy időben végzünk, stb. Valójában ez minden, ami megkímél minket a felesleges nyüzsgéstől és a felesleges testmozgásoktól, egyszerűsíti az életet és megkönnyíti a munkát. A számítógép is ezt teszi. Egyszóval, ha nem lenne gyorsítótár, akkor százszor és ezerszer lassabban működne. És nekünk nem tetszene.

Bővebben az oldalon:

Mi az a gyorsítótár, miért van rá szükség és hogyan működik frissítette: 2017. február 25-én: Johnny Mnemonic