pole RAID. co to je? Proč? A jak tvořit?

Během dlouhých desetiletí vývoje počítačového průmyslu prošly prostředky pro ukládání informací pro počítače seriózní evoluční cestou vývoje. Děrné pásky a děrné štítky, magnetické pásky a bubny, magnetické, optické a magneto-optické disky, polovodičové mechaniky - to je jen krátký výčet již vyzkoušených technologií. V současné době se laboratoře po celém světě pokoušejí vytvořit holografická a kvantová paměťová zařízení, která výrazně zvýší hustotu záznamu a spolehlivost jeho úložiště.

Mezitím zůstaly pevné disky po dlouhou dobu nejběžnějším prostředkem pro ukládání informací v osobním počítači. Jinak se dají nazvat HDD (pevné magnetické diskové jednotky), pevné disky, pevné disky, ale podstata se změnou názvu nemění – jde o mechaniky s balíčkem magnetických disků v jediném pouzdře.

První pevný disk s názvem IBM 350 byl sestaven 10. ledna 1955 v laboratoři americké společnosti IBM. S velikostí dobré skříně a hmotností tuny by tento pevný disk pojal pět megabajtů informací. Z moderního pohledu se takový svazek nedá nazvat ani vtipným, ale při masovém používání děrných štítků a magnetických pásek se sériovým přístupem se jednalo o kolosální technologický průlom.


Vyložení prvního pevného disku IBM 350 z letadla

Od toho dne uplynulo necelých šest desetiletí, ale nyní už nikoho nepřekvapíte pevným diskem vážícím méně než dvě stě gramů, délkou deset centimetrů a objemem informací v řádu několika terabajtů. Technologie záznamu, ukládání a čtení dat se přitom nijak neliší od té, která se používá u IBM 350 – stejné magnetické destičky a čtecí/zapisovací hlavy se vysouvají nad nimi.


Vývoj pevných disků na pozadí palcového pravítka (foto z " Wikipedie " )

Bohužel jsou to právě vlastnosti této technologie, které způsobují dva hlavní problémy spojené s používáním pevných disků. Prvním z nich je příliš nízká rychlost zápisu, čtení a přenosu informací z disku do procesoru. V moderním počítači je to pevný disk, který je nejpomalejším zařízením, které často určuje výkon celého systému jako celku.

Druhým problémem je nedostatečné zabezpečení informací uložených na pevném disku. Pokud se vám rozbije pevný disk, můžete nenávratně ztratit všechna data na něm uložená. A je dobré, když se ztráty omezí na ztrátu rodinného fotoalba (i když ve skutečnosti je v tom málo dobrého). Zničení důležitých finančních a marketingových informací může způsobit kolaps podniku.

Částečně pomáhá chránit uložené informace pravidelné zálohování všech nebo pouze důležitých dat na pevný disk. Ale i v tomto případě, pokud dojde k poruše, dojde ke ztrátě části dat, která byla aktualizována od poslední zálohy.

Naštěstí existují metody, které mohou pomoci překonat výše uvedené nevýhody tradičních pevných disků. Jednou z takových metod je vytvoření polí RAID z několika pevných disků.

Co je RAID

Na internetu a dokonce i v moderní počítačové literatuře se můžete často setkat s pojmem „RAID pole“, což je vlastně tautologie, protože zkratka RAID (redundant array of independent disks) již znamená „redundantní pole nezávislých disků“.

Název plně prozrazuje fyzický význam takových polí – jedná se o sadu dvou nebo více pevných disků. Společný chod těchto disků je řízen speciálním ovladačem. V důsledku činnosti ovladače jsou taková pole operačním systémem vnímána jako jeden pevný disk a uživatel nemusí přemýšlet o nuancích správy provozu každého pevného disku samostatně.

Existuje několik hlavních typů RAID, z nichž každý má jiný vliv na celkovou spolehlivost a rychlost pole ve srovnání s jednotlivými disky. Označují se konvenčním číslem od 0 do 6. Podobné označení s podrobným popisem architektury a principu fungování polí navrhli specialisté z Kalifornské univerzity v Berkeley. Kromě hlavních sedmi typů RAID jsou možné i jejich různé kombinace. Zvažme je dále.

Jedná se o nejjednodušší typ pole pevných disků, jehož hlavním účelem je zvýšení výkonu diskového subsystému počítače. Toho je dosaženo rozdělením proudů zapsaných (čtených) informací do několika dílčích proudů, které jsou současně zapisovány (čteny) na několik pevných disků. V důsledku toho se celková rychlost výměny informací například u dvoudiskových polí zvyšuje o 30–50 % ve srovnání s jedním pevným diskem stejného typu.

Celkový objem pole RAID 0 se rovná součtu objemů pevných disků, které jsou v něm obsaženy. Informace jsou rozděleny do datových bloků pevné délky bez ohledu na délku zaznamenaných souborů.

Hlavní výhodou RAID 0 je výrazné zvýšení rychlosti výměny informací mezi diskovým systémem bez ztráty užitečné kapacity pevných disků. Nevýhodou je snížení celkové spolehlivosti úložného systému. Pokud některý z disků RAID 0 selže, všechny informace zaznamenané v poli jsou navždy ztraceny.

Podobně jako u výše uvedeného je tento typ pole také nejjednodušší na organizaci. Je postaven na základě dvou pevných disků, z nichž každý je přesným (zrcadlovým) odrazem toho druhého. Informace se zapisují paralelně na oba disky v poli. Data jsou čtena současně z obou disků v sekvenčních blocích (požadavek paralelizace), což má za následek mírné zvýšení rychlosti čtení ve srovnání s jedním pevným diskem.

Celková kapacita RAID 1 se rovná kapacitě menšího pevného disku v poli.

Výhody RAID 1: vysoká spolehlivost úložiště informací (data nejsou poškozena, pokud je alespoň jeden z disků v poli neporušený) a určité zvýšení rychlosti čtení. Nevýhodou je, že při koupi dvou pevných disků získáte použitelnou kapacitu pouze jednoho. I přes ztrátu poloviny užitečného objemu jsou „zrcadlová“ pole poměrně oblíbená díky vysoké spolehlivosti a relativně nízké ceně – pár disků je stále levnější než čtyři nebo osm.

Při konstrukci těchto polí se používá algoritmus obnovy informací využívající Hammingovy kódy (americký inženýr, který tento algoritmus vyvinul v roce 1950 k opravě chyb v činnosti elektromechanických počítačů). Pro zajištění chodu tohoto RAID řadiče jsou vytvořeny dvě skupiny disků – jedna pro ukládání dat, druhá skupina pro ukládání kódů opravy chyb.

Tento typ RAID se v domácích systémech méně rozšířil kvůli přílišné redundanci počtu pevných disků – například v poli sedmi pevných disků budou pro data přiděleny pouze čtyři. S rostoucím počtem disků se redundance snižuje, což se odráží v tabulce níže.

Hlavní výhodou RAID 2 je schopnost opravovat chyby za chodu bez snížení rychlosti výměny dat mezi diskovým polem a centrálním procesorem.

RAID 3 a RAID 4

Tyto dva typy diskových polí jsou si designově velmi podobné. Oba používají k ukládání informací více pevných disků, z nichž jeden se používá výhradně pro ukládání kontrolních součtů. K vytvoření RAID 3 a RAID 4 stačí tři pevné disky. Na rozdíl od RAID 2 není obnova dat za chodu možná – informace jsou obnoveny po výměně vadného pevného disku po určitou dobu.

Rozdíl mezi RAID 3 a RAID 4 je v úrovni rozdělení dat. V RAID 3 jsou informace rozloženy na jednotlivé bajty, což vede k vážnému zpomalení při zápisu/čtení velkého množství malých souborů. RAID 4 rozděluje data do samostatných bloků, jejichž velikost nepřesahuje velikost jednoho sektoru na disku. V důsledku toho se zvyšuje rychlost zpracování malých souborů, což je pro osobní počítače kritické. Z tohoto důvodu se RAID 4 rozšířil.

Významnou nevýhodou uvažovaných polí je zvýšené zatížení pevného disku určeného pro ukládání kontrolních součtů, což výrazně snižuje jeho zdroje.

Disková pole tohoto typu jsou vlastně vývojem schématu RAID 3/RAID 4. Charakteristickým rysem je, že pro ukládání kontrolních součtů není použit samostatný disk - jsou rovnoměrně rozloženy na všechny pevné disky pole. Výsledkem distribuce je možnost paralelního záznamu na více disků najednou, což mírně zvyšuje rychlost výměny dat ve srovnání s RAID 3 nebo RAID 4. Tento nárůst však není tak výrazný, protože další systémové prostředky jsou vynakládány na výpočet kontrolní součty pomocí operace „exclusive or“. Současně se výrazně zvyšuje rychlost čtení, protože je možná jednoduchá paralelizace procesu.

Minimální počet pevných disků pro sestavení RAID 5 jsou tři.

Pole sestavená pomocí schématu RAID 5 mají velmi významnou nevýhodu. Pokud některý disk po výměně selže, úplné obnovení informací trvá několik hodin. V tuto chvíli pracují neporušené pevné disky pole v super intenzivním režimu, což výrazně zvyšuje pravděpodobnost selhání druhého disku a úplné ztráty informací. I když je to vzácné, stává se to. Během obnovy RAID 5 je navíc pole tímto procesem téměř zcela obsazeno a probíhající operace zápisu/čtení jsou prováděny s velkým zpožděním. I když to pro většinu běžných uživatelů není kritické, v podnikovém sektoru mohou taková zpoždění vést k určitým finančním ztrátám.

Do značné míry je výše uvedený problém řešen konstrukcí polí pomocí schématu RAID 6. V těchto strukturách je pro ukládání kontrolních součtů alokován objem paměti rovnající se objemu dvou pevných disků, které jsou navíc cyklicky a rovnoměrně distribuovány na různé disky. . Místo jednoho se počítají dva kontrolní součty, což zaručuje integritu dat v případě současného selhání dvou pevných disků v poli.

Výhody RAID 6 jsou vysoký stupeň zabezpečení informací a menší ztráta výkonu než u RAID 5 při obnově dat při výměně poškozeného disku.

Nevýhodou RAID 6 je snížení celkové rychlosti výměny dat přibližně o 10 % z důvodu zvýšení objemu nutných výpočtů kontrolních součtů a také z důvodu zvýšení objemu zapisovaných/čtených informací.

Kombinované typy RAID

Kromě hlavních typů diskutovaných výše jsou široce používány jejich různé kombinace, které kompenzují určité nevýhody jednoduchého RAID. Rozšířené je zejména použití schémat RAID 10 a RAID 0+1. V prvním případě se spojí dvojice zrcadlených polí do RAID 0, ve druhém se naopak dva RAID 0 spojí do zrcadla. V obou případech se k informační bezpečnosti RAID 1 přidává zvýšený výkon RAID 0.

Často se pro zvýšení úrovně ochrany důležitých informací používají konstrukční schémata RAID 51 nebo RAID 61 - zrcadlení již vysoce chráněných polí zajišťuje výjimečnou bezpečnost dat v případě jakýchkoli poruch. Je však nepraktické implementovat taková pole doma kvůli nadměrné redundanci.

Stavba diskového pole - od teorie k praxi

Specializovaný řadič RAID je zodpovědný za vytváření a správu provozu jakéhokoli RAID. K velké úlevě běžného uživatele osobních počítačů jsou ve většině moderních základních desek tyto řadiče již implementovány na úrovni jižního můstku čipové sady. Chcete-li tedy sestavit pole pevných disků, stačí si jich zakoupit požadovaný počet a v příslušné části nastavení systému BIOS určit požadovaný typ pole RAID. Poté místo několika pevných disků v systému uvidíte pouze jeden, který lze v případě potřeby rozdělit na oddíly a logické jednotky. Upozorňujeme, že uživatelé, kteří stále používají systém Windows XP, budou muset nainstalovat další ovladač.

Externí řadič RAID se čtyřmi porty SATA

Všimněte si, že integrované řadiče jsou zpravidla schopny vytvářet RAID 0, RAID 1 a jejich kombinace. Vytváření složitějších polí bude stále vyžadovat zakoupení samostatného ovladače.

A na závěr ještě jedna rada – pro vytvoření RAID si pořiďte pevné disky stejné kapacity, stejného výrobce, stejného modelu a nejlépe ze stejné šarže. Pak budou vybaveny stejnými logickými sadami a provoz pole těchto pevných disků bude nejstabilnější.

NÁLET(Angličtina) redundantní pole nezávislých disků - redundantní pole nezávislých pevných disků)- pole několika disků řízených řadičem, propojených vysokorychlostními kanály a vnímaných externím systémem jako jeden celek. V závislosti na typu použitého pole může poskytovat různé stupně odolnosti proti chybám a výkonu. Slouží ke zvýšení spolehlivosti ukládání dat a/nebo ke zvýšení rychlosti čtení/zápisu informací. Zpočátku byla taková pole stavěna jako záloha pro média založená na paměti RAM (random access memory), což bylo v té době drahé. Postupem času tato zkratka získala druhý význam - pole se již skládalo z nezávislých disků, což znamenalo použití několika disků, spíše než rozdělení jednoho disku, a také vysoké náklady (nyní relativně jen několik disků) zařízení nutné vybudovat právě toto pole.

Podívejme se, jaká pole RAID existují. Nejprve se podívejme na úrovně, které představili vědci z Berkeley, poté na jejich kombinace a neobvyklé režimy. Stojí za zmínku, že pokud se používají disky různých velikostí (což se nedoporučuje), budou pracovat s nejmenším objemem. Extra kapacita velkých disků prostě nebude k dispozici.

RAID 0. Prokládané diskové pole bez odolnosti proti chybám/parity (Stripe)

Jde o pole, kde jsou data rozdělena do bloků (velikost bloku lze nastavit při vytváření pole) a následně zapsána na samostatné disky. V nejjednodušším případě jsou disky dva, jeden blok se zapíše na první disk, další na druhý, pak znovu na první a tak dále. Tento režim se také nazývá „prokládání“, protože při zápisu bloků dat se prokládají disky, na které se záznam provádí. Podle toho jsou bloky také čteny jeden po druhém. Tímto způsobem jsou I/O operace prováděny paralelně, což vede k lepšímu výkonu. Pokud jsme dříve mohli číst jeden blok za jednotku času, nyní to můžeme udělat z několika disků najednou. Hlavní výhodou tohoto režimu je vysoká rychlost přenosu dat.

Zázraky se však nedějí, a pokud ano, jsou vzácné. Výkon se nezvýší Nkrát (N je počet disků), ale méně. Za prvé, doba přístupu k disku se Nkrát prodlouží, což je již tak vysoké v porovnání s jinými počítačovými subsystémy. Neméně důležitý vliv má i kvalita regulátoru. Pokud to není nejlepší, pak se rychlost může sotva znatelně lišit od rychlosti jednoho disku. No a podstatný vliv má rozhraní, kterým je RAID řadič propojen se zbytkem systému. To vše může vést nejen ke zvýšení lineární rychlosti čtení, která je menší než N, ale také k omezení počtu disků, nad které již nebude navýšení vůbec. Nebo naopak mírně sníží rychlost. V reálných úlohách s velkým množstvím požadavků je šance setkat se s tímto jevem minimální, protože rychlost je velmi omezena samotným pevným diskem a jeho možnostmi.

Jak vidíte, v tomto režimu neexistuje žádná redundance jako taková. Je využito veškeré místo na disku. Pokud však jeden z disků selže, je zřejmé, že všechny informace jsou ztraceny.

RAID 1. Zrcadlení

Podstatou tohoto režimu RAID je vytvoření kopie (zrcadlení) disku za účelem zvýšení odolnosti proti chybám. Pokud jeden disk selže, pak se práce nezastaví, ale pokračuje, ale s jedním diskem. Tento režim vyžaduje sudý počet disků. Myšlenka této metody se blíží zálohování, ale vše se děje za běhu, stejně jako obnova po selhání (což je někdy velmi důležité) a není třeba s tím ztrácet čas.

Nevýhody: vysoká redundance, protože k vytvoření takového pole potřebujete dvakrát tolik disků. Další nevýhodou je, že nedochází k žádnému nárůstu výkonu – na druhý disk se totiž jednoduše zapíše kopie dat z prvního.

Pole RAID 2 využívající Hammingův kód odolný proti chybám.

Tento kód umožňuje opravit a odhalit dvojité chyby. Aktivně se používá v paměti pro opravu chyb (ECC). V tomto režimu jsou disky rozděleny do dvou skupin – jedna část slouží pro ukládání dat a funguje podobně jako RAID 0, rozděluje datové bloky na různé disky; druhá část slouží k uložení ECC kódů.

Mezi výhody patří oprava chyb za chodu a vysoká rychlost streamování dat.

Hlavní nevýhodou je vysoká redundance (při malém počtu disků je téměř dvojnásobná, n-1). S rostoucím počtem disků se zmenšuje specifický počet disků, na kterých jsou uloženy kódy ECC (snižuje se specifická redundance). Druhou nevýhodou je nízká rychlost práce s malými soubory. Kvůli své objemnosti a vysoké redundanci s malým počtem disků se tato úroveň RAID v současnosti nepoužívá a ustoupila vyšším úrovním.

RAID 3. Pole odolné proti chybám s prokládáním bitů a paritou.

Tento režim zapisuje data blok po bloku na různé disky, jako je RAID 0, ale pro paritní úložiště používá jiný disk. Redundance je tedy mnohem nižší než u RAID 2 a jedná se pouze o jeden disk. Pokud selže jeden disk, rychlost zůstává prakticky nezměněna.

Mezi hlavní nevýhody bychom měli zaznamenat nízkou rychlost při práci s malými soubory a mnoha požadavky. To je způsobeno tím, že všechny řídicí kódy jsou uloženy na jednom disku a musí být přepsány během I/O operací. Rychlost tohoto disku omezuje rychlost celého pole. Paritní bity se zapisují pouze při zápisu dat. A při čtení se kontrolují. Z tohoto důvodu existuje nerovnováha v rychlosti čtení/zápisu. Jednorázové čtení malých souborů se také vyznačuje nízkou rychlostí, což je způsobeno nemožností paralelního přístupu z nezávislých disků, když různé disky vykonávají požadavky paralelně.

RAID 4

Data se zapisují po blocích na různé disky, jeden disk se používá k ukládání paritních bitů. Rozdíl oproti RAID 3 je v tom, že bloky nejsou rozděleny na bity a bajty, ale na sektory. Mezi výhody patří vysoká přenosová rychlost při práci s velkými soubory. Vysoká je také rychlost práce s velkým počtem požadavků na čtení. Mezi nedostatky můžeme zaznamenat ty zděděné z RAID 3 - nerovnováhu v rychlosti operací čtení/zápisu a existenci podmínek, které ztěžují paralelní přístup k datům.

RAID 5. Diskové pole s prokládáním a distribuovanou paritou.

Metoda je podobná předchozí, ale místo přidělení samostatného disku pro paritní bity jsou tyto informace distribuovány mezi všechny disky. To znamená, že pokud se použije N disků, pak bude k dispozici kapacita N-1 disků. Objem jedna bude přidělen pro paritní bity, jako v RAID 3.4. Ale nejsou uloženy na samostatném disku, ale odděleně. Každý disk má (N-1)/N množství informací a 1/N množství je vyplněno paritními bity. Pokud jeden disk v poli selže, zůstává funkční (data na něm uložená se počítají na základě parity a dat ostatních disků „za běhu“). To znamená, že k selhání dojde pro uživatele transparentně a někdy i s minimálním poklesem výkonu (v závislosti na výpočetních schopnostech řadiče RAID). Mezi výhody zaznamenáváme vysoké rychlosti čtení a zápisu dat, a to jak při velkých objemech, tak při velkém počtu požadavků. Nevýhody: obtížná obnova dat a nižší rychlost čtení než u RAID 4.

RAID 6. Diskové pole s prokládáním a dvojitou distribuovanou paritou.

Rozdíl spočívá ve skutečnosti, že se používají dvě paritní schémata. Systém je tolerantní k výpadkům dvou disků. Hlavní problém je v tom, že k jeho implementaci musíte při provádění zápisu provést více operací. Z tohoto důvodu je rychlost zápisu extrémně nízká.

Kombinované (vnořené) úrovně RAID.

Jelikož jsou pole RAID pro OS transparentní, brzy nadešel čas vytvořit pole, jejichž prvky nejsou disky, ale pole jiných úrovní. Obvykle se píší s plusem. První číslo znamená, jaká pole úrovní jsou zahrnuta jako prvky, a druhé číslo znamená, jaký druh organizace má nejvyšší úroveň, která prvky kombinuje.

RAID 0+1

Kombinace, kterou je pole RAID 1 postavené na bázi polí RAID 0. Stejně jako v poli RAID 1 bude k dispozici pouze poloviční kapacita disku. Ale stejně jako u RAID 0 bude rychlost vyšší než u jednoho disku. K implementaci takového řešení jsou potřeba minimálně 4 disky.

RAID 1+0

Také známý jako RAID 10. Jedná se o proužek zrcadel, tedy pole RAID 0 sestavené z polí RAID 1. Téměř podobné předchozímu řešení.

RAID 0+3

Pole s vyhrazenou paritou nad pruhem. Jde o pole 3. úrovně, ve kterém jsou data rozdělena do bloků a zapisována do polí RAID 0. Jiné kombinace než nejjednodušší 0+1 a 1+0 vyžadují specializované řadiče, často dost drahé. Spolehlivost tohoto typu je nižší než spolehlivost další možnosti.

RAID 3+0

Také známý jako RAID 30. Jedná se o pruh (pole RAID 0) z polí RAID 3. Má velmi vysokou rychlost přenosu dat a dobrou odolnost proti chybám. Data jsou nejprve rozdělena do bloků (jako v RAID 0) a umístěna do polí prvků. Tam se opět rozdělí na bloky, vypočítá se jejich parita, bloky se zapíší na všechny disky kromě jednoho, na který se zapisují paritní bity. V tomto případě může selhat jeden z disků každého z polí RAID 3.

RAID 5+0 (50)

Vzniká spojením polí RAID 5 do pole RAID 0. Má vysokou rychlost přenosu dat a zpracování dotazů. Má průměrnou rychlost obnovy dat a dobrou odolnost proti chybám. Kombinace RAID 0+5 také existuje, ale spíše teoreticky, protože poskytuje příliš málo výhod.

RAID 5+1 (51)

Kombinace zrcadlení a prokládání s distribuovanou paritou. Volitelnou možností je také RAID 15 (1+5). Má velmi vysokou odolnost proti poruchám. Pole 1+5 může pracovat se třemi poruchami disku a pole 5+1 může pracovat s pěti z osmi disků.

RAID 6+0 (60)

Prokládání s dvojitě distribuovanou paritou. Tedy pruh z RAID 6. Jak již bylo zmíněno v souvislosti s RAID 0+5, RAID 6 z pruhů se nerozšířil (0+6). Podobné techniky (odstranění z polí s paritou) mohou zvýšit rychlost pole. Další výhodou je, že můžete snadno zvýšit kapacitu, aniž byste komplikovali zpoždění potřebná k výpočtu a zápisu více paritních bitů.

RAID 100 (10+0)

RAID 100, také psáno RAID 10+0, je proužek RAID 10. Ve svém jádru je podobný širšímu poli RAID 10, které využívá dvakrát tolik disků. Ale tato „třípatrová“ struktura má své vlastní vysvětlení. Nejčastěji se RAID 10 vyrábí hardwarově, tedy pomocí řadiče a softwarově se z nich dělají pruhy. Tento trik se uchýlí, aby se předešlo problému, který byl zmíněn na začátku článku – řadiče mají svá vlastní omezení škálovatelnosti a pokud do jednoho řadiče zapojíte dvojnásobný počet disků, za určitých podmínek nemusíte zaznamenat žádný nárůst Všechno. Softwarový RAID 0 vám umožňuje vytvořit jej na základě dvou řadičů, z nichž každý obsahuje na desce RAID 10. Vyhneme se tak „úzkému místu“, které řadič představuje. Dalším užitečným bodem je obejít problém s maximálním počtem konektorů na jednom ovladači – zdvojnásobením jejich počtu zdvojnásobíme počet dostupných konektorů.

Nestandardní režimy RAID

Dvojitá parita

Běžným doplňkem k uvedeným úrovním RAID je dvojitá parita, někdy implementovaná, a proto se nazývá „diagonální parita“. Dvojitá parita je již implementována v RAID 6. Ale na rozdíl od něj se parita započítává přes ostatní datové bloky. Nedávno byla rozšířena specifikace RAID 6, takže diagonální paritu lze považovat za RAID 6. Pro RAID 6 je parita považována za výsledek přidání modulo 2 bitů za sebou (tj. součet prvního bitu na prvním bitu disku, první bit na druhém atd. .), pak dojde k posunu diagonální parity. Operace v režimu selhání disku se nedoporučuje (kvůli obtížnosti výpočtu ztracených bitů z kontrolních součtů).

Jedná se o vývoj NetApp RAID pole s dvojitou paritou a spadá pod aktualizovanou definici RAID 6. Používá schéma záznamu dat odlišné od klasické implementace RAID 6. Zápis se provádí nejprve do mezipaměti NVRAM, která je podporována nepřerušitelným zdrojem napájení, aby se zabránilo ztrátě dat při výpadku napájení. Software řadiče zapisuje na disky pouze pevné bloky, kdykoli je to možné. Toto schéma poskytuje větší ochranu než RAID 1 a je rychlejší než běžný RAID 6.

RAID 1.5

Byl navržen společností Highpoint, ale nyní se velmi často používá v řadičích RAID 1, aniž by na tuto vlastnost byl kladen důraz. Podstata spočívá v jednoduché optimalizaci – data se zapisují jako do běžného pole RAID 1 (což v podstatě je 1.5) a data se čtou prokládaná ze dvou disků (jako v RAID 0). Ve specifické implementaci od Highpoint, použité na deskách řady DFI LanParty na čipsetu nForce 2, byl nárůst sotva znatelný a někdy dokonce nulový. Je to pravděpodobně způsobeno nízkou rychlostí ovladačů tohoto výrobce obecně v té době.

Kombinuje RAID 0 a RAID 1. Vytvořeno na alespoň třech discích. Data se zapisují prokládaná na tři disky a kopie se zapisuje s posunem o 1 disk. Pokud je jeden blok zapsán na tři disky, pak se kopie první části zapíše na druhý disk a kopie druhé části se zapíše na třetí disk. Při použití sudého počtu disků je samozřejmě lepší použít RAID 10.

Obvykle se při sestavování RAID 5 ponechá jeden disk volný (náhradní), takže v případě poruchy systém okamžitě začne pole znovu sestavovat. Při běžném provozu běží tento disk naprázdno. Systém RAID 5E zahrnuje použití tohoto disku jako prvku pole. A objem tohoto volného disku je distribuován po celém poli a je umístěn na konci disků. Minimální počet disků jsou 4 kusy. Dostupný objem je n-2, objem jednoho disku se používá (rozděluje se mezi všechny) pro paritu, objem druhého je volný. Když disk selže, pole se komprimuje na 3 disky (jako příklad použijeme minimální počet) vyplněním volného místa. Výsledkem je běžné pole RAID 5, odolné proti výpadku jiného disku. Po připojení nového disku se pole rozšíří a zabere opět všechny disky. Stojí za zmínku, že během komprese a dekomprese není disk odolný vůči vycházení jiného disku. V tuto chvíli také nelze číst/zapisovat. Hlavní výhodou je vyšší rychlost provozu, protože striping se vyskytuje na větším počtu disků. Nevýhodou je, že tento disk nelze přiřadit k více polím najednou, což je možné v jednoduchém poli RAID 5.

RAID 5EE

Od předchozího se liší pouze tím, že oblasti volného místa na discích nejsou rezervovány v jednom kuse na konci disku, ale jsou prokládány v blocích s paritními bity. Tato technologie výrazně urychluje obnovu po selhání systému. Bloky lze zapisovat přímo do volného místa, aniž byste se museli pohybovat po disku.

Podobně jako RAID 5E využívá další disk ke zlepšení výkonu a rozložení zátěže. Volné místo je rozděleno mezi další disky a je umístěno na konci disků.

Tato technologie je registrovaná ochranná známka společnosti Storage Computer Corporation. Pole založené na RAID 3, 4 optimalizované pro výkon. Hlavní výhodou je použití cachování pro čtení/zápis. Požadavky na přenos dat jsou prováděny asynchronně. Při konstrukci se používají disky SCSI. Rychlost je přibližně 1,5–6krát vyšší než u řešení RAID 3.4.

Intel Matrix RAID

Je technologie zavedená společností Intel v jižních můstcích počínaje ICH6R. Podstata spočívá v možnosti kombinovat pole RAID různých úrovní na diskových oddílech, spíše než na jednotlivých discích. Řekněme, že na dvou discích můžete uspořádat dva oddíly, dva z nich budou ukládat operační systém na pole RAID 0 a další dva - pracující v režimu RAID 1 - budou ukládat kopie dokumentů.

Linux MD RAID 10

Toto je ovladač RAID jádra Linuxu, který poskytuje možnost vytvořit pokročilejší verzi RAID 10. Pokud tedy pro RAID 10 existovalo omezení v podobě sudého počtu disků, pak tento ovladač může pracovat s lichým . Princip pro tři disky bude stejný jako v RAID 1E, kde jsou disky prokládané jeden po druhém, aby se vytvořily kopie a prokládané bloky, jako u RAID 0. Pro čtyři disky to bude ekvivalentní běžnému RAID 10. Kromě toho můžete určit, ve které oblasti bude kopie uložena na disku. Řekněme, že originál bude v první polovině prvního disku a jeho kopie bude v druhé polovině druhého disku. U druhé poloviny dat je to naopak. Data lze několikrát duplikovat. Ukládání kopií na různé části disku umožňuje dosáhnout vyšších přístupových rychlostí v důsledku heterogenity pevného disku (rychlost přístupu se liší v závislosti na umístění dat na plotně, obvykle je rozdíl dvojnásobný).

Vyvinutý společností Kaleidescape pro použití v jejich mediálních zařízeních. Podobné jako RAID 4 využívající dvojitou paritu, ale používá jinou metodu odolnosti proti chybám. Uživatel může pole jednoduše rozšiřovat pouhým přidáním disků, a pokud obsahuje data, data se do něj jednoduše přidají, místo aby byly smazány, jak je obvykle požadováno.

Vyvinuto společností Sun. Největším problémem RAID 5 je ztráta informací v důsledku výpadku napájení, kdy se informace z diskové cache (což je volatilní paměť, to znamená neukládá data bez elektřiny) nestihnou uložit do magnetické talíře. Tento nesoulad informací v mezipaměti a na disku se nazývá inkoherence. Organizace samotného pole je spojena se souborovým systémem Sun Solaris – ZFS. Používá se vynucený zápis obsahu mezipaměti disku, můžete obnovit nejen celý disk, ale i blok „za běhu“, když se kontrolní součet neshoduje. Dalším důležitým aspektem je ideologie ZFS – v případě potřeby nemění data. Místo toho zapíše aktualizovaná data a poté se ujistí, že operace již byla úspěšná, změní na ně ukazatel. Je tak možné předejít ztrátě dat při úpravách. Malé soubory se místo vytváření kontrolních součtů duplikují. To také provádí souborový systém, protože zná datovou strukturu (pole RAID) a může pro tyto účely přidělit prostor. Existuje také RAID-Z2, který stejně jako RAID 6 dokáže přežít dvě selhání disku pomocí dvou kontrolních součtů.

Něco, co v principu není RAID, ale často se s ním používá. Doslova přeloženo jako „jen hromada disků“ Technologie spojuje všechny disky nainstalované v systému do jednoho velkého logického disku. To znamená, že místo tří disků bude vidět jeden velký. Je využita celá celková kapacita disku. Neexistuje žádná akcelerace, žádná spolehlivost, žádný výkon.

Drive Extender

Funkce obsažená v systému Windows Home Server. Kombinuje JBOD a RAID 1. Pokud je nutné vytvořit kopii, soubor okamžitě nezduplikuje, ale umístí na oddíl NTFS štítek označující data. Při nečinnosti systém zkopíruje soubor tak, aby se maximalizoval prostor na disku (lze použít disky různých velikostí). Umožňuje dosáhnout mnoha výhod RAID – odolnost proti chybám a možnost snadné výměny vadného disku a jeho obnovení na pozadí, průhlednost umístění souboru (bez ohledu na to, na kterém disku se nachází). Je také možné provádět paralelní přístup z různých disků pomocí výše uvedených štítků a získat podobný výkon jako RAID 0.

Vyvinuto společností Lime technology LLC. Toto schéma se liší od konvenčních polí RAID tím, že umožňuje kombinovat disky SATA a PATA v jednom poli a disky různých velikostí a rychlostí. Pro kontrolní součet (paritu) se používá vyhrazený disk. Data nejsou mezi disky pruhovaná. Pokud selže jeden disk, budou ztraceny pouze soubory na něm uložené. Lze je však obnovit pomocí parity. UNRAID je implementován jako doplněk k Linux MD (multidisk).

Většina typů polí RAID není rozšířená, některé se používají v úzkých oblastech použití. Nejrozšířenější, od běžných uživatelů až po servery základní úrovně, jsou RAID 0, 1, 0+1/10, 5 a 6. Zda potřebujete pole raid pro své úkoly, je na vás. Nyní víte, jak se od sebe liší.

Začněme v malém: „RAID pole“ nebo v běžné řeči „RAID“, co to je?

NÁLET je zkratka, která znamená (anglicky: "Redundant Array of Independent Disks"), což v překladu do ruštiny znamená "nadbytečné (záložní) pole nezávislých disků."
Jednoduše řečeno, „pole RAID“ je kombinace fyzických pevných disků do jednoho logického.
Logický pohon– jedná se o běžný HDD disk rozdělený na několik logických. To se obvykle používá u stolních počítačů; několik je vyrobeno z jednoho.
Jak bylo uvedeno výše, běžný fyzický disk lze rozdělit na několik logických. V „RAID“ se vše děje naopak – do spojovacího prvku (kde budou uloženy) je nainstalováno několik HDD disků a operační systém pak vnímá všechny HDD disky jako jeden. tj. operační systém má 100% jistotu, že je k němu připojen pouze jeden fyzický disk.

Jaké druhy polí RAID existují? Existují pouze 2 typy, hardware a software:

1) Hardwarová pole RAID- obvykle se vytváří před načtením operačního systému pomocí specializovaných utilit nainstalovaných (pevně připojených) do „řadiče RAID“ – něco jako „BIOS“. Po tomto zpracování, když připojíte „pole RAID“, operační systém ve fázi instalace vidí vaše pevné disky jako jeden.

2) Softwarová pole RAID- vznikají připojením pevných disků k libovolnému operačnímu systému. to znamená, že když připojíte HDD disky, detekuje více fyzických disků a pouze s pomocí Operačního systému, pomocí softwaru se HDD disky spojí do jednoho pole. Samotný operační systém nebude umístěn na samotném „pole RAID“, protože je nainstalován před vytvořením pole.

"K čemu to je?"– máte otázku! Odpověď je jednoduchá: za účelem zvýšení rychlosti čtení a zápisu dat nebo zlepšení bezpečnosti a odolnosti proti chybám.
Podívejme se, jak „RAID pole“ zvyšuje výkon a bezpečnost vašich dat?“ – abychom na tuto otázku odpověděli, podíváme se na různé typy „RAID polí“, jak se tvoří a co z toho plyne.

Zvažte „RAID-0“:

Více než jeden HDD disk se spojí do jednoho přes sériové připojení, načež se sečtou objemy, tzn. - pokud vezmeme několik HDD disků, z nichž každý má kapacitu „500 GB“ a vytvoříme z nich „RAID-0“, operační systém bude vnímat nainstalované HDD disky jako jeden, sečte je, z čehož dostaneme jeden HDD disk s kapacitou 1000Gb (1Tb) . Po sloučení disků do jednoho pole bude rychlost čtení a zápisu jednotky dvakrát vyšší než u samostatných disků.

Příklad– databáze umístěná na dvou fyzických HDD discích, z nichž jeden bude uživatel pouze číst data, zatímco druhý uživatel bude zapisovat data na jiný HDD disk, a to vše současně. Pokud je ale databáze umístěna pouze na jednom disku, HDD disk sám bude svým softwarem plnit funkci čtení nebo zápisu pro úplně jiné uživatele sekvenčně. Pole RAID-0 poskytne možnost paralelního čtení a zápisu. Na základě rychlosti můžete usoudit - kolik HDD disků je ve vašem poli RAID-0, vynásobte číslo Ito stávající rychlostí (při této rychlosti bude váš RAID-0 pracovat rychleji) - celá závislost pole je úměrná - rychlost nároků HDD se Nkrát zvýší, kde N = počet instalovaných HDD v poli.

Pole RAID-0 má jedinou nevýhodu, toto mínus převažuje nad vším, dokonce i nad výhodami jeho použití - pole RAID-0 postrádá odolnost proti chybám. Problém je tento: pokud selže jeden z fyzických pevných disků nainstalovaných v poli, celé pole zemře.
Existuje na to starý vtip: "Co znamená "0" v RAID-0? - množství informací, které se obnoví po smrti pole!" (i když to není vůbec zábavné, pokud je tam něco velmi důležitého).

Dále zvažte pole „RAID-1“:

Několik nebo více HDD disků se spojí do jednoho jejich instalací do specializovaného pole, tzn. pokud vezmete několik pevných disků s kapacitou 500 GB a vytvoříte z nich pole „RAID-1“, operační systém jej bude vnímat jako jedno 500GB pole.
Rychlost čtení a zápisu pole „RAID-1“ bude přesně stejná jako u jednoho HDD disku, protože čtení a zápis bude probíhat na obou HDD discích současně.
Pole RAID-1 nezvýší produkční rychlost, ale máte zajištěnu odolnost proti chybám; pokud jeden z pevných disků selže, druhý pevný disk bude mít plnou zálohu informací. Pokud jsou data z pole záměrně smazána, dojde k vymazání z obou disků současně!

Dále zvážíme pole „RAID-5“:

Nejbezpečnější možností je RAID-5. Naplnění pole informacemi se provádí výpočtem podle vzorce „(N - 1) * DiskSize“, kde číslo N je počet disků HDD umístěných v poli a zkratka „DiskSize“ je objem každého z nich. nainstalovaný HDD disk, tzn. při vytvoření pole verze „RAID-5“ 3 HDD disků, každý o kapacitě 500GB, získáme pole s kapacitou paměti 1000Gb 1 terabajt.

Podstata pole RAID-5 je následující - několik HDD disků je sloučeno do „RAID-0“ a na třetím HDD disku (který se nebere v úvahu) bude uložen, říkejme tomu „kontrolní součet“ - toto je informace určená k obnovení jednoho z disků pole v případě jeho smrti. Pole RAID-5 má o něco nižší rychlost zápisu, protože výpočet a zápis výsledného množství na další disk stráví málo času, přičemž rychlost čtení zůstává stejná jako u pole RAID-0.
Pokud se stane, že některý z HDD disků ve vašem poli RAID-5 selže, rychlost čtení a zápisu okamžitě prudce poklesne, protože všechny operace, ke kterým dojde, jsou doprovázeny dalšími manipulativními akcemi.

Ve skutečnosti se RAID-5 změní na RAID-0 a pokud se nepostaráte o včasnou obnovu pole RAID, existuje značné riziko úplné ztráty dat.
Paralelně s polem RAID-5 je možné použít „Spare disk“ - náhradní. Při stabilním provozu pole RAID není rezervní disk používán a je v klidovém režimu. Ale v případě jakékoli kritické situace se obnova zálohy „RAID pole“ spustí v automatickém režimu - informace z poškozeného HDD budou obnoveny na náhradní HDD disk pomocí kontrolních součtů, které jsou umístěny na samostatném HDD disku.
Pole „RAID-5“ je obvykle vytvořeno z nejméně tří pevných disků a pomůže zachránit vaše data pouze před jednotlivými chybami, které se vyskytnou. Pokud se na různých HDD objeví různé chyby současně, pole RAID-5 nepomůže.

Další je pole „RAID-6“:

Má vylepšené možnosti ve srovnání s polem „RAID-5“. Obecně je podstata práce stejná jako u pole RAID-5, pouze výpočet kontrolních součtů nebude probíhat na jednom HDD disku, ale na dvou HDD discích a celý výpočet kontrolních součtů se provádí pomocí zcela jiných algoritmy, což přispívá k výraznému zvýšení odolnosti proti chybám celého „RAID pole“ jako celku. Pole RAID-6 se skládá převážně ze 4 pevných disků. Vzorec použitý pro výpočet velikosti paměti pole je následující - (N - 2) * Velikost disku, kde N je počet pevných disků nainstalovaných v poli a „Velikost disku“ je velikost paměti každého pevného disku, tj. při vytvoření pole „RAID-6“ pěti HDD disků s nominální hodnotou 500 GB bude celkovým množstvím pole o velikosti 1500 Gb (1,5 Tb-terabajtů).
Rychlost pole RAID-6 při zápisu bude nižší než u pole RAID-5 přibližně o 10-15 %, pokles rychlosti je způsoben dodatečným časem stráveným výpočtem a zápisem kontrolních součtů.

Pole "RAID-10":

Někdy se mu říká „RAID 0+1“ nebo „RAID 1+0“, což je symbióza „RAID-0 a RAID-1“. Toto pole je obvykle vytvořeno z minimálně čtyř pevných disků: na prvním oddílu „RAID-0“ a na druhém „RAID-0“, aby se zvýšila rychlost čtení a zápisu, budou umístěny mezi sebou v zrcadlo pole „RAID-1“ - je to nutné pro zvýšení odolnosti proti chybám. Pole RAID-10 dokázalo spojit výhody prvních dvou možností – výsledkem byl jeho výkon a odolnost proti chybám.

Pole „RAID-50“ je analogem „RAID-10“, což je symbióza „RAID-0 a RAID-5“ – ve skutečnosti je sestaveno jako pole „RAID-5“, pouze složkou prvky, které jsou v něm zahrnuty, nebudou fyzické pevné disky a bude sestávat z polí plánu „RAID-0“. Pole RAID-50 vám tak během provozu poskytne pozoruhodnou rychlost čtení a zápisu a přispěje ke stabilitě a spolehlivosti RAID-5.

Další je pole „RAID-60“:

Stejný princip: ve skutečnosti je to „RAID-6“, sestavený z několika polí „RAID-0“.
Existují i ​​další kombinace polí, například „RAID 5+1 / RAID 6+1“ – ve skutečnosti jsou podobné „RAID-50 / RAID-60“ s tím rozdílem, že základem jejich prvků pole není „ RAID-0" jako ostatní a zrcadla pole jsou "RAID-1".

Koncepty kombinovaných polí "RAID":

V podstatě taková pole jako „RAID-10“ / „RAID-50“ / „RAID-60“ a „RAID X+1“- jedná se o přímé potomky základních polí, jako je „RAID-0“ / RAID-1 / RAID-5 a RAID-6 - používají se zejména ke zvýšení rychlosti čtení nebo zápisu nebo ke zvýšení odolnosti proti chybám pomocí standardní funkčnosti základní, standardní typy polí RAID.

Pokud se na to podíváme z praktického hlediska a diskutujeme o aplikacích jakýchkoli „RAID polí“ v životě, pak je logicky vše docela jednoduché:

1) Pole RAID-0 nepoužívá se v čisté formě (vůbec!);
2) "RAID-1" pole se používá především tam, kde rychlost čtení nebo zápisu nehraje zvlášť velkou roli a ve větší míře je vyžadována odolnost proti chybám - např.: na pole „RAID-1“ je velmi dobré instalovat různé operační systémy. V tomto případě k HDD diskům nikdo kromě OS nepřistupuje, rychlost samotných HDD disků je pro provoz dostatečná a je zajištěna odolnost proti poruchám;
3) RAID-5 instalujeme jej tam, kde je potřeba rychlost s odolností proti chybám, ale neexistuje způsob, jak zakoupit další HDD disky nebo pokud je potřeba obnovit pole, pokud dojde k poškození, a zároveň se nezastaví samotný provoz pole - v tomto případě pomohou náhradní disky.
4) Standardní použití pole RAID-5:
V datovém úložišti nebo jak se jim také říká NAS server;
5) Pole "RAID-6":
Používá se tam, kde hrozí selhání několika pevných disků v poli najednou. V praxi to tak prakticky není, pokud to není pro paranoidní lidi;
6) Pole "RAID-10":
Používají se tam, kde je potřeba rychlost, pro rychlou práci a pro spolehlivost. Hlavním směrem použití pole RAID-10 jsou také databázové servery a souborové servery.

To je v podstatě vše, co jsem chtěl zjistit, co je co a proč!

V závislosti na vybrané specifikaci RAID může být zlepšena rychlost čtení a zápisu a/nebo ochrana před ztrátou dat.

Při práci s diskovými subsystémy se IT specialisté často potýkají se dvěma hlavními problémy.

  • První je nízká rychlost čtení/zápisu, někdy nestačí ani rychlosti SSD disku.
  • Druhým je selhání disků, což znamená ztrátu dat, jejichž obnova může být nemožná.

Oba tyto problémy jsou řešeny pomocí technologie RAID (redundantní pole nezávislých disků) – technologie virtuálního úložiště dat, která spojuje několik fyzických disků do jednoho logického prvku.

V závislosti na vybrané specifikaci RAID může být zlepšena rychlost čtení/zápisu a/nebo ochrana před ztrátou dat.

Úrovně specifikace RAID jsou: 1,2,3,4,5,6,0. Kromě toho existují kombinace: 01,10,50,05,60,06. V tomto článku se podíváme na nejběžnější typy polí RAID. Nejprve si ale řekněme, že existují hardwarová a softwarová pole RAID.

Hardwarová a softwarová pole RAID

  • Softwarová pole jsou vytvářena po instalaci operačního systému pomocí softwarových produktů a utilit, což je hlavní nevýhoda takových diskových polí.
  • Hardwarové pole RAID vytváří diskové pole před instalací operačního systému a nejsou na něm závislé.

RAID 1

RAID 1 (také nazývaný "Mirror" - Mirror) zahrnuje úplnou duplikaci dat z jednoho fyzického disku na druhý.

Mezi nevýhody RAID 1 patří fakt, že získáte poloviční místo na disku. Tito. Pokud použijete DVA 250GB disky, systém uvidí pouze JEDEN 250GB velký. Tento typ RAID nepřináší nárůst rychlosti, ale výrazně zvyšuje úroveň odolnosti proti chybám, protože pokud jeden disk selže, vždy existuje jeho úplná kopie. Nahrávání a mazání z disků probíhá současně. Pokud byly informace smazány záměrně, nebude možné je obnovit z jiného disku.

RAID 0

RAID 0 (také nazývaný Striping) zahrnuje rozdělení informací do bloků a současný zápis různých bloků na různé disky.

Tato technologie zvyšuje rychlost čtení/zápisu, umožňuje uživateli využít celou celkovou kapacitu disků, ale snižuje odolnost proti chybám, respektive ji snižuje na nulu. Pokud tedy jeden z disků selže, bude téměř nemožné obnovit informace. Pro sestavení RAID 0 se doporučuje používat pouze vysoce spolehlivé disky.

RAID 5 lze nazvat pokročilejším RAID 0. Můžete použít až 3 pevné disky. Raid 0 se zaznamená na všechny kromě jednoho a na poslední se zaznamená speciální kontrolní součet, který vám umožní uložit informace na pevné disky v případě „smrti“ jednoho z nich (ale ne více než jednoho). Provozní rychlost takového pole je vysoká. Pokud vyměníte disk, zabere to spoustu času.

RAID 2, 3, 4

Jedná se o metody distribuovaného ukládání informací pomocí disků přidělených pro paritní kódy. Liší se od sebe pouze velikostí bloků. V praxi se prakticky nepoužívají z důvodu nutnosti věnovat velký podíl diskové kapacity na ukládání ECC a/nebo paritních kódů a také z důvodu nízkého výkonu.

RAID 10

Jedná se o kombinaci polí RAID 1 a 0. A kombinuje výhody každého z nich: vysoký výkon a vysokou odolnost proti chybám.

Pole musí obsahovat sudý počet disků (minimálně 4) a je nejspolehlivější možností pro ukládání informací. Nevýhodou je vysoká cena diskového pole: efektivní kapacita bude polovina celkové kapacity diskového prostoru.

Jedná se o kombinaci polí RAID 5 a 0. RAID 5 se buduje, ale jeho součástmi nebudou nezávislé pevné disky, ale pole RAID 0.

Zvláštnosti.

Pokud dojde k poruše RAID řadiče, je téměř nemožné obnovit informace (neplatí pro Mirror). I když si koupíte úplně stejný řadič, je vysoká pravděpodobnost, že RAID bude sestaven z jiných sektorů disku, což znamená, že informace na discích budou ztraceny.

Disky se zpravidla nakupují v jedné dávce. Podle toho může být jejich životnost přibližně stejná. V tomto případě se doporučuje okamžitě, v době nákupu disků pro pole, dokoupit nějaký přebytek. Chcete-li například nakonfigurovat RAID 10 ze 4 disků, měli byste si zakoupit 5 disků. Pokud tedy jeden z nich selže, můžete jej rychle vyměnit za nový, než selžou ostatní disky.

Závěry.

V praxi se nejčastěji používají pouze tři typy RAID polí. Jedná se o RAID 1, RAID 10 a RAID 5.

Z hlediska ceny/výkonu/tolerance chyb se doporučuje použít:

  • RAID 1(zrcadlení) k vytvoření diskového subsystému pro uživatelské operační systémy.
  • RAID 10 pro data s vysokými požadavky na rychlost zápisu a čtení. Například pro ukládání databází 1C:Enterprise, poštovního serveru, AD.
  • RAID 5 slouží k ukládání dat souboru.

Ideálním serverovým řešením je podle většiny systémových administrátorů server se šesti disky. Dva disky jsou „zrcadlené“ a operační systém je nainstalován na RAID 1. Čtyři zbývající disky jsou spojeny do pole RAID 10 pro rychlý, bezproblémový a spolehlivý provoz systému.

RAID 0, RAID 1, RAID 5, RAID 10 nebo jaké jsou úrovně RAID?

Návštěvníci fóra se nás ptají na otázku: "Která úroveň RAID je nejspolehlivější?" Každý ví, že nejběžnější úrovní je RAID5, ale neobejde se bez vážných nedostatků, které nejsou pro laiky zřejmé.

RAID 0, RAID 1, RAID 5, RAID 10 nebo jaké jsou úrovně RAID?
V tomto článku se pokusím charakterizovat nejoblíbenější úrovně RAID a následně formulovat doporučení pro použití těchto úrovní. Pro ilustraci článku jsem vytvořil diagram, ve kterém jsem tyto úrovně umístil do trojrozměrného prostoru spolehlivosti, výkonu a nákladové efektivity.
JBOD (Just a Bunch of Disks) je jednoduché propojování pevných disků, které formálně není úrovní RAID. Svazek JBOD může být pole jednoho disku nebo agregace více disků. Řadič RAID nemusí pro provoz takového svazku provádět žádné výpočty. V našem diagramu slouží disk JBOD jako „jeden“ neboli výchozí bod – jeho spolehlivost, výkon a náklady jsou stejné jako u jednoho pevného disku.

RAID 0 („Striping“) nemá žádnou redundanci a okamžitě distribuuje informace na všechny disky v poli ve formě malých bloků („proužků“). Výkon se díky tomu výrazně zvyšuje, ale spolehlivost trpí. Stejně jako u JBOD dostaneme za své peníze 100 % kapacity disku.

Dovolte mi vysvětlit, proč se spolehlivost ukládání dat na libovolném složeném svazku snižuje – protože pokud některý z pevných disků v něm obsažených selže, všechny informace jsou zcela a nenávratně ztraceny. V souladu s teorií pravděpodobnosti se matematicky spolehlivost svazku RAID0 rovná součinu spolehlivosti disků, z nichž každý je menší než jedna, takže celková spolehlivost je zjevně nižší než spolehlivost jakéhokoli disku.

Dobrá úroveň je RAID 1 („Mirroring“, „mirror“). Má ochranu proti selhání poloviny dostupného hardwaru (obecně jeden ze dvou pevných disků), poskytuje přijatelnou rychlost zápisu a zvyšuje rychlost čtení díky paralelizaci požadavků. Nevýhodou je, že musíte zaplatit cenu dvou pevných disků, abyste získali použitelnou kapacitu jednoho pevného disku.

Zpočátku se předpokládá, že pevný disk je spolehlivá věc. Podle toho se pravděpodobnost selhání dvou disků najednou rovná (podle vzorce) součinu pravděpodobností, tzn. řádově nižší! Bohužel, skutečný život není teorie! Dva pevné disky jsou odebrány ze stejné šarže a fungují za stejných podmínek, a pokud jeden z disků selže, zátěž na zbývajícím se zvýší, takže v praxi, pokud jeden z disků selže, musí být přijata naléhavá opatření k obnovení nadbytek. K tomu se doporučuje používat HotSpare horké náhradní disky s libovolnou úrovní RAID (kromě nuly). Výhodou tohoto přístupu je zachování stálé spolehlivosti. Nevýhodou jsou ještě větší náklady (tedy náklady na 3 pevné disky pro uložení objemu jednoho disku).

Zrcadlo na mnoha discích je úroveň RAID 10. Při použití této úrovně jsou zrcadlené páry disků uspořádány do „řetězce“, takže výsledný svazek může přesáhnout kapacitu jednoho pevného disku. Výhody a nevýhody jsou stejné jako u úrovně RAID1. Stejně jako v jiných případech se doporučuje zahrnout HotSpare horké náhradní disky do pole v poměru jeden náhradní na každých pět pracovníků.

RAID 5 je skutečně nejoblíbenější z úrovní, a to především díky své nákladové efektivitě. Obětováním kapacity pouze jednoho disku z pole pro redundanci získáme ochranu proti selhání kteréhokoli z pevných disků svazku. Zápis informací na svazek RAID5 vyžaduje další zdroje, protože jsou nutné další výpočty, ale při čtení (ve srovnání se samostatným pevným diskem) je zisk, protože datové toky z několika diskových polí jsou paralelizovány.

Nevýhody RAID5 se objevují, když jeden z disků selže - celý svazek přejde do kritického režimu, všechny operace zápisu a čtení jsou doprovázeny dalšími manipulacemi, výkon prudce klesá a disky se začínají zahřívat. Pokud neprovedete okamžitou akci, můžete ztratit celý svazek. Proto (viz výše) byste rozhodně měli používat Hot Spare disk se svazkem RAID5.

Kromě základních úrovní RAID0 - RAID5 popsaných ve standardu existují kombinované úrovně RAID10, RAID30, RAID50, RAID15, které jsou různými výrobci interpretovány různě.

Podstata takových kombinací je stručně následující. RAID10 je kombinace jedničky a nuly (viz výše). RAID50 je kombinací „0“ svazků úrovně 5. RAID15 je „zrcadlem“ „pětky“. A tak dále.

Kombinované úrovně tedy zdědí výhody (a nevýhody) svých „rodičů“. Vzhled „nuly“ v úrovni RAID 50 tedy vůbec nepřidává na spolehlivosti, ale má pozitivní vliv na výkon. RAID 15 je možná velmi spolehlivý, ale není nejrychlejší a také extrémně plýtvá (použitelná kapacita svazku je menší než polovina velikosti původního diskového pole).

RAID 6 se od RAID 5 liší tím, že každý řádek dat (v angličtině stripe) má ne jeden, ale dva bloky kontrolních součtů. Kontrolní součty jsou „multidimenzionální“, tzn. nezávisle na sobě, takže i výpadek dvou disků v poli umožňuje zachránit původní data. Výpočet kontrolních součtů metodou Reed-Solomon vyžaduje oproti RAID5 intenzivnější výpočty, dříve se tedy šestá úroveň prakticky nepoužívala. Nyní je podporováno mnoha produkty, protože začali instalovat specializované mikroobvody, které provádějí všechny potřebné matematické operace.

Podle některých studií končí obnova integrity po selhání jediného disku na svazku RAID5 složeném z velkých SATA disků (400 a 500 gigabajtů) ztrátou dat v 5 % případů. Jinými slovy, v jednom případě z dvaceti může během regenerace pole RAID5 na záložní disk Hot Spare selhat i druhý disk... Z toho plynou doporučení nejlepších disků RAID: 1) vždy vytvářet záložní kopie; 2) použijte RAID6!

Nedávno se objevily nové úrovně RAID1E, RAID5E, RAID5EE. Písmeno „E“ v názvu znamená Enhanced.

RAID level-1 Enhanced (RAID level-1E) kombinuje zrcadlení a prokládání dat. Tato směs úrovní 0 a 1 je uspořádána následovně. Data v řádku jsou distribuována přesně jako v RAID 0. To znamená, že datový řádek nemá žádnou redundanci. Následující řádek datových bloků kopíruje předchozí s posunem o jeden blok. Stejně jako ve standardním režimu RAID 1 má tedy každý datový blok zrcadlovou kopii na jednom z disků, takže užitečný objem pole se rovná polovině celkového objemu pevných disků obsažených v poli. RAID 1E vyžaduje k provozu kombinaci tří nebo více disků.

Velmi se mi líbí úroveň RAID1E. Pro výkonnou grafickou pracovní stanici nebo dokonce pro domácí počítač - nejlepší volba! Má všechny výhody nulté a první úrovně - vynikající rychlost a vysokou spolehlivost.

Pojďme nyní k RAID level-5 Enhanced (RAID level-5E). To je stejné jako RAID5, pouze s náhradním diskem zabudovaným v poli. Tato integrace se provádí následovně: na všech discích pole je ponechána 1/N část prostoru volná, která se použije jako hot náhradní v případě, že některý z disků selže. Díky tomu vykazuje RAID5E spolu se spolehlivostí i lepší výkon, protože čtení/zápis probíhá paralelně z většího počtu disků současně a náhradní disk není nečinný jako u RAID5. Záložní disk zahrnutý ve svazku samozřejmě nelze sdílet s jinými svazky (vyhrazené vs. sdílené). Svazek RAID 5E je postaven na minimálně čtyřech fyzických discích. Užitečný objem logického svazku se vypočítá pomocí vzorce N-2.

RAID level-5E Enhanced (RAID level-5EE) je podobný RAID level-5E, ale má efektivnější přidělování náhradních disků a v důsledku toho rychlejší dobu obnovy. Stejně jako úroveň RAID5E i tato úroveň RAID rozděluje bloky dat a kontrolní součty do řádků. Ale také distribuuje volné bloky náhradního disku a nerezervuje pouze část místa na disku pro tyto účely. Tím se zkracuje čas potřebný k rekonstrukci integrity svazku RAID5EE. Záložní disk zahrnutý ve svazku nelze sdílet s jinými svazky – jako v předchozím případě. Svazek RAID 5EE je postaven na minimálně čtyřech fyzických discích. Užitečný objem logického svazku se vypočítá pomocí vzorce N-2.

Kupodivu jsem na internetu nenašel žádnou zmínku o úrovni RAID 6E - takovou úroveň zatím žádný výrobce nenabízí a ani nehlásí. Ale úroveň RAID6E (nebo RAID6EE?) může být nabízena podle stejného principu jako předchozí. HotSpare disk musí doprovázet jakýkoli svazek RAID, včetně RAID 6. Samozřejmě neztratíme informace, pokud jeden nebo dva disky selžou, ale je nesmírně důležité začít s regenerací integrity pole co nejdříve, aby bylo možné rychle systém je mimo „kritický“ režim. Vzhledem k tomu, že potřeba Hot Spare disku je pro nás nepochybná, bylo by logické jít dále a „rozšířit“ jej tak, jak se to dělá v RAID 5EE, abychom získali výhody použití většího počtu disků (lépe čtených -rychlost zápisu a rychlejší obnovení integrity).

Úroveň
~~~~~~~ Redundance Využití kapacity disku Výkon čtení Výkon zápisu Vestavěný náhradní disk Min. počet disků Max. počet disků
RAID 0 ne 100 % Vynikající Vynikající ne 1 16
RAID 1 + 50 % Chorus + Chorus + žádný 2 2
RAID 10 + 50 % Chorus + Chorus + žádný 4 16
RAID 1E + 50 % Chorus + Chorus + žádný 3 16
RAID 5 + 67-94 % Vynikající Dobrý ne 3 16
RAID 5E + 50-88 % Vynikající sbor + 4 16
RAID 5EE + 50-88 % Vynikající sbor + 4 16
RAID 6 + 50-88 % Vynikající Dobrý ne 4 16
RAID 00 ne 100 % Vynikající Vynikající ne 2 60
RAID 1E0 + 50 % Chorus + Chorus + žádný 6 60
RAID 50 + 67-94 % Vynikající Dobrý ne 6 60
RAID 15 + 33-48 % Vynikající Dobrý ne 6 60

Všechny úrovně „zrcadlení“ jsou RAID 1, 1+0, 10, 1E, 1E0.

Pokusme se znovu důkladně pochopit, jak se tyto úrovně liší?

RAID 1.
Jedná se o klasické „zrcadlo“. Dva (a pouze dva!) pevné disky fungují jako jeden a jsou úplnou kopií jednoho druhého. Selhání kteréhokoli z těchto dvou disků nemá za následek ztrátu vašich dat, protože řadič pokračuje v provozu na zbývajícím disku. RAID1 v číslech: 2x redundance, 2x spolehlivost, 2x náklady. Výkon zápisu je ekvivalentní výkonu jednoho pevného disku. Výkon čtení je vyšší, protože řadič může distribuovat operace čtení mezi dva disky.

RAID 10.
Podstatou této úrovně je, že disky pole jsou po párech kombinovány do „zrcadlovek“ (RAID 1) a poté jsou všechny tyto zrcadlové páry sloučeny do společného pruhovaného pole (RAID 0). To je důvod, proč se někdy označuje jako RAID 1+0. Důležitým bodem je, že v RAID 10 můžete kombinovat pouze sudý počet disků (minimálně 4, maximálně 16). Výhody: spolehlivost se dědí od „zrcadla“, výkon pro čtení i zápis se dědí od „nuly“.

RAID 1E.
Písmeno "E" v názvu znamená "Enhanced", tzn. „vylepšené“. Princip tohoto vylepšení je následující: data se po blocích „odstraňují“ přes všechny disky pole a poté se opět „proužují“ s posunem na jeden disk. RAID 1E může kombinovat od tří do 16 disků. Spolehlivost odpovídá „deseti“ ukazatelům a výkon se díky většímu „střídání“ o něco zlepšuje.

RAID 1E0.
Tato úroveň je implementována takto: z polí RAID1E vytvoříme „null“ pole. Celkový počet disků tedy musí být násobkem tří: minimálně tři a maximálně šedesát! V tomto případě je nepravděpodobné, že bychom získali rychlostní výhodu a složitost implementace může nepříznivě ovlivnit spolehlivost. Hlavní výhodou je možnost spojit velmi velký (až 60) počet disků do jednoho pole.

Podobnost všech úrovní RAID 1X spočívá v jejich indikátorech redundance: kvůli spolehlivosti je obětováno přesně 50 % celkové kapacity disků pole.