Macierz RAID. Co to jest? Po co? A jak stworzyć?

Przez długie dziesięciolecia rozwoju przemysłu komputerowego środki przechowywania informacji w komputerach przeszły poważną ewolucyjną ścieżkę rozwoju. Taśmy i karty dziurkowane, taśmy i bębny magnetyczne, dyski magnetyczne, optyczne i magnetooptyczne, napędy półprzewodnikowe – to tylko krótka lista przetestowanych już technologii. Obecnie laboratoria na całym świecie podejmują próby stworzenia holograficznych i kwantowych urządzeń magazynujących, które znacznie zwiększą gęstość zapisu i niezawodność jego przechowywania.

Tymczasem dyski twarde pozostają od dawna najpopularniejszym sposobem przechowywania informacji na komputerze osobistym. Inaczej można je nazwać dyskami twardymi (dyskami twardymi), dyskami twardymi, dyskami twardymi, ale istota nie zmienia się po zmianie nazwy - są to dyski z pakietem dysków magnetycznych w jednej obudowie.

Pierwszy dysk twardy, nazwany IBM 350, został zmontowany 10 stycznia 1955 roku w laboratorium amerykańskiej firmy IBM. Przy wielkości dobrej szafki i wadze tony ten dysk twardy mógł pomieścić pięć megabajtów informacji. Z współczesnego punktu widzenia takiego tomu nie można nawet nazwać śmiesznym, ale w czasach masowego stosowania kart dziurkowanych i taśm magnetycznych z dostępem szeregowym był to kolosalny przełom technologiczny.


Wyładunek pierwszego dysku twardego IBM 350 z samolotu

Od tego dnia minęło niecałe sześć dekad, ale teraz nikogo nie zaskoczy dysk twardy ważący niecałe dwieście gramów, długi na dziesięć centymetrów i o objętości kilku terabajtów. Jednocześnie technologia zapisu, przechowywania i odczytu danych nie różni się od tej zastosowanej w IBM 350 - te same płytki magnetyczne i przesuwające się nad nimi głowice odczytu/zapisu.


Ewolucja dysków twardych na tle linijki calowej (fot " Wikipedia " )

Niestety to właśnie cechy tej technologii powodują dwa główne problemy związane z użytkowaniem dysków twardych. Pierwszą z nich jest zbyt mała prędkość zapisu, odczytu i przesyłania informacji z dysku do procesora. We współczesnym komputerze to dysk twardy jest najwolniejszym urządzeniem, od którego często zależy wydajność całego systemu jako całości.

Drugim problemem jest niewystarczające bezpieczeństwo informacji przechowywanych na dysku twardym. Jeśli Twój dysk twardy ulegnie uszkodzeniu, możesz bezpowrotnie utracić wszystkie zapisane na nim dane. I dobrze, jeśli straty ograniczają się do utraty rodzinnego albumu ze zdjęciami (choć w sumie niewiele w tym dobrego). Zniszczenie ważnych informacji finansowych i marketingowych może spowodować upadek przedsiębiorstwa.

Częściową ochroną przechowywanych informacji jest regularne tworzenie kopii zapasowych wszystkich lub tylko ważnych danych na dysku twardym. Ale nawet w tym przypadku, jeśli się zepsuje, część danych, która została zaktualizowana od czasu ostatniej kopii zapasowej, zostanie utracona.

Na szczęście istnieją metody, które mogą pomóc przezwyciężyć powyższe wady tradycyjnych dysków twardych. Jedną z takich metod jest utworzenie macierzy RAID składających się z kilku dysków twardych.

Co to jest RAID

W Internecie, a nawet we współczesnej literaturze komputerowej często można spotkać się z terminem „macierz RAID”, który w rzeczywistości jest tautologią, ponieważ skrót RAID (redundant array of niezależnych dysków) oznacza już „nadmiarową tablicę niezależnych dysków”.

Nazwa w pełni oddaje fizyczne znaczenie takich macierzy - jest to zestaw dwóch lub więcej dysków twardych. Wspólną pracą tych dysków steruje specjalny kontroler. W wyniku działania kontrolera takie macierze są postrzegane przez system operacyjny jako jeden dysk twardy i użytkownik może nie myśleć o niuansach zarządzania pracą każdego dysku twardego z osobna.

Istnieje kilka głównych typów macierzy RAID, z których każdy ma inny wpływ na ogólną niezawodność i szybkość macierzy w porównaniu z pojedynczymi dyskami. Oznaczone są umowną liczbą od 0 do 6. Podobne oznaczenie ze szczegółowym opisem architektury i zasady działania układów zaproponowali specjaliści z Uniwersytetu Kalifornijskiego w Berkeley. Oprócz siedmiu głównych typów RAID możliwe są również różne ich kombinacje. Rozważmy je dalej.

Jest to najprostszy typ macierzy dysków twardych, którego głównym celem jest zwiększenie wydajności podsystemu dyskowego komputera. Osiąga się to poprzez podzielenie strumieni zapisanych (odczytanych) informacji na kilka podstrumieni, które są jednocześnie zapisywane (odczytywane) na kilku dyskach twardych. W rezultacie całkowita prędkość wymiany informacji np. w przypadku macierzy dwudyskowych wzrasta o 30-50% w porównaniu z jednym dyskiem twardym tego samego typu.

Całkowita objętość macierzy RAID 0 jest równa sumie woluminów znajdujących się w niej dysków twardych. Informacje dzielone są na bloki danych o stałej długości, niezależnie od długości nagrywanych plików.

Główną zaletą RAID 0 jest znaczne zwiększenie szybkości wymiany informacji pomiędzy systemem dyskowym bez utraty użytecznej pojemności dysków twardych. Wadą jest zmniejszenie ogólnej niezawodności systemu przechowywania. Jeśli którykolwiek z dysków RAID 0 ulegnie awarii, wszystkie informacje zapisane w macierzy zostaną utracone na zawsze.

Podobnie jak w przypadku tablicy omówionej powyżej, ten typ tablicy jest również najprostszy w organizacji. Zbudowany jest w oparciu o dwa dyski twarde, z których każdy jest dokładnym (lustrzanym) odbiciem drugiego. Informacje są zapisywane równolegle na obu dyskach w macierzy. Dane odczytywane są jednocześnie z obu dysków w sekwencyjnych blokach (równolegle żądanie), co skutkuje niewielkim wzrostem prędkości odczytu w porównaniu do pojedynczego dysku twardego.

Całkowita pojemność macierzy RAID 1 jest równa pojemności mniejszego dysku twardego w macierzy.

Zalety RAID 1: wysoka niezawodność przechowywania informacji (dane są nieuszkodzone, dopóki przynajmniej jeden z dysków wchodzących w skład macierzy jest nienaruszony) i pewien wzrost prędkości odczytu. Wadą jest to, że kupując dwa dyski twarde, uzyskujesz użyteczną pojemność tylko jednego. Pomimo utraty połowy objętości użytecznej, macierze „lustrzane” cieszą się dość dużą popularnością ze względu na wysoką niezawodność i stosunkowo niski koszt – para dysków jest wciąż tańsza niż cztery czy osiem.

Przy konstruowaniu tych tablic wykorzystuje się algorytm odzyskiwania informacji wykorzystujący kody Hamminga (amerykański inżynier, który opracował ten algorytm w 1950 roku w celu korygowania błędów w działaniu komputerów elektromechanicznych). Aby zapewnić działanie tego kontrolera RAID, tworzone są dwie grupy dysków - jedna do przechowywania danych, druga grupa do przechowywania kodów korekcji błędów.

Ten typ RAID stał się mniej powszechny w systemach domowych ze względu na nadmierną redundancję liczby dysków twardych - na przykład w macierzy siedmiu dysków twardych tylko cztery zostaną przeznaczone na dane. Wraz ze wzrostem liczby dysków redundancja maleje, co odzwierciedla poniższa tabela.

Główną zaletą RAID 2 jest możliwość korygowania błędów na bieżąco bez zmniejszania szybkości wymiany danych pomiędzy macierzą dyskową a procesorem centralnym.

RAID3 i RAID4

Konstrukcja tych dwóch typów macierzy dyskowych jest bardzo podobna. Obydwa korzystają z wielu dysków twardych do przechowywania informacji, z których jeden służy wyłącznie do przechowywania sum kontrolnych. Do utworzenia RAID 3 i RAID 4 wystarczą trzy dyski twarde. W przeciwieństwie do RAID 2, odzyskiwanie danych na bieżąco nie jest możliwe – informacje są przywracane po pewnym czasie wymiany uszkodzonego dysku twardego.

Różnica między RAID 3 i RAID 4 polega na poziomie partycjonowania danych. W RAID 3 informacje są dzielone na pojedyncze bajty, co prowadzi do poważnego spowolnienia podczas zapisu/odczytu dużej liczby małych plików. RAID 4 dzieli dane na osobne bloki, których rozmiar nie przekracza rozmiaru jednego sektora na dysku. W rezultacie wzrasta prędkość przetwarzania małych plików, co jest krytyczne w przypadku komputerów osobistych. Z tego powodu RAID 4 stał się bardziej powszechny.

Istotną wadą rozważanych macierzy jest zwiększone obciążenie dysku twardego przeznaczonego do przechowywania sum kontrolnych, co znacznie zmniejsza jego zasoby.

Macierze dyskowe tego typu są w rzeczywistości rozwinięciem schematu RAID 3/RAID 4. Cechą charakterystyczną jest to, że do przechowywania sum kontrolnych nie jest używany oddzielny dysk - są one równomiernie rozłożone na wszystkich dyskach twardych macierzy. Efektem dystrybucji jest możliwość równoległego zapisu na kilku dyskach jednocześnie, co nieznacznie zwiększa prędkość wymiany danych w porównaniu do RAID 3 czy RAID 4. Wzrost ten nie jest jednak tak znaczący, gdyż na obliczenia wydawane są dodatkowe zasoby systemowe sumy kontrolne za pomocą operacji „wyłącznej lub”. Jednocześnie prędkość odczytu znacznie wzrasta, ponieważ możliwa jest prosta równoległość procesu.

Minimalna liczba dysków twardych do zbudowania macierzy RAID 5 to trzy.

Tablice zbudowane w schemacie RAID 5 mają bardzo istotną wadę. Jeśli po wymianie jakikolwiek dysk ulegnie awarii, całkowite przywrócenie informacji zajmie kilka godzin. W tym czasie nienaruszone dyski twarde macierzy działają w trybie superintensywnym, co znacznie zwiększa prawdopodobieństwo awarii drugiego dysku i całkowitej utraty informacji. Chociaż rzadko, zdarza się to. Ponadto podczas przywracania RAID 5 macierz jest prawie całkowicie zajęta przez ten proces, a bieżące operacje zapisu/odczytu wykonywane są z dużymi opóźnieniami. Chociaż dla większości zwykłych użytkowników nie jest to krytyczne, w sektorze korporacyjnym takie opóźnienia mogą prowadzić do pewnych strat finansowych.

W dużej mierze powyższy problem rozwiązuje się konstruując tablice w schemacie RAID 6. W strukturach tych do przechowywania sum kontrolnych przydzielana jest objętość pamięci równa objętości dwóch dysków twardych, które również są rozdzielane cyklicznie i równomiernie na różne dyski . Zamiast jednej wyliczane są dwie sumy kontrolne, co gwarantuje integralność danych w przypadku jednoczesnej awarii dwóch dysków twardych w macierzy.

Zaletami RAID 6 jest wysoki stopień bezpieczeństwa informacji i mniejsza utrata wydajności niż w RAID 5 podczas odzyskiwania danych w przypadku wymiany uszkodzonego dysku.

Wadą RAID 6 jest to, że ogólna prędkość wymiany danych jest zmniejszona o około 10% ze względu na wzrost wolumenu niezbędnych obliczeń sum kontrolnych, a także ze względu na wzrost wolumenu zapisywanych/odczytywanych informacji.

Połączone typy RAID

Oprócz głównych typów omówionych powyżej, szeroko stosowane są różne ich kombinacje, które rekompensują pewne wady prostego RAID. W szczególności powszechne jest stosowanie schematów RAID 10 i RAID 0+1. W pierwszym przypadku para lustrzanych macierzy jest łączona w RAID 0, w drugim natomiast dwie macierze RAID 0 są łączone w lustro. W obu przypadkach zwiększona wydajność RAID 0 jest dodawana do bezpieczeństwa informacji RAID 1.

Często w celu podniesienia poziomu ochrony ważnych informacji stosuje się schematy konstrukcyjne RAID 51 lub RAID 61 – dublowanie już wysoko chronionych macierzy zapewnia wyjątkowe bezpieczeństwo danych w przypadku jakichkolwiek awarii. Jednak wdrażanie takich macierzy w domu jest niepraktyczne ze względu na nadmierną redundancję.

Budowa macierzy dyskowej – od teorii do praktyki

Za budowę i zarządzanie pracą dowolnej macierzy RAID odpowiada wyspecjalizowany kontroler RAID. Ku wielkiej uldze przeciętnego użytkownika komputera osobistego, w większości nowoczesnych płyt głównych kontrolery te są już zaimplementowane na poziomie mostka południowego chipsetu. Aby więc zbudować macierz dysków twardych, wystarczy zakupić odpowiednią ich liczbę i określić żądany typ RAID w odpowiedniej sekcji ustawień BIOS-u. Następnie zamiast kilku dysków twardych w systemie zobaczysz tylko jeden, który w razie potrzeby można podzielić na partycje i dyski logiczne. Należy pamiętać, że osoby nadal korzystające z systemu Windows XP będą musiały zainstalować dodatkowy sterownik.

Zewnętrzny kontroler RAID z czterema portami SATA

Należy pamiętać, że zintegrowane kontrolery z reguły potrafią tworzyć RAID 0, RAID 1 i ich kombinacje. Tworzenie bardziej złożonych macierzy nadal będzie wymagało zakupu osobnego kontrolera.

I na koniec jeszcze jedna rada - aby stworzyć RAID, kupuj dyski twarde o tej samej pojemności, tego samego producenta, tego samego modelu i najlepiej z tej samej partii. Wtedy zostaną wyposażone w te same zestawy logiczne i praca macierzy tych dysków będzie najbardziej stabilna.

NALOT(Język angielski) Nadmiarowa Macierz Niezależnych Dysków - nadmiarowa macierz niezależnych dysków twardych)- macierz kilku dysków sterowanych przez kontroler, połączonych ze sobą szybkimi kanałami i postrzeganych przez system zewnętrzny jako jedną całość. W zależności od rodzaju użytej macierzy może ona zapewniać różny stopień odporności na uszkodzenia i wydajności. Służy do zwiększenia niezawodności przechowywania danych i/lub zwiększenia szybkości odczytu/zapisu informacji. Początkowo takie macierze budowano jako kopie zapasowe nośników w oparciu o kosztowną wówczas pamięć o dostępie swobodnym (RAM). Z biegiem czasu skrót nabrał drugiego znaczenia - macierz składała się już z niezależnych dysków, co sugerowało użycie kilku dysków, a nie partycji jednego dysku, a także wysoki koszt (obecnie stosunkowo tylko kilka dysków) sprzętu konieczne do zbudowania tej właśnie tablicy.

Przyjrzyjmy się, jakie istnieją macierze RAID. Przyjrzyjmy się najpierw poziomom, które zaprezentowali naukowcy z Berkeley, następnie ich kombinacjom i nietypowym trybom. Warto zauważyć, że w przypadku użycia dysków o różnych rozmiarach (co nie jest zalecane), będą one działać z najmniejszym woluminem. Dodatkowa pojemność dużych dysków po prostu nie będzie dostępna.

RAID 0. Macierz dyskowa rozłożona bez odporności na błędy/parzystości (Stripe)

Jest to tablica, w której dane dzielone są na bloki (wielkość bloku można ustawić podczas tworzenia tablicy), a następnie zapisywane na oddzielnych dyskach. W najprostszym przypadku są dwa dyski, jeden blok jest zapisywany na pierwszym dysku, drugi na drugim, potem znowu na pierwszym i tak dalej. Tryb ten nazywany jest także „przeplataniem”, gdyż przy zapisie bloków danych przeplatane są dyski, na których dokonywany jest zapis. W związku z tym bloki są również odczytywane jeden po drugim. W ten sposób operacje we/wy są wykonywane równolegle, co zapewnia lepszą wydajność. Jeśli wcześniej mogliśmy odczytać jeden blok na jednostkę czasu, teraz możemy to zrobić z kilku dysków jednocześnie. Główną zaletą tego trybu jest duża prędkość przesyłania danych.

Jednak cuda się nie zdarzają, a jeśli się zdarzają, to są one rzadkie. Wydajność nie wzrasta N razy (N to liczba dysków), ale mniej. Po pierwsze, czas dostępu do dysku zwiększa się N-krotnie, co jest już i tak wysokie w porównaniu do innych podsystemów komputerowych. Równie istotny wpływ ma jakość sterownika. Jeśli nie jest najlepsza, to prędkość może ledwo zauważalnie różnić się od prędkości pojedynczego dysku. Otóż ​​interfejs, za pomocą którego kontroler RAID jest podłączony do reszty systemu, ma niebagatelny wpływ. Wszystko to może prowadzić nie tylko do wzrostu prędkości odczytu liniowego mniejszego od N, ale także do ograniczenia liczby dysków, powyżej którego nie będzie żadnego wzrostu. Lub odwrotnie, nieznacznie zmniejszy prędkość. W rzeczywistych zadaniach, przy dużej liczbie żądań, szansa na napotkanie tego zjawiska jest minimalna, ponieważ prędkość jest bardzo mocno ograniczona przez sam dysk twardy i jego możliwości.

Jak widać, w tym trybie nie ma redundancji jako takiej. Całe miejsce na dysku jest wykorzystywane. Jeśli jednak jeden z dysków ulegnie awarii, wówczas oczywiście wszystkie informacje zostaną utracone.

RAID 1. Kopia lustrzana

Istotą tego trybu RAID jest utworzenie kopii (lustrzanej) dysku w celu zwiększenia odporności na awarie. Jeśli jeden dysk ulegnie awarii, praca nie zostaje zatrzymana, ale kontynuowana, ale z jednym dyskiem. Ten tryb wymaga parzystej liczby dysków. Idea tej metody jest zbliżona do tworzenia kopii zapasowych, jednak wszystko dzieje się na bieżąco, podobnie jak odzyskiwanie po awarii (co czasami jest bardzo ważne) i nie ma potrzeby tracić na to czasu.

Wady: duża redundancja, ponieważ do utworzenia takiej macierzy potrzeba dwa razy więcej dysków. Kolejną wadą jest brak wzrostu wydajności - w końcu kopia danych z pierwszego dysku jest po prostu zapisywana na drugim dysku.

Macierz RAID 2 wykorzystująca odporny na błędy kod Hamminga.

Ten kod pozwala poprawić i wykryć podwójne błędy. Aktywnie stosowany w pamięci korygującej błędy (ECC). W tym trybie dyski podzielone są na dwie grupy – jedna część służy do przechowywania danych i działa podobnie do RAID 0, dzieląc bloki danych na różne dyski; druga część służy do przechowywania kodów ECC.

Zalety obejmują korekcję błędów w locie i dużą prędkość przesyłania strumieniowego danych.

Główną wadą jest duża redundancja (przy małej liczbie dysków jest prawie dwukrotnie większa, n-1). Wraz ze wzrostem liczby dysków konkretna liczba dysków przechowujących kody ECC staje się mniejsza (zmniejsza się określona redundancja). Drugą wadą jest niska prędkość pracy z małymi plikami. Ze względu na swoją objętość i wysoką redundancję przy małej liczbie dysków, ten poziom RAID nie jest obecnie używany, ustępując miejsca wyższym poziomom.

RAID 3. Tablica odporna na błędy z rozkładem bitów i parzystością.

Ten tryb zapisuje dane blok po bloku na różnych dyskach, np. RAID 0, ale wykorzystuje inny dysk do przechowywania z parzystością. Tym samym redundancja jest znacznie mniejsza niż w RAID 2 i obejmuje tylko jeden dysk. Jeśli jeden dysk ulegnie awarii, prędkość pozostaje praktycznie niezmieniona.

Wśród głównych wad należy zwrócić uwagę na niską prędkość podczas pracy z małymi plikami i wieloma żądaniami. Wynika to z faktu, że wszystkie kody sterujące są przechowywane na jednym dysku i muszą być przepisywane podczas operacji we/wy. Szybkość tego dysku ogranicza prędkość całej macierzy. Bity parzystości są zapisywane tylko wtedy, gdy zapisywane są dane. A podczas czytania są sprawdzane. Z tego powodu występuje brak równowagi w szybkości odczytu/zapisu. Pojedynczy odczyt małych plików charakteryzuje się także małą szybkością, co wynika z braku możliwości równoległego dostępu z niezależnych dysków, gdy różne dyski wykonują równolegle żądania.

RAID 4

Dane zapisywane są blokami na różne dyski, jeden dysk służy do przechowywania bitów parzystości. Różnica w stosunku do RAID 3 polega na tym, że bloki są podzielone nie na bity i bajty, ale na sektory. Korzyści obejmują duże prędkości transferu podczas pracy z dużymi plikami. Szybkość pracy z dużą liczbą żądań odczytu jest również wysoka. Wśród niedociągnięć można wymienić te odziedziczone po RAID 3 – brak równowagi w szybkości operacji odczytu/zapisu oraz występowanie warunków utrudniających równoległy dostęp do danych.

RAID 5. Macierz dyskowa z rozłożeniem i rozproszoną parzystością.

Metoda jest podobna do poprzedniej, z tym że zamiast przydzielać bity parzystości osobnego dysku, informacja ta jest rozdzielana pomiędzy wszystkie dyski. Oznacza to, że jeśli używanych jest N dysków, dostępna będzie pojemność N-1 dysków. Wolumin jeden zostanie przydzielony na bity parzystości, tak jak w RAID 3.4. Ale nie są one przechowywane na osobnym dysku, ale oddzielone. Każdy dysk zawiera (N-1)/N ilości informacji, a 1/N tej ilości jest wypełniona bitami parzystości. W przypadku awarii jednego dysku w macierzy, pozostaje on sprawny (dane na nim przechowywane są obliczane na podstawie parzystości i danych pozostałych dysków „w locie”). Oznacza to, że awaria występuje w sposób niezauważalny dla użytkownika, a czasami nawet przy minimalnym spadku wydajności (w zależności od możliwości obliczeniowych kontrolera RAID). Wśród zalet zauważamy duże prędkości odczytu i zapisu danych, zarówno przy dużych wolumenach, jak i przy dużej liczbie żądań. Wady: trudne odzyskiwanie danych i niższa prędkość odczytu niż RAID 4.

RAID 6. Macierz dyskowa z funkcją stripingu i podwójną rozproszoną parzystością.

Różnica polega na zastosowaniu dwóch schematów parzystości. System jest odporny na awarie dwóch dysków. Główną trudnością jest to, że aby to zaimplementować, musisz wykonać więcej operacji podczas zapisu. Z tego powodu prędkość zapisu jest bardzo niska.

Połączone (zagnieżdżone) poziomy RAID.

Ponieważ macierze RAID są przezroczyste dla systemu operacyjnego, wkrótce nadszedł czas na utworzenie tablic, których elementami nie są dyski, ale tablice innych poziomów. Zwykle są pisane z plusem. Pierwsza liczba oznacza, jaki poziom tablic jest zawarty jako elementy, a druga liczba oznacza, jaki rodzaj organizacji ma najwyższy poziom, który łączy elementy.

RAID 0+1

Kombinacja będąca macierzą RAID 1 zbudowaną w oparciu o macierze RAID 0. Podobnie jak w macierzy RAID 1 dostępna będzie tylko połowa pojemności dysku. Ale podobnie jak w przypadku RAID 0, prędkość będzie wyższa niż w przypadku pojedynczego dysku. Do wdrożenia takiego rozwiązania wymagane są minimum 4 dyski.

RAID 1+0

Znany również jako RAID 10. Jest to pas lustrzany, czyli macierz RAID 0 zbudowana z macierzy RAID 1. Prawie podobne do poprzedniego rozwiązania.

RAID 0+3

Tablica z dedykowaną parzystością na pasku. Jest to tablica trzeciego poziomu, w której dane dzielone są na bloki i zapisywane w macierzach RAID 0. Kombinacje inne niż najprostsze 0+1 i 1+0 wymagają specjalistycznych kontrolerów, często dość drogich. Niezawodność tego typu jest niższa niż w przypadku następnej opcji.

RAID 3+0

Znany również jako RAID 30. Jest to pasek (tablica RAID 0) z macierzy RAID 3. Charakteryzuje się bardzo dużą szybkością przesyłania danych w połączeniu z dobrą odpornością na awarie. Dane są najpierw dzielone na bloki (jak w RAID 0) i umieszczane w tablicach elementów. Tam są ponownie dzielone na bloki, obliczana jest ich parzystość, bloki są zapisywane na wszystkich dyskach z wyjątkiem jednego, na który zapisywane są bity parzystości. W takim przypadku jeden z dysków każdej z macierzy RAID 3 może ulec awarii.

RAID 5+0 (50)

Powstaje poprzez połączenie macierzy RAID 5 w macierz RAID 0. Charakteryzuje się dużą szybkością przesyłania danych i przetwarzania zapytań. Ma średnią prędkość odzyskiwania danych i dobrą odporność na awarie. Istnieje również kombinacja RAID 0+5, ale bardziej teoretycznie, ponieważ zapewnia zbyt mało korzyści.

RAID 5+1 (51)

Połączenie dublowania i paskowania z rozproszoną parzystością. Opcjonalnie dostępna jest również macierz RAID 15 (1+5). Charakteryzuje się bardzo wysoką odpornością na uszkodzenia. Macierz 1+5 może działać w przypadku trzech awarii dysków, a macierz 5+1 może działać w przypadku pięciu z ośmiu dysków.

RAID 6+0 (60)

Przeplatanie z podwójną rozproszoną parzystością. Inaczej mówiąc strip z RAID 6. Jak już wspomniano w odniesieniu do RAID 0+5, RAID 6 z pasków nie stał się powszechny (0+6). Podobne techniki (usuwanie tablic z parzystością) mogą zwiększyć prędkość tablicy. Kolejną korzyścią jest to, że można łatwo zwiększyć pojemność bez komplikowania opóźnień wymaganych do obliczenia i zapisania większej liczby bitów parzystości.

RAID 100 (10+0)

RAID 100, pisany również jako RAID 10+0, to fragment RAID 10. W istocie jest podobny do szerszej macierzy RAID 10, która wykorzystuje dwa razy więcej dysków. Ale ta „trzypiętrowa” konstrukcja ma swoje własne wyjaśnienie. Najczęściej RAID 10 tworzony jest sprzętowo, czyli za pomocą kontrolera, a paski tworzone są z nich programowo. Tę sztuczkę stosuje się, aby uniknąć problemu, o którym mowa na początku artykułu - kontrolery mają swoje własne ograniczenia skalowalności i jeśli podłączysz podwójną liczbę dysków do jednego kontrolera, w pewnych warunkach możesz nie zauważyć żadnego wzrostu na Wszystko. Programowy RAID 0 pozwala na utworzenie go w oparciu o dwa kontrolery, z których każdy zawiera na pokładzie RAID 10. Unikamy w ten sposób „wąskiego gardła” reprezentowanego przez kontroler. Kolejnym przydatnym punktem jest obejście problemu maksymalnej liczby złączy na jednym kontrolerze - podwajając ich liczbę, podwajamy liczbę dostępnych złączy.

Niestandardowe tryby RAID

Podwójna parzystość

Powszechnym dodatkiem do wymienionych poziomów RAID jest podwójna parzystość, czasami wdrażana i dlatego nazywana „parzystością diagonalną”. Podwójna parzystość jest już zaimplementowana w RAID 6. Jednak w przeciwieństwie do niej, parzystość jest zliczana względem innych bloków danych. Niedawno specyfikacja RAID 6 została rozszerzona, więc parzystość diagonalną można uznać za RAID 6. W przypadku RAID 6 za parzystość uważa się wynik dodania modulo 2 bitów z rzędu (tj. sumy pierwszego bitu na pierwszym dysk, pierwszy bit na drugim itd.), następuje przesunięcie parzystości przekątnej. Nie zaleca się pracy w trybie awarii dysku (ze względu na trudność w obliczaniu utraconych bitów z sum kontrolnych).

Jest to rozwinięcie macierzy RAID NetApp z podwójną parzystością i podlega zaktualizowanej definicji RAID 6. Wykorzystuje schemat zapisu danych inny niż klasyczna implementacja RAID 6. Zapis odbywa się najpierw w pamięci podręcznej NVRAM, która jest zasilana przez zasilacz awaryjny, aby zapobiec utracie danych w przypadku przerwy w dostawie prądu. Jeśli to możliwe, oprogramowanie kontrolera zapisuje na dyskach tylko pełne bloki. Ten schemat zapewnia lepszą ochronę niż RAID 1 i jest szybszy niż zwykła RAID 6.

RAID 1.5

Zostało zaproponowane przez Highpoint, ale obecnie jest bardzo często używane w kontrolerach RAID 1, bez żadnego nacisku na tę funkcję. Istota sprowadza się do prostej optymalizacji - dane są zapisywane jak na zwykłą macierz RAID 1 (czyli czym w zasadzie jest 1.5), a dane są odczytywane z dwóch dysków w formie przeplatanej (tak jak w RAID 0). W konkretnej implementacji firmy Highpoint, zastosowanej na płytach z serii DFI LanParty na chipsecie nForce 2, wzrost był ledwo zauważalny, a czasem nawet zerowy. Prawdopodobnie wynika to z ogólnie niskiej prędkości kontrolerów tego producenta w tamtym czasie.

Łączy RAID 0 i RAID 1. Utworzony na co najmniej trzech dyskach. Dane zapisywane są z przeplotem na trzech dyskach, a kopia zapisana z przesunięciem o 1 dysk. Jeśli jeden blok jest zapisany na trzech dyskach, wówczas kopia pierwszej części jest zapisywana na drugim dysku, a kopia drugiej części jest zapisywana na trzecim dysku. W przypadku korzystania z parzystej liczby dysków lepiej jest oczywiście zastosować RAID 10.

Zazwyczaj podczas budowania RAID 5 jeden dysk pozostaje wolny (zapasowy), dzięki czemu w przypadku awarii system od razu przystępuje do odbudowy macierzy. Podczas normalnej pracy napęd ten pracuje na biegu jałowym. System RAID 5E polega na wykorzystaniu tego dysku jako elementu macierzy. Objętość tego wolnego dysku jest rozprowadzana po całej macierzy i znajduje się na końcu dysków. Minimalna ilość dysków to 4 sztuki. Dostępny wolumin to n-2, wolumin jednego dysku jest używany (rozdzielany pomiędzy wszystkich) do zapewnienia parzystości, wolumin drugiego jest wolny. W przypadku awarii dysku macierz jest kompresowana do 3 dysków (na przykładzie minimalnej liczby), wypełniając wolne miejsce. Efektem jest zwykła macierz RAID 5, odporna na awarię kolejnego dysku. Po podłączeniu nowego dysku tablica powiększa się i ponownie zajmuje wszystkie dyski. Warto zaznaczyć, że podczas kompresji i dekompresji dysk nie jest odporny na wyjście innego dysku. W tej chwili nie jest to również odczyt/zapis. Główną zaletą jest większa szybkość działania, ponieważ striping odbywa się na większej liczbie dysków. Minusem jest to, że dysku tego nie można przypisać do kilku macierzy jednocześnie, co jest możliwe w prostej macierzy RAID 5.

RAID 5EE

Różni się od poprzedniego jedynie tym, że obszary wolnej przestrzeni na dyskach nie są rezerwowane w jednym kawałku na końcu dysku, lecz przeplatane blokami z bitami parzystości. Technologia ta znacznie przyspiesza odzyskiwanie danych po awarii systemu. Bloki można zapisywać bezpośrednio na wolnej przestrzeni, bez konieczności poruszania się po dysku.

Podobnie jak RAID 5E, wykorzystuje dodatkowy dysk w celu poprawy wydajności i rozkładu obciążenia. Wolna przestrzeń jest dzielona pomiędzy inne dyski i znajduje się na końcu dysków.

Technologia ta jest zastrzeżonym znakiem towarowym firmy Storage Computer Corporation. Macierz oparta na RAID 3, 4 zoptymalizowana pod kątem wydajności. Główną zaletą jest zastosowanie buforowania odczytu/zapisu. Żądania przesłania danych realizowane są asynchronicznie. Dyski SCSI są używane podczas budowy. Prędkość jest około 1,5-6 razy większa niż w przypadku rozwiązań RAID 3.4.

Intel Matrix RAID

To technologia wprowadzona przez firmę Intel w mostkach południowych, począwszy od ICH6R. Istota sprowadza się do możliwości łączenia macierzy RAID o różnych poziomach na partycjach dysku, a nie na poszczególnych dyskach. Załóżmy, że na dwóch dyskach można zorganizować dwie partycje, dwie z nich będą przechowywać system operacyjny na macierzy RAID 0, a dwie pozostałe – pracujące w trybie RAID 1 – będą przechowywać kopie dokumentów.

Linux MD RAID 10

Jest to sterownik RAID jądra Linuksa, który zapewnia możliwość stworzenia bardziej zaawansowanej wersji RAID 10. Zatem jeśli dla RAID 10 istniało ograniczenie w postaci parzystej liczby dysków, to ten sterownik może pracować z nieparzystym . Zasada dla trzech dysków będzie taka sama jak w przypadku RAID 1E, gdzie dyski są rozkładane pojedynczo w celu utworzenia kopii i rozkładania bloków, jak w RAID 0. W przypadku czterech dysków będzie to równoważne zwykłej macierzy RAID 10. Ponadto możesz określić, w którym obszarze na dysku będzie przechowywana kopia. Załóżmy, że oryginał będzie w pierwszej połowie pierwszej płyty, a jego kopia będzie w drugiej połowie drugiej. W przypadku drugiej połowy danych jest odwrotnie. Dane można powielać wielokrotnie. Przechowywanie kopii na różnych częściach dysku pozwala na osiągnięcie wyższych prędkości dostępu w wyniku niejednorodności dysku twardego (szybkość dostępu różni się w zależności od umiejscowienia danych na talerzu, zwykle różnica jest dwukrotna).

Opracowany przez Kaleidescape do użytku w ich urządzeniach multimedialnych. Podobny do RAID 4 wykorzystujący podwójną parzystość, ale wykorzystuje inną metodę odporności na błędy. Użytkownik może łatwo rozbudować macierz poprzez proste dodanie dysków, a jeśli zawiera ona dane, dane zostaną po prostu do niej dodane, a nie usunięte, jak to zwykle jest wymagane.

Opracowany przez firmę Sun. Największym problemem RAID 5 jest utrata informacji na skutek awarii zasilania, gdy informacje z dyskowej pamięci podręcznej (która jest pamięcią ulotną, czyli nie przechowuje danych bez prądu) nie mają czasu na zapisanie ich na dysku talerze magnetyczne. Ta niezgodność informacji w pamięci podręcznej i na dysku nazywana jest niespójnością. Sama organizacja macierzy jest powiązana z systemem plików Sun Solaris – ZFS. Stosowany jest wymuszony zapis zawartości pamięci podręcznej dysku, dzięki czemu można przywrócić nie tylko cały dysk, ale także blok „w locie”, gdy suma kontrolna się nie zgadza. Kolejnym ważnym aspektem jest ideologia ZFS – nie zmienia danych, gdy jest to konieczne. Zamiast tego zapisuje zaktualizowane dane, a następnie upewniając się, że operacja się już powiodła, zmienia wskaźnik na nie. Dzięki temu można uniknąć utraty danych podczas modyfikacji. Małe pliki są duplikowane zamiast tworzyć sumy kontrolne. Robi to również system plików, ponieważ zna strukturę danych (tablica RAID) i może przydzielić miejsce na te cele. Istnieje również RAID-Z2, który podobnie jak RAID 6 może przetrwać dwie awarie dysków, korzystając z dwóch sum kontrolnych.

Coś, co w zasadzie nie jest RAID, ale często jest używane razem z nim. W dosłownym tłumaczeniu „tylko kilka dysków” Technologia łączy wszystkie dyski zainstalowane w systemie w jeden duży dysk logiczny. Oznacza to, że zamiast trzech dysków widoczny będzie jeden duży. Wykorzystywana jest cała całkowita pojemność dysku. Nie ma przyspieszenia, nie ma niezawodności, nie ma wydajności.

Przedłużacz dysku

Funkcja zawarta w Windows Home Server. Łączy JBOD i RAID 1. Jeśli konieczne jest utworzenie kopii, nie powiela ona natychmiast pliku, ale umieszcza na partycji NTFS etykietę wskazującą dane. W stanie bezczynności system kopiuje plik tak, aby maksymalnie wykorzystać miejsce na dysku (można używać dysków o różnych rozmiarach). Pozwala osiągnąć wiele zalet RAID - odporność na awarie i możliwość łatwej wymiany uszkodzonego dysku i przywracania go w tle, przejrzystość lokalizacji pliku (niezależnie od tego, na którym dysku się on znajduje). Możliwe jest również wykonywanie dostępu równoległego z różnych dysków przy użyciu powyższych etykiet, uzyskując wydajność podobną do RAID 0.

Opracowany przez Lime Technology LLC. Schemat ten różni się od konwencjonalnych macierzy RAID tym, że umożliwia łączenie dysków SATA i PATA w jednej macierzy oraz dysków o różnych rozmiarach i prędkościach. Dedykowany dysk służy do sumy kontrolnej (parzystości). Dane nie są rozkładane pomiędzy dyskami. Jeśli jeden dysk ulegnie awarii, utracone zostaną tylko pliki na nim zapisane. Można je jednak przywrócić za pomocą parzystości. UNRAID jest zaimplementowany jako dodatek do Linux MD (wielodyskowy).

Większość typów macierzy RAID nie jest szeroko rozpowszechniona; niektóre są używane w wąskich obszarach zastosowań. Najbardziej rozpowszechnione, od zwykłych użytkowników po serwery podstawowe, są RAID 0, 1, 0+1/10, 5 i 6. Decyzja, czy potrzebujesz macierzy RAID do swoich zadań, zależy od Ciebie. Teraz już wiesz, czym się od siebie różnią.

Zacznijmy od małego: „tablica RAID” lub potocznie „RAID”, co to jest?

NALOT to skrót oznaczający (po angielsku: „Redundant Array of Independent Disks”), co w języku rosyjskim oznacza „nadmiarową (zapasową) macierz niezależnych dysków”.
Mówiąc najprościej, „macierz RAID” to połączenie fizycznych dysków twardych w jeden logiczny.
Dysk logiczny– jest to zwykły dysk HDD podzielony na kilka logicznych dysków. Jest to zwykle używane w komputerach stacjonarnych; kilka jest wykonanych z jednego.
Jak wspomniano powyżej, zwykły dysk fizyczny można podzielić na kilka logicznych. W „RAID” wszystko dzieje się na odwrót - w elemencie łączącym (gdzie będą przechowywane) instalowanych jest kilka dysków HDD, a następnie system operacyjny postrzega wszystkie dyski HDD jako jeden. tzn. system operacyjny ma 100% pewność, że jest do niego podłączony tylko jeden dysk fizyczny.

Jakie są rodzaje macierzy RAID?Istnieją tylko 2 typy, sprzęt i oprogramowanie:

1) Sprzętowe macierze RAID- zwykle tworzone przed załadowaniem systemu operacyjnego przy użyciu specjalistycznych narzędzi zainstalowanych (na stałe) w „kontrolerze RAID” - coś w rodzaju „BIOS”. Po tym przetwarzaniu, gdy podłączysz „macierz RAID”, system operacyjny na etapie instalacji postrzega dyski twarde jako jeden.

2) Programowe macierze RAID- powstają poprzez podłączenie dysków HDD do dowolnego systemu operacyjnego. tzn. po podłączeniu dysków HDD wykrywa kilka dysków fizycznych i dopiero za pomocą systemu operacyjnego, za pomocą oprogramowania, dyski HDD są łączone w jedną macierz. Sam system operacyjny nie będzie zlokalizowany na samej „tablicy RAID”, ponieważ jest instalowany przed utworzeniem macierzy.

"Po co to jest?"- masz pytanie! Odpowiedź jest prosta: w celu zwiększenia szybkości odczytu i zapisu danych lub poprawy bezpieczeństwa i odporności na awarie.
Przyjrzyjmy się, jak w końcu „macierz RAID” zwiększa wydajność i bezpieczeństwo Twoich danych?” - aby odpowiedzieć na to pytanie, przyjrzymy się różnym typom „tablic RAID”, jak są one tworzone i co z tego wynika z tego.

Rozważ „RAID-0”:

Więcej niż jeden dysk twardy jest łączony w jeden za pomocą połączenia szeregowego, po czym woluminy są sumowane, tj. - jeśli weźmiemy kilka dysków HDD, z których każdy ma pojemność „500 GB” i utworzymy z nich „RAID-0”, to system operacyjny potraktuje zainstalowane dyski HDD jako jeden, sumując je, z czego otrzymamy jeden dysk HDD o pojemności 1000Gb (1Tb). Po połączeniu dysków w jedną macierz prędkość odczytu i zapisu dysku będzie dwukrotnie większa niż w przypadku oddzielnych dysków.

Przykład– baza danych zlokalizowana na dwóch fizycznych dyskach HDD, z których jeden użytkownik będzie jedynie odczytywał dane, drugi natomiast będzie zapisywał dane na innym dysku HDD i będą to wszystko robić jednocześnie. Jeśli jednak baza danych będzie zlokalizowana tylko na jednym dysku, to sam dysk HDD będzie przez swoje oprogramowanie pełnił funkcję odczytu lub zapisu sekwencyjnie dla zupełnie różnych użytkowników. Macierz RAID-0 zapewni możliwość równoległego odczytu i zapisu. Na podstawie prędkości możesz wywnioskować - ile dysków HDD znajduje się w Twojej macierzy RAID-0, pomnóż liczbę Ito przez istniejącą prędkość (przy tej prędkości Twoja RAID-0 będzie działać szybciej) - cała zależność macierzy jest proporcjonalna - prędkość żądań dysków twardych wzrasta N razy, gdzie N = liczba dysków twardych zainstalowanych w macierzy.

Macierz RAID-0 ma tylko jedną wadę, ten minus przeważa nad wszystkim, nawet zaletami jej użytkowania - macierz RAID-0 nie jest odporna na awarie. Problem jest następujący: jeśli jeden z fizycznych dysków twardych zainstalowanych w macierzy ulegnie awarii, cała macierz umrze.
Jest na ten temat stary żart: „Co oznacza „0” w RAID-0? - ilość informacji przywracanych po śmierci macierzy!” (choć to wcale nie jest zabawne, jeśli jest tam coś bardzo ważnego).

Następnie rozważ tablicę „RAID-1”:

Kilka lub więcej dysków HDD łączy się w jeden instalując je w wyspecjalizowanej macierzy, tj. jeśli weźmiesz kilka dysków HDD o pojemności 500 GB i zrobisz z nich macierz „RAID-1”, system operacyjny będzie postrzegał to jako jedną macierz o pojemności 500 GB.
Szybkość odczytu i zapisu macierzy „RAID-1” będzie dokładnie taka sama, jak jednego dysku HDD, ponieważ odczyt i zapis będą odbywały się na obu dyskach HDD jednocześnie.
Macierz RAID-1 nie zwiększy szybkości produkcji, ale zapewnia odporność na awarie; w przypadku awarii jednego z dysków twardych, drugi dysk twardy będzie miał pełną kopię zapasową informacji. Jeżeli dane zostaną celowo usunięte z macierzy, to usunięcie nastąpi z obu dysków jednocześnie!

Następnie rozważymy tablicę „RAID-5”:

Najbezpieczniejszą opcją jest RAID-5. Wypełnianie tablicy informacjami odbywa się poprzez obliczenia, według wzoru „(N - 1) * DiskSize”, gdzie liczba N to liczba dysków HDD znajdujących się w tablicy, a skrót „DiskSize” to objętość każdego zainstalowany dysk HDD, tj. tworząc macierz w wersji „RAID-5” składającą się z 3 dysków HDD, każdy o pojemności 500GB, otrzymamy macierz o pojemności 1000Gb na 1 terabajt.

Istota macierzy RAID-5 jest następująca - kilka dysków HDD jest łączonych w „RAID-0”, a na trzecim dysku HDD (który nie jest brany pod uwagę) będzie przechowywany, nazwijmy to „sumą kontrolną” - jest to informacja mająca na celu przywrócenie jednego z dysków macierzy, w przypadku jego śmierci. Macierz RAID-5 ma nieco niższą prędkość zapisu, ponieważ obliczenie i zapisanie powstałej kwoty na dodatkowym dysku zajmuje niewiele czasu, podczas gdy prędkość odczytu pozostaje taka sama jak w macierzy RAID-0.
Jeśli zdarzy się, że jeden z dysków twardych w macierzy RAID-5 ulegnie awarii, prędkość odczytu i zapisu natychmiast gwałtownie spadnie, ponieważ wszystkim wykonywanym operacjom towarzyszą dodatkowe działania manipulacyjne.

W rzeczywistości RAID-5 zamienia się w RAID-0 i jeśli nie zadbasz o przywrócenie macierzy RAID w odpowiednim czasie, istnieje znaczne ryzyko całkowitej utraty danych.
Równolegle z macierzą RAID-5 możliwe jest zastosowanie „dysku zapasowego” – zapasowego. Podczas stabilnej pracy macierzy RAID dysk zapasowy nie jest używany i znajduje się w stanie bezczynności. Jednak w przypadku jakiejkolwiek krytycznej sytuacji odzyskiwanie kopii zapasowej „macierzy RAID” rozpocznie się w trybie automatycznym - informacje z uszkodzonego dysku twardego zostaną przywrócone na zapasowy dysk twardy za pomocą sum kontrolnych, które znajdują się na oddzielnym dysku twardym.
Macierz „RAID-5” jest zwykle tworzona z co najmniej trzech dysków twardych i pozwala chronić dane tylko przed pojedynczymi błędami. Jeżeli na różnych dyskach twardych jednocześnie pojawiają się różne błędy, to macierz RAID-5 nie pomoże.

Następna jest tablica „RAID-6”:

Ma ulepszone możliwości w porównaniu do macierzy „RAID-5”. Generalnie istota pracy jest taka sama jak w przypadku macierzy RAID-5, tyle że wyliczanie sum kontrolnych odbywać się będzie nie na jednym dysku HDD, a na dwóch dyskach HDD, a całe wyliczanie sum kontrolnych odbywa się przy użyciu zupełnie innych algorytmów, co przyczynia się do znacznego zwiększenia odporności na awarie całej „macierzy RAID” jako całości. Macierz RAID-6 składa się głównie z 4 dysków twardych. Wzór używany do obliczenia wielkości pamięci tablicy jest następujący - (N - 2) * DiskSize, gdzie N to liczba dysków twardych zainstalowanych w macierzy, a „DiskSize” to wielkość pamięci każdego dysku HDD, tj. podczas tworzenia macierzy „RAID-6” składającej się z pięciu dysków HDD o wartości nominalnej 500 GB, łączna ilość będzie stanowić macierz o rozmiarze 1500 Gb (1,5 TB-terabajtów).
Szybkość macierzy RAID-6 podczas zapisu będzie niższa niż macierzy RAID-5 o około 10-15%, spadek prędkości wynika z dodatkowego czasu poświęcanego na obliczanie i zapisywanie sum kontrolnych.

Tablica „RAID-10”:

Czasami nazywany jest „RAID 0+1” lub „RAID 1+0”, co stanowi symbiozę „RAID-0 i RAID-1”. Macierz ta tworzona jest zazwyczaj z co najmniej czterech dysków HDD: na pierwszej partycji „RAID-0” i na drugiej „RAID-0”, w celu zwiększenia szybkości odczytu i zapisu będą one umieszczone między sobą w lustro macierzy „RAID-1” - jest to konieczne, aby zwiększyć odporność na awarie. Macierz RAID-10 udało się połączyć zalety dwóch pierwszych opcji – co przełożyło się na jej wydajność i odporność na awarie.

Macierz „RAID-50” jest analogiem „RAID-10”, co jest symbiozą „RAID-0 i RAID-5” - w rzeczywistości jest składana jako macierz „RAID-5”, tylko składnik elementy, które się w nim znajdą, nie będą fizycznymi dyskami HDD, a składać się będzie z macierzy planu „RAID-0”. W ten sposób macierz RAID-50 zapewni niezwykłą prędkość odczytu i zapisu podczas pracy oraz przyczyni się do stabilności i niezawodności RAID-5.

Następna jest tablica „RAID-60”:

Ta sama zasada: w rzeczywistości jest to „RAID-6”, złożony z kilku macierzy „RAID-0”.
Istnieją inne kombinacje tablic, takie jak „RAID 5+1 / RAID 6+1” - w rzeczywistości są one podobne do „RAID-50 / RAID-60” z tą różnicą, że podstawą ich elementów tablicy nie jest „ RAID-0”, jak inne, a tablice lustrzane to „RAID-1”.

Koncepcje dotyczące połączonych macierzy „RAID”:

Zasadniczo takie macierze jak „RAID-10” / „RAID-50” / „RAID-60” i „RAID X+1”- są to bezpośredni następcy podstawowych macierzy, takich jak „RAID-0” / RAID-1 / RAID-5 i RAID-6 - są używane głównie w celu zwiększenia prędkości odczytu lub zapisu lub w celu zwiększenia odporności na awarie, przy użyciu standardowej funkcjonalności podstawowe, standardowe typy macierzy RAID.

Jeśli spojrzymy na to z praktycznego punktu widzenia i omówimy zastosowania dowolnych „tablic RAID” w życiu, to logicznie wszystko jest dość proste:

1) Macierz RAID-0 nieużywany w czystej postaci (w ogóle!);
2) „RAID-1” macierz stosuje się głównie tam, gdzie prędkość odczytu lub zapisu nie odgrywa szczególnie dużej roli, a w większym stopniu wymagana jest odporność na awarie - przykładowo: bardzo dobrze jest instalować różne systemy operacyjne na macierzy „RAID-1”. W takim przypadku nikt poza systemem operacyjnym nie ma dostępu do dysków twardych, prędkość samych dysków twardych jest wystarczająca do działania i zapewniona jest odporność na awarie;
3) RAID-5 instalujemy go tam, gdzie wymagana jest szybkość i odporność na awarie, ale nie ma możliwości dokupienia większej ilości dysków HDD lub gdy zachodzi potrzeba regeneracji macierzy w przypadku uszkodzenia, a jednocześnie praca samej macierzy nie zostaje zatrzymana - w tym przypadku pomocne będą dyski zapasowe.
4) Standardowe zastosowanie macierzy RAID-5:
W przechowywaniu danych lub jak są one również nazywane serwerem NAS;
5) Tablica „RAID-6”:
Stosowane jest tam, gdzie istnieje ryzyko jednoczesnej awarii kilku dysków twardych w macierzy. W praktyce praktycznie tak nie jest, chyba że dotyczy to osób paranoicznych;
6) Tablica „RAID-10”:
Stosowane są tam, gdzie wymagana jest szybkość, szybkość pracy i niezawodność. Ponadto głównym kierunkiem wykorzystania macierzy RAID-10 są serwery baz danych i serwery plików.

To w zasadzie wszystko, co chciałem dowiedzieć się, co jest co i dlaczego!

W zależności od wybranej specyfikacji RAID można poprawić prędkość odczytu i zapisu i/lub ochronę przed utratą danych.

Pracując z podsystemami dyskowymi, specjaliści IT często stają przed dwoma głównymi problemami.

  • Pierwszą z nich jest niska prędkość odczytu/zapisu; czasami nawet prędkość dysku SSD nie jest wystarczająca.
  • Drugim jest awaria dysków, co oznacza utratę danych, których odzyskanie może być niemożliwe.

Obydwa te problemy rozwiązuje się wykorzystując technologię RAID (nadmiarową macierz niezależnych dysków) – technologię wirtualnego przechowywania danych, która łączy kilka dysków fizycznych w jeden element logiczny.

W zależności od wybranej specyfikacji RAID można poprawić prędkość odczytu/zapisu i/lub ochronę przed utratą danych.

Poziomy specyfikacji RAID to: 1,2,3,4,5,6,0. Ponadto istnieją kombinacje: 01,10,50,05,60,06. W tym artykule przyjrzymy się najpopularniejszym typom macierzy RAID. Ale najpierw powiedzmy, że istnieją sprzętowe i programowe macierze RAID.

Sprzętowe i programowe macierze RAID

  • Macierze programowe powstają po instalacji systemu operacyjnego przy użyciu oprogramowania i narzędzi, co jest główną wadą takich macierzy dyskowych.
  • Sprzętowe macierze RAID tworzą macierz dyskową przed instalacją systemu operacyjnego i nie są od niej zależne.

RAID 1

RAID 1 (zwany także „Mirror” – Mirror) polega na całkowitej duplikacji danych z jednego dysku fizycznego na drugi.

Wady RAID 1 obejmują fakt, że zyskujesz połowę miejsca na dysku. Te. Jeśli używasz DWÓCH dysków 250 GB, system zobaczy tylko JEDEN dysk o pojemności 250 GB. Ten typ RAID nie zapewnia przyrostu prędkości, ale znacznie zwiększa poziom odporności na awarie, ponieważ w przypadku awarii jednego dysku zawsze pozostaje jego pełna kopia. Nagrywanie i kasowanie z dysków odbywa się jednocześnie. Jeśli informacje zostały celowo usunięte, nie będzie możliwości przywrócenia ich z innego dysku.

RAID0

RAID 0 (zwany także Stripingiem) polega na dzieleniu informacji na bloki i jednoczesnym zapisywaniu różnych bloków na różnych dyskach.

Technologia ta zwiększa prędkość odczytu/zapisu, pozwala użytkownikowi wykorzystać pełną całkowitą pojemność dysków, ale zmniejsza odporność na uszkodzenia, a raczej zmniejsza ją do zera. Jeśli więc jeden z dysków ulegnie awarii, przywrócenie informacji będzie prawie niemożliwe. Do zbudowania RAID 0 zaleca się stosowanie wyłącznie dysków o dużej niezawodności.

RAID 5 można nazwać bardziej zaawansowanym RAID 0. Można używać maksymalnie 3 dysków twardych. Na wszystkich oprócz jednego zapisywany jest Raid 0, a na ostatnim rejestrowana jest specjalna suma kontrolna, która pozwala zapisać informacje na dyskach twardych w przypadku „śmierci” jednego z nich (ale nie więcej niż jednego). Szybkość działania takiego układu jest wysoka. Jeśli wymienisz dysk, zajmie to dużo czasu.

RAID 2, 3, 4

Są to metody rozproszonego przechowywania informacji z wykorzystaniem dysków przydzielonych na kody parzystości. Różnią się od siebie jedynie wielkością bloków. W praktyce praktycznie nie są one stosowane ze względu na konieczność przeznaczania dużej części pojemności dysku na przechowywanie kodów ECC i/lub parzystości, a także ze względu na niską wydajność.

RAID 10

Jest to połączenie macierzy RAID 1 i 0.Łączy w sobie zalety każdego z nich: wysoką wydajność i wysoką odporność na awarie.

Tablica musi zawierać parzystą liczbę dysków (minimum 4) i jest najbardziej niezawodną opcją przechowywania informacji. Wadą jest wysoki koszt macierzy dyskowej: efektywna pojemność będzie stanowić połowę całkowitej pojemności miejsca na dysku.

Jest mieszanką macierzy RAID 5 i 0. RAID 5 jest w budowie, ale jego elementami nie będą niezależne dyski twarde, ale macierze RAID 0.

Osobliwości.

Jeśli kontroler RAID ulegnie awarii, przywrócenie informacji jest prawie niemożliwe (nie dotyczy Mirror). Nawet jeśli kupisz dokładnie ten sam kontroler, istnieje duże prawdopodobieństwo, że RAID zostanie złożony z innych sektorów dysku, co oznacza utratę informacji na dyskach.

Z reguły dyski kupowane są w jednej partii. W związku z tym ich żywotność zawodowa może być w przybliżeniu taka sama. W takim przypadku zaleca się od razu, w momencie zakupu dysków do macierzy, dokupić ich nadmiar. Na przykład, aby skonfigurować RAID 10 z 4 dyskami, należy kupić 5 dysków. Jeśli więc jeden z nich ulegnie awarii, możesz szybko go wymienić na nowy, zanim ulegną awarii inne dyski.

Wnioski.

W praktyce najczęściej stosowane są tylko trzy typy macierzy RAID. Są to RAID 1, RAID 10 i RAID 5.

Jeśli chodzi o koszt/wydajność/tolerancję na błędy, zaleca się stosowanie:

  • RAID 1(kopiowanie) w celu utworzenia podsystemu dyskowego dla systemów operacyjnych użytkownika.
  • RAID 10 dla danych o wysokich wymaganiach dotyczących szybkości zapisu i odczytu. Na przykład do przechowywania baz danych 1C:Enterprise, serwera pocztowego, AD.
  • RAID5 używany do przechowywania danych plików.

Zdaniem większości administratorów systemu idealnym rozwiązaniem serwerowym jest serwer z sześcioma dyskami. Obydwa dyski są „kopiowane”, a system operacyjny jest zainstalowany w macierzy RAID 1. Cztery pozostałe dyski są połączone w macierz RAID 10, co zapewnia szybkie, bezproblemowe i niezawodne działanie systemu.

RAID 0, RAID 1, RAID 5, RAID 10 lub jakie są poziomy RAID?

Odwiedzający forum zadają nam pytanie: „Który poziom RAID jest najbardziej niezawodny?” Każdy wie, że najpopularniejszym poziomem jest RAID5, jednak nie jest on pozbawiony poważnych wad, które nie są oczywiste dla niespecjalistów.

RAID 0, RAID 1, RAID 5, RAID 10 lub jakie są poziomy RAID?
W tym artykule postaram się scharakteryzować najpopularniejsze poziomy RAID, a następnie sformułować zalecenia dotyczące stosowania tych poziomów. Dla zilustrowania artykułu stworzyłem diagram, na którym umieściłem te poziomy w trójwymiarowej przestrzeni niezawodności, wydajności i efektywności kosztowej.
JBOD (Just a Bunch of Disks) to proste łączenie dysków twardych, które formalnie nie jest poziomem RAID. Wolumin JBOD może być tablicą pojedynczego dysku lub agregacją wielu dysków. Kontroler RAID nie musi wykonywać żadnych obliczeń, aby obsługiwać taki wolumen. Na naszym schemacie dysk JBOD służy jako „pojedynczy” lub punkt wyjścia — jego niezawodność, wydajność i wartości kosztowe są takie same jak w przypadku pojedynczego dysku twardego.

RAID 0 („Striping”) nie charakteryzuje się redundancją i natychmiast rozprowadza informacje na wszystkich dyskach wchodzących w skład macierzy w postaci małych bloków („pasków”). Z tego powodu wydajność znacznie wzrasta, ale cierpi na tym niezawodność. Podobnie jak w przypadku JBOD, za nasze pieniądze dostajemy 100% pojemności dysku.

Pozwólcie, że wyjaśnię, dlaczego spada niezawodność przechowywania danych na dowolnym woluminie złożonym - ponieważ w przypadku awarii któregokolwiek z dysków twardych w nim zawartych, wszystkie informacje zostaną całkowicie i nieodwracalnie utracone. Zgodnie z teorią prawdopodobieństwa, z matematycznego punktu widzenia, niezawodność woluminu RAID0 jest równa iloczynowi niezawodności jego dysków składowych, z których każdy jest mniejszy niż jeden, więc całkowita niezawodność jest oczywiście niższa niż niezawodność dowolnego dysku.

Dobrym poziomem jest RAID 1 („Mirroring”, „mirror”). Posiada zabezpieczenie przed awarią połowy dostępnego sprzętu (w ogólnym przypadku jednego z dwóch dysków twardych), zapewnia akceptowalną prędkość zapisu i przyrost prędkości odczytu dzięki równoległości żądań. Wadą jest to, że aby uzyskać użyteczną pojemność jednego dysku twardego, trzeba zapłacić koszt dwóch dysków twardych.

Początkowo zakłada się, że dysk twardy jest rzeczą niezawodną. Odpowiednio prawdopodobieństwo awarii dwóch dysków jednocześnie jest równe (zgodnie ze wzorem) iloczynowi prawdopodobieństw, tj. rzędy wielkości niżej! Niestety, prawdziwe życie to nie teoria! Dwa dyski twarde pochodzą z tej samej partii i działają w tych samych warunkach, a jeśli jeden z dysków ulegnie awarii, obciążenie drugiego wzrasta, więc w praktyce, jeśli jeden z dysków ulegnie awarii, należy podjąć pilne działania w celu przywrócenia nadmierność. W tym celu zaleca się użycie dysków HotSpare z dowolnym poziomem RAID (z wyjątkiem zera). Zaletą tego podejścia jest utrzymanie stałej niezawodności. Wadą są jeszcze większe koszty (tj. koszt 3 dysków twardych do przechowywania wolumenu jednego dysku).

Lustro na wielu dyskach to poziom RAID 10. Podczas korzystania z tego poziomu lustrzane pary dysków układane są w „łańcuch”, dzięki czemu powstały wolumen może przekroczyć pojemność pojedynczego dysku twardego. Zalety i wady są takie same jak w przypadku poziomu RAID1. Podobnie jak w innych przypadkach, zaleca się włączenie do macierzy dysków HotSpare HotSpare w ilości jednego dysku zapasowego na każdych pięciu pracowników.

RAID 5 jest rzeczywiście najpopularniejszym z poziomów, przede wszystkim ze względu na opłacalność. Poświęcając pojemność tylko jednego dysku z macierzy na rzecz redundancji, zyskujemy ochronę przed awarią któregokolwiek z dysków twardych wolumenu. Zapisywanie informacji na woluminie RAID5 wymaga dodatkowych zasobów, ponieważ wymagane są dodatkowe obliczenia, ale podczas odczytu (w porównaniu z oddzielnym dyskiem twardym) występuje korzyść, ponieważ strumienie danych z kilku dysków macierzy są równoległe.

Wady RAID5 pojawiają się, gdy jeden z dysków ulegnie awarii - cały wolumin przechodzi w tryb krytyczny, wszystkim operacjom zapisu i odczytu towarzyszą dodatkowe manipulacje, wydajność gwałtownie spada, a dyski zaczynają się nagrzewać. Jeśli nie zostaną podjęte natychmiastowe działania, możesz utracić cały wolumen. Dlatego (patrz wyżej) zdecydowanie powinieneś używać dysku Hot Spare z woluminem RAID5.

Oprócz opisanych w standardzie podstawowych poziomów RAID0 – RAID5, istnieją łączone poziomy RAID10, RAID30, RAID50, RAID15, które różnie są interpretowane przez różnych producentów.

Istota takich kombinacji jest w skrócie następująca. RAID10 to kombinacja jednego i zera (patrz wyżej). RAID50 to kombinacja woluminów poziomu 5 „0”. RAID15 jest „lustrem” „piątek”. I tak dalej.

Zatem połączone poziomy dziedziczą zalety (i wady) swoich „rodziców”. Zatem pojawienie się „zera” na poziomie RAID 50 wcale nie zwiększa jego niezawodności, ale ma pozytywny wpływ na wydajność. RAID 15 może i jest bardzo niezawodny, ale nie jest najszybszy i jest również wyjątkowo marnotrawny (użyteczna pojemność wolumenu jest o połowę mniejsza niż oryginalna macierz dyskowa).

RAID 6 różni się od RAID 5 tym, że każdy wiersz danych (w języku angielskim) ma nie jeden, ale dwa bloki sum kontrolnych. Sumy kontrolne są „wielowymiarowe”, tj. niezależne od siebie, dzięki czemu nawet awaria dwóch dysków w macierzy pozwala na zapisanie oryginalnych danych. Obliczanie sum kontrolnych metodą Reeda-Solomona wymaga bardziej intensywnych obliczeń w porównaniu do RAID5, dlatego wcześniej poziom szósty praktycznie nie był używany. Teraz jest obsługiwany przez wiele produktów, ponieważ zaczęto instalować specjalistyczne mikroukłady, które wykonują wszystkie niezbędne operacje matematyczne.

Według niektórych badań przywrócenie integralności po awarii pojedynczego dysku na wolumenie RAID5 składającym się z dużych dysków SATA (400 i 500 gigabajtów) kończy się utratą danych w 5% przypadków. Innymi słowy, w jednym przypadku na dwadzieścia, podczas regeneracji macierzy RAID5 na dysk zapasowy Hot Spare, drugi dysk może ulec awarii... Stąd zalecenia dotyczące najlepszych dysków RAID: 1) zawsze wykonuj kopie zapasowe; 2) użyj RAID6!

Ostatnio pojawiły się nowe poziomy RAID1E, RAID5E, RAID5EE. Litera „E” w nazwie oznacza Enhanced.

Ulepszony poziom RAID 1 (RAID poziom 1E) łączy dublowanie i rozkładanie danych. Ta mieszanina poziomów 0 i 1 jest ułożona w następujący sposób. Dane w rzędzie są dystrybuowane dokładnie tak, jak w RAID 0. Oznacza to, że wiersz danych nie jest redundancyjny. Następny rząd bloków danych kopiuje poprzedni z przesunięciem o jeden blok. Zatem, podobnie jak w standardowym trybie RAID 1, każdy blok danych ma kopię lustrzaną na jednym z dysków, więc użyteczna objętość macierzy jest równa połowie całkowitej objętości dysków twardych wchodzących w skład macierzy. RAID 1E wymaga do działania kombinacji trzech lub więcej dysków.

Bardzo podoba mi się poziom RAID1E. Do wydajnej stacji graficznej lub nawet do komputera domowego - najlepszy wybór! Ma wszystkie zalety poziomu zerowego i pierwszego - doskonałą prędkość i wysoką niezawodność.

Przejdźmy teraz do ulepszonego poziomu RAID 5 (poziom RAID 5E). Działa to tak samo, jak RAID5, tylko z dyskiem zapasowym wbudowanym w macierz. Integracja ta odbywa się w następujący sposób: na wszystkich dyskach macierzy pozostaje 1/N części wolnego miejsca, które w przypadku awarii jednego z dysków wykorzystywane jest jako hot-spare. Dzięki temu RAID5E, oprócz niezawodności, charakteryzuje się lepszą wydajnością, ponieważ odczyt/zapis odbywa się równolegle z większej liczby dysków w tym samym czasie, a dysk zapasowy nie jest bezczynny, jak w RAID5. Oczywiście dysk kopii zapasowej zawarty w woluminie nie może być współużytkowany z innymi woluminami (dedykowanymi czy współdzielonymi). Wolumin RAID 5E jest zbudowany na co najmniej czterech dyskach fizycznych. Objętość użyteczną woluminu logicznego oblicza się za pomocą wzoru N-2.

RAID poziom 5E Enhanced (RAID poziom 5EE) jest podobny do RAID poziomu 5E, ale ma bardziej efektywną alokację dysków zapasowych, a co za tym idzie, szybszy czas odzyskiwania. Podobnie jak poziom RAID5E, ten poziom RAID rozdziela bloki danych i sumy kontrolne w wierszach. Ale dystrybuuje także wolne bloki dysku zapasowego, a nie po prostu rezerwuje część miejsca na dysku do tych celów. Skraca to czas wymagany do odtworzenia integralności woluminu RAID5EE. Dysk kopii zapasowej zawarty w wolumenie nie może być współużytkowany z innymi woluminami - tak jak w poprzednim przypadku. Wolumin RAID 5EE jest zbudowany na co najmniej czterech dyskach fizycznych. Objętość użyteczną woluminu logicznego oblicza się za pomocą wzoru N-2.

Co ciekawe, w Internecie nie znalazłem żadnej wzmianki o poziomie RAID 6E – na razie taki poziom nie jest oferowany ani nawet zapowiadany przez żadnego producenta. Ale poziom RAID6E (lub RAID6EE?) można zaoferować na tej samej zasadzie, co poprzedni. Dysk HotSpare musi towarzyszyć każdemu wolumenowi RAID, w tym RAID 6. Oczywiście nie stracimy informacji w przypadku awarii jednego lub dwóch dysków, jednak niezwykle ważne jest, aby jak najwcześniej rozpocząć regenerację integralności macierzy, aby szybko przywrócić system wyszedł ze stanu „krytycznego”. Ponieważ zapotrzebowanie na dysk Hot Spare nie budzi dla nas wątpliwości, logicznym byłoby pójść dalej i „rozłożyć” go tak, jak ma to miejsce w przypadku RAID 5EE, aby uzyskać korzyści wynikające z wykorzystania większej liczby dysków (lepiej przeczytać -szybkość zapisu i szybsze przywracanie integralności).

Poziom
~~~~~~~ Redundancja Wykorzystanie pojemności dysku Wydajność odczytu Wydajność zapisu Wbudowany dysk zapasowy Min. liczba dysków Maks. liczba dysków
RAID 0 nie 100% Doskonała Doskonała nie 1 16
RAID 1 + 50% Chorus + Chorus + brak 2 2
RAID 10 + 50% Chorus + Chorus + brak 4 16
RAID 1E + 50% Chorus + Chorus + nr 3 16
RAID 5 + 67-94% Znakomity Dobry nie 3 16
RAID 5E + 50-88% Doskonały chór + 4 16
RAID 5EE + 50-88% Doskonały chór + 4 16
RAID 6 + 50-88% Doskonała Dobra nie 4 16
RAID 00 nie 100% Doskonała Doskonała nie 2 60
RAID 1E0 + 50% Chorus + Chorus + brak 6 60
RAID 50 + 67-94% Znakomity Dobry nr 6 60
RAID 15 + 33-48% Znakomity Dobry nr 6 60

Wszystkie poziomy „lustrzane” to RAID 1, 1+0, 10, 1E, 1E0.

Spróbujmy jeszcze raz, aby dokładnie zrozumieć, czym różnią się te poziomy?

RAID 1.
To klasyczne „lustro”. Dwa (i tylko dwa!) dyski twarde pracują jako jeden, będąc swoją pełną kopią. Awaria któregokolwiek z tych dwóch dysków nie powoduje utraty danych, ponieważ kontroler kontynuuje pracę na pozostałym dysku. RAID1 w liczbach: 2x redundancja, 2x niezawodność, 2x koszt. Wydajność zapisu jest porównywalna z wydajnością pojedynczego dysku twardego. Wydajność odczytu jest wyższa, ponieważ kontroler może rozdzielać operacje odczytu między dwa dyski.

RAID 10.
Istotą tego poziomu jest to, że dyski macierzy są łączone parami w „lustrzane” (RAID 1), a następnie wszystkie te pary lustrzane są z kolei łączone we wspólną macierz pasiastą (RAID 0). Dlatego czasami określa się go mianem RAID 1+0. Ważną kwestią jest to, że w RAID 10 można łączyć tylko parzystą liczbę dysków (minimum 4, maksymalnie 16). Zalety: niezawodność jest dziedziczona od „lustra”, wydajność zarówno odczytu, jak i zapisu jest dziedziczona od „zera”.

RAID1E.
Litera „E” w nazwie oznacza „Enhanced”, czyli „Enhanced”. "ulepszony". Zasada tego ulepszenia jest następująca: dane są „rozbierane” blokowo na wszystkich dyskach macierzy, a następnie ponownie „rozbierane” z przesunięciem na jeden dysk. RAID 1E może łączyć od trzech do 16 dysków. Niezawodność odpowiada „dziesięciu” wskaźnikom, a wydajność staje się nieco lepsza dzięki większej „przemienności”.

RAID1E0.
Poziom ten implementujemy w następujący sposób: tworzymy tablicę „null” z tablic RAID1E. Dlatego łączna liczba dysków musi być wielokrotnością trzech: minimum trzy i maksymalnie sześćdziesiąt! W tym przypadku raczej nie uzyskamy przewagi szybkościowej, a złożoność wdrożenia może niekorzystnie wpłynąć na niezawodność. Główną zaletą jest możliwość łączenia bardzo dużej (nawet 60) liczby dysków w jedną macierz.

Podobieństwo wszystkich poziomów RAID 1X polega na ich wskaźnikach redundancji: ze względu na niezawodność poświęca się dokładnie 50% całkowitej pojemności dysków macierzy.