Dzisiaj wyjaśnimy, dlaczego RAID to nie backup. Temat dla większości osób związanych ze światem IT jest dobrze znany, ale pomimo zwiększającej się świadomości właścicieli (szczególnie małych firm) cały czas słyszę powielany mit: „Mamy RAID, więc mamy backup”. Oczywiście jest to błędna teza i już wyjaśniam dlaczego.
Duże organizacje dysponują zazwyczaj zespołami inżynierów, którzy doskonale wiedzą, jak zabezpieczyć infrastrukturę i znają różnicę między tymi dwoma pojęciami. W mniejszych firmach, w których brakuje budżetu oraz odpowiednich specjalistów, wciąż bardzo często pojawia się pytanie o to, jaki RAID najlepiej zabezpieczy ich dane.
W rzeczywistości należałoby to pytanie sformułować inaczej: który RAID jest najlepszy, aby utrzymać ciągłość działania w przypadku awarii jednego lub kilku dysków? Wyjaśnijmy to sobie już na samym początku. RAID w żaden sposób nie jest backupem danych. Nie jest to mechanizm tworzący kolejną kopię, z której będziemy mogli odtworzyć informacje na przykład po ataku ransomware. Zwiększa on jedynie dostępność danych w przypadku fizycznej awarii dysku, ale nie uchroni nas przed błędem użytkownika, awarią całego serwera lub macierzy, złośliwym oprogramowaniem czy innymi zewnętrznymi zagrożeniami.
Czym w takim razie jest RAID?
Mówiąc bardziej technicznie, RAID to mechanizm łączący kilka dysków fizycznych w jeden wolumen. Użytkownik widzi po prostu jeden wspólny zasób, na którym może zapisywać dane. Taka konfiguracja pozwala zwiększyć wydajność zapisu i odczytu, jednak wszystko zależy od konkretnego zapotrzebowania. Do najpopularniejszych grup RAID należą:
- RAID 0 – Zacznijmy od podstaw, choć warto zaznaczyć, że ta grupa w żaden sposób nie chroni naszych danych i nie jest wykorzystywana w kontekście bezpieczeństwa. Jej zadaniem jest wyłącznie maksymalizacja wydajności. Dyski są tu łączone w jedną dużą pulę logiczną tzw. striping. Wyobraźmy sobie dwa dyski o pojemności 10 TB. Konfiguracja RAID 0 daje nam 20 TB przestrzeni surowej, ponieważ dane rozkładane są naprzemiennie na obu nośnikach. Haczyk? W przypadku uszkodzenia choćby jednego dysku cała grupa ulega degradacji, a my bezpowrotnie tracimy dostęp do wszystkich danych.
- RAID 1 – Najczęściej wykorzystywany pod system operacyjny. Wymaga dwóch dysków, które są ze sobą połączone, a na każdym z nich znajduje się lustrzane odbicie drugiego. Co to oznacza w praktyce? Posiadając dwa dyski o pojemności 960 GB, ich łączna pojemność fizyczna wynosi 1920 GB, ale użytkownik ma do wykorzystania tylko połowę. Dzieje się tak, ponieważ RAID 1 tworzy kopię lustrzaną i zapisując dane, musi je umieścić jednocześnie na obu nośnikach. W przypadku awarii jednego z nich posiadamy dokładnie te same dane na drugim, co gwarantuje nieprzerwaną pracę. Po wymianie uszkodzonego nośnika musi wykonać się ponowna synchronizacja danych. Niestety, jednoczesna awaria dwóch dysków oznacza całkowitą utratę danych i zatrzymanie pracy.
- RAID 5 – Jedna z najpopularniejszych grup. Do działania potrzebuje minimum trzech dysków. W tej konfiguracji może uszkodzić się jeden dysk bez utraty dostępu do danych. Pojemność użytkowa jest obliczana według wzoru N minus 1, gdzie N to liczba dysków. Mając trzy dyski po 960 GB, całkowita pojemność to 2880 GB, ale do dyspozycji mamy 1920 GB. Bity parzystości są rozłożone w taki sposób, że przy awarii jednego dysku praca może trwać bez zakłóceń. Sytuacja komplikuje się przy awarii dwóch dysków. Tracimy wtedy dane i praca nie jest już możliwa. Tu z pomocą przychodzi kolejna grupa.
- RAID 6 – W tym przypadku bity parzystości są rozłożone tak, że aż dwa dyski są nadmiarowe. Oznacza to, że mogą one ulec awarii jednocześnie, a my nadal zachowamy dostęp do danych. Wymaga to użycia minimum czterech dysków. Trzeba jednak wziąć pod uwagę większą utratę dostępnej przestrzeni, liczoną jako N minus 2. Przy czterech dyskach 960 GB do dyspozycji pozostaje nam tylko połowa miejsca, czyli 1920 GB. Zyskujemy tu znacznie wyższe bezpieczeństwo kosztem wydajności oraz przestrzeni.
- RAID 10 – Grupę tę można najprościej opisać jako połączenie RAID 1 oraz omawianego wcześniej RAID 0. Tworzone są tu podgrupy skonfigurowane w RAID 1, a następnie każda z tych podgrup jest połączona w jedną dużą przestrzeń za pomocą stripingu z RAID 0. Konfiguracja ta wymaga minimum czterech dysków, zapewnia wysoką wydajność oraz dobrą odporność na awarie. Pojemność użytkowa to zawsze 50% całkowitej pojemności.
- RAID 50 i RAID 60 – Grupy budowane analogicznie do RAID 10. RAID 50 łączy podgrupy RAID 5 za pomocą RAID 0, więc w każdej podgrupie może uszkodzić się jeden dysk bez utraty danych. Z kolei RAID 60 łączy podgrupy RAID 6 za pomocą RAID 0, więc w każdej podgrupie mogą uszkodzić się aż dwa nośniki. Niestety, jeśli awaria dysków przekroczy tolerancję wewnątrz jednej podgrupy, to utracimy dostęp do danych.
Przed czym RAID nas NIE chroni?
Teoria za nami, przejdźmy do praktyki. Dlaczego RAID nas nie uchroni? Weźmy przykład z życia.
Wyobraźmy sobie, że posiadamy firmowy serwer NAS, na którym skonfigurowaliśmy dowolną grupę RAID z redundancją. Pewnego dnia do naszego środowiska wpada ransomware. Co się dzieje? Wszystkie pliki, jeden po drugim, zostają zaszyfrowane. Czy RAID jest w stanie nas przed tym ochronić? Nie ma takiej możliwości. Ransomware traktuje pliki i modyfikuje je dokładnie tak samo, jak zrobiłby to człowiek. Zmienia zawartość bloków danych na dysku, a RAID posłusznie te zmiany zapisuje.
Wyobraźmy sobie inny scenariusz. Nasza księgowa pracuje bezpośrednio na serwerze z grupą RAID. Na co dzień tworzy nowe faktury, zapisując powiedzmy 100 dokumentów dziennie. Pewnego dnia przychodzi do biura i przypadkowo usuwa katalog zawierający wszystkie faktury z poprzedniego dnia, pomijając już kwestię, dlaczego w ogóle miała uprawnienia do kasowania całych katalogów na serwerze. Księgowa klika polecenie usuwania, a RAID w żaden sposób nie pomaga. Dane znikają natychmiast ze wszystkich dysków w grupie i nie możemy ich odzyskać standardowymi metodami z poziomu systemu. Oczywiście istnieją profesjonalne metody odzyskiwania danych, które czasem potrafią pomóc, ale w warunkach domowych/biurowych pliki po prostu przepadły.
Podsumowując, RAID w żadnym wypadku nie chroni nas przed:
- Przypadkowym lub celowym usunięciem danych.
- Atakami typu ransomware.
- Błędem administratora lub użytkownika.
- Logicznym uszkodzeniem plików.
Czym w takim razie jest backup i dlaczego ratuje sytuację?
Backup to pełnoprawna kopia naszych systemów i danych, przechowywana na odosobnionym nośniku, na przykład na serwerze NAS, w chmurze czy na tasiemkach w bibliotece taśmowej. W wielkim uproszczeniu to proces przypominający operację kopiuj i wklej do innej, całkowicie bezpiecznej lokalizacji, realizowany za pomocą najczęściej jakiegoś oprogramowania.
Wróćmy do naszej księgowej, która omyłkowo usunęła cały katalog z fakturami. Tym razem posiadamy jednak regularnie wykonywaną kopię zapasową na innym urządzeniu. Zakładając, że backup wykonał się poprzedniego wieczoru, gdy faktury były jeszcze na swoim miejscu, jesteśmy uratowani. Wystarczy kilka kliknięć, by w każdej chwili odzyskać usunięty katalog i przywrócić wszystkie dane. Właśnie dlatego backup skutecznie naprawia błędy, w przypadku których nawet najlepszy RAID po prostu rozkłada ręce.
Dobry backup powinien spełniać następujące warunki:
- Być wykonywany w oparciu o metodykę np. regułę 3-2-1 lub 3-2-1-1,
- Być tworzony regularnie,
- Być całkowicie odseparowany od środowiska produkcyjnego,
- Być regularnie testowany pod kątem prawidłowego odzyskiwania danych. Samo utworzenie backupu nie daje nam żadnej ochrony, ponieważ nigdy nie wiemy, czy taka kopia jest możliwa do odzyskania.
Ten ostatni punkt jest absolutnie kluczowy. Posiadanie backupu, który nigdy nie został sprawdzony, to proszenie się o kłopoty. Jeśli po ataku ransomware okaże się, że dane kopii są uszkodzone i nie możemy och odzyskać – firma nie działa, a my mamy problem 🙂
Podsumowanie
RAID oraz backup to dwa zupełnie różne mechanizmy, które w profesjonalnym środowisku IT powinny być stosowane jednocześnie. Każdy z nich pełni inną funkcję i chroni infrastrukturę przed zupełnie innymi typami awarii oraz zagrożeń. RAID dba o to, by system działał dalej, gdy zepsuje się sprzęt. Backup dba o to, by było do czego wracać, gdy zawiedzie człowiek, system lub zostaniemy zaatakowani.

