Digitalizacja oraz cyfryzacja zmieniają nasz świat i podejście do biznesu. Jednym z efektów ubocznych tych procesów jest lawinowo rosnąca ilość danych w naszych systemach IT. Dane mogą stanowić (jeżeli już nie stanowią) najważniejszy zasób firmy i warunkują jej "być albo nie być". Skoro dane są jednym z najcenniejszych zasobów, musimy się z nimi odpowiednio obchodzić, aby przypadkowo ich nie stracić. Dane ulegają nieustannemu przetwarzaniu, a szybki i współdzielony dostęp do nich jest kluczowy. W tym artykule przyjrzymy się temu, gdzie te dane są zapisane.
Dzisiaj chcemy zejść do najniższego poziomy: czyli gdzie te nasze dane (nasze pliki) są zapisane. Najogólniej można powiedzieć – na jakimś dysku, a właściwie powszechni dyskowej. Dla małych potrzeb wystarczy pojedynczy dysk lub kilka dysków umieszczonych w serwerze. Jednak, w miarę jak ilość naszych danych rośnie, zaczynamy się zastanawiać, gdzie je bezpiecznie trzymać. Naturalnym rozwiązaniem dla coraz większej ilości danych jest macierz dyskowa.
W uproszczeniu, macierz dyskowa to urządzenie zawierające od kilku do kilku tysięcy dysków zarządzanych przez kontrolery macierzy. Powierzchnia dysków jest podzielona na obszary dla danych (nazywane volumenami) i następnie "pokazywane" serwerom przetwarzającym te dane. System operacyjny widzi te volumeny podobnie jak np. zwykłe dyski. Kontrolery macierzy odpowiadają za pracę macierzy i to one wykonują całą logiczną pracę związaną z przechowywaniem i udostępnianiem danych, jak również odpowiadają za parametry i funkcjonalność macierzy.
Niezależnie od wyboru lub zastanej sytuacji, połączenie to jedno, ale serwer też musi zawierać odpowiednie karty LAN, san lub SAS.
Dostępne poziomy RAID – czy w uproszczeniu jak dużo nadmiarowych danych ma być zapisanych aby spójność danych była niezagrożona i system mogł pracować na danych bez przerw. Każdy poziom RAID ma swoje wady i zalety – ponadto każdy producent ma własne rozwiązania.
Każdy poziom RAID powoduje tez inny procent utraty powierzchni wykorzystywanej na zabezpieczenie – patrz punkt 1. RAID 1 – tracimy połowę powierzchni zakupionych dysków, w RAID5 ok 20%. RAID 1 jest szybki do zapisu, a RAID 5 szybki do odczytu – zawsze jest coś za coś.
Dwa kontrolery – w razie awarii jednego drugi przy popranie skonfigurowanym środowisku powinien przejąć pracę – w przypadku macierzy kontrolery można wymieniać w trakcie pracy.
Jeżeli decydujemy się na używaną macierz należy zwrócić uwagę na dostępność części szczególnie baterii (akumulatorów) do podtrzymywania pamięci cache, często się zdarza, że producent kończy produkcje takowych i trudno jest znaleźć na rynku w sensownej cenie. Kontrolery korzystają z pamięci cache do przyspieszenia operacji i bez baterii niektóre typy nie są w stanie się uruchomić (np. HPE EVA)
1. thin-provisioning – mozliwość oferowania większej powierzchni niż jest dostępna – systemy bardzo często potrzebują dużej powierzchni, ale de facto z niej nie korzystają. Ta niewykorzystana powierzchnia może być wspólna dla wszystkich systemów. (Dobrą analogią jest bank: Wszyscy mamy zapisaną określoną ilość pieniędzy na koncie, ale bank fizycznie całej gotówki nie ma) - thin provisioning pozwala na zaoszczędzenie wielkości kupowanej powierzchni – dyski SSD i NVME do tanich nie należą
2. Deduplikacja i kompresja – Dane są bardzo podobne do siebie – np. w przypadku posiadania podobnych systemów operacyjnych na macierzy, takie same bloki (części danych) nie są zapisywane wielokrotnie, a tylko raz. W przypadku infrastruktury zwirtualizowanej (np. Vmware, HyperV) deduplikacja pozwala zaoszczędzić 50-70% miejsca – i znowu mamy oszczędność na koniecznych do kupienia dyskach
3. Możliwość podłączenie macierzy do chmury publicznej – macierz może dla bezpieczeństwa replikować (kopiować) newralgiczne dane do jednego z dostawcy chmury publicznej
4. Kopie migawkowe i zabezpieczenia anty-ransomware – w erze współczesnych zagrożeń ataki ransowmare to globalny (i kosztowny) problem wielu organizacji. Wybierając rozwiązanie warto zwrócić funkcjonalność pod tym kątem, jak szybko możemy wrócić do danych sprzed ataku, czy jest monitoring zmieniających się danych (postepujące szyfrowanie) itp.)
5. Replikacja – temat jak najbardziej tradycyjny, czy macierz może replikować do innej macierz, która jest w innych ośrodku (i znowu kłania się bezpieczeństwo danych) – każdy producent realizuje to trochę inaczej – w trakcie wdrożenia diabeł tkwi w szczegółach.
6. Finansowanie – last but not least – każdy dysk, każde rozwiązanie kosztuje. Możemy tradycyjnie kupić produkt płacąc cały koszt od razu, ale niektóre firmy oferują rozwiązanie w trybie As-A-Service – czyli mamy wstawiony sprzęt do serwerowni i płacimy tylko miesięczną/roczną stawkę za faktycznie użytkowaną przestrzeń.
Obecnie taka forma ‘posiadania’ (a właściwie wynajmowania) infrastruktury zyskuje na popularności.
Wybór odpowiedniej macierzy dyskowej zależy od potrzeb firmy. Aby jak najlepiej wykorzystać potencjał danej macierzy, warto uwzględnić takie aspekty jak:
Dobrze dobrana macierz dyskowa może znacznie poprawić wydajność, dostępność i bezpieczeństwo danych w firmie. Aby wybrać najlepszą opcję, warto zrozumieć potrzeby firmy i przeanalizować dostępne funkcje oraz możliwości. Wybór macierzy dyskowej to inwestycja, która powinna być oparta na przemyślanej decyzji, mając na uwadze zarówno obecne potrzeby, jak i przyszły rozwój firmy.
Skomplikowanie wyboru powiększa się z tym, że każdy producent ma kilka typów macierzy w swojej ofercie i naprawdę można się pogubić. Jeżeli masz poczucie, że Twoje dane mogą zyskać nowy wymiar dostępności i bezpieczeństwa to skontaktuj się z nami, a na pewno Ci pomożemy!