I livelli RAID per il recupero dei dati: le configurazioni e le caratteristiche

RAID (insieme ridondante di dischi indipendenti) è un metodo per archiviare gli stessi dati in luoghi diversi su più dischi rigidi o unità a stato solido (SSD) per proteggere i dati in caso di guasto dell’unità. Esistono diversi livelli RAID di cui parleremo più avanti nell’articolo.

La tecnologia RAID prevede il posizionamento dei dati su più dischi, per consentire alle operazioni di input/output (I/O) di sovrapporsi in modo equilibrato, migliorando le prestazioni.

Il recupero dati su RAID

Il recupero dati su RAID è il processo di recupero e ripristino dei dati da un’architettura o un’infrastruttura di archiviazione RAID.

Utilizza una combinazione di processi di recupero dati automatizzati e manuali per estrarre e ripristinare i dati da una o più unità RAID e componenti di archiviazione. Il ripristino di questa tipologia di dati può essere implementato su RAID sia hardware che software.

Il ripristino dei dati RAID è diverso dai processi di ripristino dei dati standard poiché l’architettura di archiviazione RAID utilizza un metodo unico e complesso di archiviazione ed estrazione dei dati.

Il recupero è solitamente necessario a causa di errori tecnici quali:

  • Disco rigido difettoso;
  • Controller difettosi;
  • Dati sovrascritti;
  • Corruzione di applicazioni/software;
  • Riformattazione.

Il ripristino RAID generalmente richiede la ricostruzione di tutti gli array di archiviazione RAID alle impostazioni e alla configurazione originali. L’identificazione dell’array RAID corretto è una parte essenziale del processo di ripristino RAID.

Quali sono i livelli Raid

I dispositivi RAID utilizzano versioni diverse, chiamate livelli. In una fase iniziale sono stati definiti sei livelli di RAID, da 0 a 5. Successivamente, il numero di livelli è stato ampliato ed è stato suddiviso in tre categorie: livelli RAID standard, nidificati e non standard.

Il RAID0 prevede l’associazione di almeno due hard disk tramite sezionamento o striping. RAID 0 è un sistema altamente produttivo, con una scrittura/lettura di dati molto veloce ma paga una scarsa affidabilità che, purtroppo, può essere causa di perdita dei dati.

Nota anche come mirroring del disco, la configurazione RAID1 è composta da almeno due unità che duplicano l’archiviazione dei dati. Non ci sono sezionamenti. Le prestazioni di lettura sono migliori, poiché entrambi i dischi possono essere letti contemporaneamente. Le prestazioni di scrittura sono le stesse dell’archiviazione su disco singolo.

RAID2 utilizza la tecnologia dello striping dei dati, ma divide i suoi dati in byte anziché in blocchi. Essa utilizza il codice Hemming, in base al quale per assemblare un array sono necessari almeno tre dischi. RAID3 taglia i dati in byte e li distribuisce tra i dischi. Nell’array è presente un disco separato per la correzione degli errori.

A causa della distribuzione dei dati da byte a byte, tutte le unità dell’array funzionano come un’unica unità. Ciò significa che possono eseguire solo un’operazione alla volta. Gli array di questo tipo sono usati raramente.

Anche RAID4 applica il metodo di striping dei dati ma dispone di un disco separato per la correzione degli errori. I dischi lavorano in modo indipendente e possono eseguire più operazioni di lettura alla volta. La velocità di lettura di RAID4 è abbastanza alta mentre quella di scrittura è più bassa.

L’architettura di RAID5 permette all’array di funzionare anche in caso di guasto di un’unità. Si possono eseguire operazioni di lettura e scrittura su più unità. Ciò si traduce in prestazioni migliori di quelle di una singola unità, ma non così elevate come un array RAID0.

RAID6 è simile a RAID5 ma utilizza un doppio codice Reed-Solomon, che viene scritto su due dischi. Pertanto, il numero minimo di dischi sale fino a quattro e il sistema potrebbe continuare a funzionare anche in caso di perdita di due dischi.

Esistono, inoltre, diversi livelli di array complessi, come RAID10 (1+0), RAID01(0+1), RAID50(5+0), ecc. RAID10 è un array RAID0 costituito da array RAID1, mentre RAID01 è un array RAID1 composto da array RAID0.

Tali combinazioni servono ad aumentare la produttività e la resistenza ai guasti, ma tutto ciò si ottiene a scapito di un aumento significativo del prezzo. Ad esempio, per creare RAID10 è necessario disporre di almeno quattro dischi rigidi.

La perdita dei dati nei sistemi RAID

La tecnologia RAID ha i suoi limiti che è giusto analizzare nel dettaglio. Ad esempio, i livelli RAID nidificati sono più costosi da implementare rispetto ai livelli RAID tradizionali, poiché richiedono più dischi.

Il costo per gigabyte per i dispositivi di archiviazione è maggiore per i RAID nidificati poiché molte delle unità vengono utilizzate per la ridondanza.

Quando un’unità si guasta, aumenta la probabilità che anche un’altra unità nell’array si rovini, il che comporterebbe probabilmente la perdita di dati. Ciò accade perché tutte le unità in un array RAID sono installate contemporaneamente, dunque soggette alla stessa quantità di usura.

Alcuni livelli RAID, come RAID 1 e 5, possono sostenere solo un guasto a un’unità. Gli array RAID e i dati in essi contenuti saranno vulnerabili fino a quando l’’unità guasta non viene sostituita e sul nuovo disco non vengono inseriti i dati.

Poiché oggi le unità hanno una capacità molto maggiore ora rispetto a quando la tecnologia RAID è stata implementata per la prima volta, il ripristino delle unità guaste richiede molto più tempo.

Se si verifica un errore del disco, può accadere che i dischi rimanenti contengano parti danneggiate o dati illeggibili, il che potrebbe rendere impossibile la ricostruzione completa dell’array.