La non disponibilità del sistema può essere dovuta a problemi banali come la mancanza di corrente (black out) o un guasto del sistema.
Perchè il sistema sia disponibile anche in caso di cadute di corrente si può dotare il sistema di un gruppo di continuità o UPS , cioè una tecnologia di alimentazione dotata di batterie in grado di fornire energia quando la corrente della rete elettrica non è disponibile.
Per sistemi in cui è accettabile l’interruzione dell’attività ma non la perdita di dati può bastare la duplicazione del disco, utilizzando per esempio tecniche di RAID. Il RAID può essere realizzato in modo hardware o in modo software dal sistema operativo.
Ci sono varie tecniche, chiamate livelli. In pratica si basano su tecniche di mirroring e di striping. Il mirroring è la copia dei dati su un altra unità; può essere fatto con due unità con lo stesso controller o ciascuna con un proprio controller. Il disco con i dati originali e la copia costituiscono un mirror set. Se un disco si guasta si possono recuperare i dati dall’altro, associandolo ad un nuovo disco di mirroring.
Con lo striping i dati vengono sparsi su array di dischi, che appaiono come un unico volume. Lo stripe set con parità memorizza anche delle informazioni di parità, distribuite sui dischi; se un disco si guasta le informazioni di parità permettono di ricostruire i dati: basta installare un nuovo disco e rigenerare lo stripe set.
L'articolo Fault Tolerance sembra essere il primo su Brutus Wolf Blog.