Go to Top

Dove sono i dati? Parte 2 – Soluzioni software-defined e hyper-converged

Dati su sistemi software defined e hyper-converged

Da diversi anni gli amministratori e i manager IT cercano di ottimizzare i costi dell’hardware impiegato nei datacenter. Molti server nei datacenter, oggi, funzionano come server virtuali con il vantaggio di utilizzare un numero ridotto di server fisici, meno energia e costi più bassi per la strumentazione e il suo mantenimento.

Per gestire questo elevato volume di macchine virtuali e di server virtuali, un software defined storage (SDS) crea e impiega un layer (strato) software in grado di gestire e combinare tutte le necessarie componenti di un data center come computer, server, storage, networking e sicurezza. Soluzioni come queste, essendo software-based, possono teoricamente funzionare su vari e differenti prodotti hardware.

Nella realtà, tuttavia, è consigliabile utilizzare soluzioni software-defined su hardware che è già stato testato e approvato dal fornitore del software.

I sistemi hyper-converged, invece, rappresentano gli sviluppi più recenti nel tentativo di ottimizzare e rendere l’IT di un’azienda più efficiente e meno costoso. La caratteristica di una tale soluzione è che essa utilizza differenti tecnologie e che tutte queste tecnologie sono perfettamente integrate e gestite come fossero un singolo sistema.

I sistemi hyper-converged fondono tutti i concetti visti in precedenza come la convergenza, lo storage tradizionale e le soluzioni software-based in una soluzione “serverizzata.  Come un SDS, una soluzione hyper-converged è anch’essa basata sulla virtualizzazione e su una gestione software-based ma è combinata con un hardware.

In poche parole, i sistemi hyper-converged sono infrastrutture con un’architettura software-centrica che integra CPU, storage, networking, risorse di virtualizzazione e altre tecnologie in un box hardware fornito dal vendor.

Dal punto di vista tecnico, gli utenti di una soluzione hyper-converged ottengono significativi benefici non solo da una completa gestione di tutte le risorse dell’infrastruttura e dalle virtual machine sottoposte ad un’amministrazione centralizzata ma anche dal fatto che tutte le risorse del data center dispongono di una lista che ordina i diversi processi e quindi viene utilizzato solo un singolo pool di risorse condivise.

Grazie alla fornitura di virtualizzazione, storage, computing, network, protezione dei dati attraverso un’applicazione semplice da gestire e scalabile, un’organizzazione può ottimizzare una infrastruttura complessa. Per un’azienda utilizzare una soluzione hyper-converged significa poter disporre di hardware meno costoso perchè tale sistema poggia su comuni ed economici hardware x86 e – a meno di sistemi integrati – questi possono essere aggiornati o, in caso di guasto, sostituiti con unità molto più piccole.

Riassumendo: le soluzioni Hyper-converged non necessitano di tanto storage e di larghezza di banda come le soluzioni integrate e permettono di risparmiare sul costo dell’hardware come pure dell’energia. Inoltre, come detto prima, le risorse possono facilmente essere scalate.

Ma dove sono realmente memorizzati i dati in uno storage Software-defined o Hyper-converged?

SDS e HCS

La risposta a questa domanda non è cosa semplice. Dipende in larga misura del prodotto utilizzato. Fondamentalmente, le soluzioni SDS o Hyper-converged consistono di differenti layer di strutture dati. Per semplicità, la struttura può essere comparata ad una Matrioska: i dati utenti si trovano nel livello più profondo mentre le altre tecnologie aggiungono i propri layer dati sopra di questo.

Come si può vedere nel grafico sopra, nel software defined storage il layer dati più alto è quello creato dal Controller SDS che include le informazioni circa l’array storage virtuale. Il layer successivo è il layer di virtualizzazione creato dall’hypervisor in uso. Al di sotto di questo strato ci sono i server layer che sono poi seguiti dal layer del media fisico.  In totale, ci sono 4 layer che si aggiungono alla struttura dati finale.

In contrasto con la soluzione SDS, il layer che l’hypervisor ha creato in una soluzione hyper-converger è il più alto e il più recente della struttura dati. Al di sotto di questo layer vengono aggiunte le informazioni del controller software SDS.

In aggiunta, viene creato un layer da uno dei nodi connessi con i dati utente raw all’interno di questo “contenitore”. Se tutto ciò non è abbastanza complicato, possiamo continuare a peggiorare le cose.

Un’altra caratteristica di una soluzione SDS o hyper-converged è che molte di loro utilizzano un file system proprietario. Le soluzioni di storage NetApp, ad esempio, utilizzano il proprio sistema WAFL – Write Anywhere File Layout – che è stato creato in particolare per il sistema oprativo Data Ontap ed ottimizzato per l’uso in ambienti di rete. E c’è di più: NetApp offre altri due sistemi operativi ciascuno con i suoi vantaggi.

vSAN di VMware impiega il proprio file system chiamato on-disk Filesystem (VSAN FS) dalla versione 6 della sua soluzione SDS. Dell EMC sta offrendo VMware VSAN come tecnologia di storage hyper-converged per il proprio prodotto server PowerEdge.

La soluzione storage per i big data Dell EMC Isilon – ha un altro file system chiamato Isilon OneFS ( “1 filesystem”). In questo file system i metadata sono distribuiti attraverso i numerosi nodi connessi al sistema.

Anche in questo caso, per semplicità possiamo dire che quasi tutte le soluzioni SDS o hyper-converged utilizzano i propri file system e i propri sistemi operativi che devono quindi essere per prima cosa analizzati e compresi quando i dati sono persi e necessitano di essere recuperati.

É possibile il recupero dei dati da soluzioni SDS o hyper-converged?

Esistono molti casi nei quali gli esperti di Kroll Ontrack sono riusciti con successo a recuperare i dati da sistemi di storage high-end con layer di dati multipli. Uno di questi ha riguardato un sistema vSAN VMware che aveva smesso di funzionare a causa di un problema ad una memoria SSD utilizzata come cache memory di sistema.

Da marzo 2014, VMware offre l’opzione vSAN per vSphere EXSi server al fine di organizzare e gestire gli storage. Purtroppo, dopo alcuni mesi il sistema ha smesso di funzionare. Il sistema vSAN combina le applicazioni o i dati salvati nelle virtual machine in un clustered Shared Storage Datastore. Tutti i computer host connessi e i loro hard drive sono parte di questo data-store comune. Ciò significa che in caso di guasto hardware o di perdita di dati, gli ingegneri di data recovery devono affrontare un livello addizionale di informazioni. Questo particolare sistema consisteva di 15 hard drive e di 3 memorie SSD ma a causa del guasto di un SSD tre host computer/nodi erano collassati dando origine alla perdita temporanea di quattro grosse macchine virtuali.

Per recuperare e salvare tutti i dati mancanti da questo sistema di storage, gli ingengeri di Kroll Ontrack hanno dovuto sviluppare nuovi tool software al fine di localizzare i file di descrizione e di log necessari per identificare e riassemblare i dati. I data-store erano funzionanti come container, così gli specialisti per prima cosa hanno identificato i link alle virtual machine per poi ricostruirle. Grazie ai nuovi tool, i tecnici sono stati capaci di avere informazioni su come le VM erano state salvate nel datastore vSAN e su come erano state distribuite sugli hard drive colpiti dal problema.

Tutto ciò ha permesso agli esperti di recupero dati di trovare i necessari file di log e di descrizione più rapidamente, rendendo il processo di recupero significativamente più semplice. Con questi tool tra le mani, gli esperti sono stati in grado di recuperare le macchine virtuali e tutti i dati memorizzati sul sistema vSAN.

Questo esempio mostra che recuperare i dati da una soluzione SDS o hyper-converged che include una varietà di tecnologie e layer di dati è possibile. Quanti layer devono essere ripristinati dipende dallo specifico prodotto e dalle tecnologie impiegate. Qualunque perdita di dati e qualunque attività di recupero ha perciò le sue peculiarità. A causa di ciò, è fondamentale per un intervento di data recovery di successo selezionare un fornitore che abbia già recuperato con esito favorevole dallo specifico prodotto e che possieda sia i necessari strumenti che le necessarie competenze per gestiste progetti così sfidanti.

Picture copyright: M.Großmann/pixelio.de

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *