Enterprise Data Management Protection

Per le moderne organizzazioni aziendali i dati sono il patrimonio essenziale. Il dato è l’elemento su cui si basa l’operatività quotidiana ed è l’oggetto delle analisi e degli studi che permettono la programmazione e la definizione strategica dell’esistenza stessa dell’organizzazione. La gestione del dato, la sua protezione e la sua disponibilità sono temi estremamente sensibili nel contesto aziendale contemporaneo. Tanto più che oggi perdere dati si traduce immediatamente in perdita economica.
Le esigenze che nascono attorno a queste premesse devono trovare risposta ad osservazioni come le seguenti:

  • Come migliorare nettamente l’operatività abbattendo a livello minimo il Recovery Time Objective (RTO) per mettere le aziende in condizione di ripristinare le applicazioni senza ridiscutere completamente le architetture ICT già impiegate?
  • Come gestire automaticamente i dati utilizzando tecniche che permettono di abbinare tecnologie in cloud e on prem per organizzare il mantenimento dei dati a lungo termine ottimizzando i costi di gestione?
  • Come mettere in condizione le persone dell’organizzazione di semplificare la protezione del dato ed il suo ripristino in caso di necessità senza ricorrere a laboriose competenze tecniche e riducendo i tempi d’attesa?
  • Come disporre di un sistema di test per verificare il ripristino di dati ed applicazioni prima di renderli disponibili per il normale impiego?

È infatti ormai una costante per le aziende trovarsi ad operare in contesti in cui è importante gestire e proteggere i dati in modo efficiente dal punto di vista sia operativo che economico. La varietà di metodi ed ambienti operativi, attraverso i quali vengono organizzati e gestiti i dati, rappresenta una sfida quando si tratta di proteggerli adeguatamente dai rischi di perdita o manomissione.

È importante che l’inserimento, all’interno di un ambiente elaborativo, di un sistema di protezione dei dati possa avvenire in modo semplice, efficace e mantenendo al minimo l’impatto operativo che deriva dalla sua adozione e gestione. Occorre rispondere a queste esigenze con un progetto che si basi su soluzioni integrate tra loro all’insegna della massima efficacia.

L’analisi che segue prende in esame tre tecnologie finalizzate alla gestione ed alla protezione dei dati – che tra loro si combinano in modo eccellente così da garantire la realizzazione di progetti di grande efficacia – con lo scopo di fornire le risposte alle precedenti osservazioni.

Si parla delle tecnologie RubrikPureStorage e The SwARM in una combinazione progettuale che ha nella loro integrazione la principale chiave di lettura.

Don’t backup. Go forward.

Don’t backup. Go forward.

È il pay off di Rubrik. L’azienda che, come noto, posiziona la propria tecnologia nel mercato delle soluzioni di backup e recovery, è classificata tra i visionari nel quadrante magico di Gartner ed approccia il tema della gestione e protezione dei dati in maniera totalmente innovativa rispetto ad altre soluzioni in commercio di ispirazione più tradizionale. Se volessimo interpretare il loro claim potremmo dire: “Non fare retromarcia, avanza: fai progressi.”

Rubrik offre una piattaforma unificata di tipo scale-out – disponibile sotto forma di appliance iperconvergente o solo software – di Gestione dati, Protezione continua (CDP), Instant Recovery, Ricerca, Sviluppo, Analisi e Cloud. Questo approccio permette di semplificare le vecchie infrastrutture legacy di backup e di disaster recovery, facendo convergere all’interno di una singola soluzione – che scala linearmente – software di backup, infrastruttura di backup, gestione del catalogo, replica e storage deduplicato. Tutti i dati gestiti da Rubrik sono indicizzati e analizzati, per offrire servizi ad alto valore aggiunto: intercettare attacchi di tipo Ransomware tramite l’app Rubrik Polaris Radar, oppure identificare dati sensibili esposti tramite Rubrik Polaris Sonar, sono solo due esempi delle potenzialità di questa piattaforma.

La piattaforma di Cloud Data Management di Rubrik è infatti anche un abilitatore verso il Cloud, integrando AWS di Amazon, Azure di Microsoft, oppure GCP di Google. Ad esempio, tramite Rubrik Polaris GPS è possibile gestire e proteggere nativamente workload che girano in cloud e tramite Polaris AppFlow orchestrare un D/R tra on-prem e Cloud, con supporto automatizzato dell’intero processo.

Descrizione della soluzione

Descrizione della soluzione

Vediamo le ragioni per cui il backup, forse una delle funzioni più storiche nell’information technology, può assumere una connotazione innovativa, diventando un elemento di evoluzione nel moderno contesto tecnologico della gestione e protezione dei dati.

Multi Piattaforma Rubrik

Figura 1 – Architettura della multi-piattaforma Rubrik

Pensiamo con l’aiuto dell’immagine, a quanto possa essere articolato lo scenario in cui si collocano servizi e applicazioni che i sistemi informatici erogano e soprattutto i loro dati, le informazioni gestite.

La diversificazione dei contesti operativi nelle moderne aziende ed organizzazioni è sempre più presente: bare-metal e sistemi virtualizzati, database SQL e NoSQL, Cloud pubblico e ibrido, macchine virtuali e container, varie sfumature di implementazioni con una costante sempre presente: la necessità di proteggere i dati con sistemi efficienti, fortemente integrati con gli ambienti operativi e con funzioni di gestione in grado di offrire la massima flessibilità per disporre del dato in ogni circostanza, sia essa derivante da un’esigenza di ordinario ripristino, oppure dal recupero di una situazione con impatto catastrofico, come nel caso dei danni da ransomware. Per una più semplice rappresentazione delle possibilità offerte da una moderna piattaforma di gestione e protezione dei dati come Rubrik, ci è utile elencare i principali punti di forza della soluzione:

  • Semplicità di implementazione: “rack & go”; nessun software, proxy, agente, servizio o componente Microsoft (o di terze parti) da installare;
  • Semplicità di gestione: automazione gestita da SLA policy “set and forget”;
  • Affidabilità della soluzione: architettura iperconvergente “Master-Less” senza nessun singolo punto debole, completamente distribuita e con affidabilità dati protetti garantita da Erasure Coding 4+2;
  • Sicurezza: copie di protezione cifrate, immodificabili e inattaccabili (incluso Ransomware);
  • Compliance: certificazione Common Criteria EAL2+, FIPS 140-2, GDPR (compliance grazie a “end to end encryption”;
  • Scalabilità: semplicità di estensione dell’infrastruttura grazie all’architettura distribuita scale-out;
  • Ottimizzazione risorse: riduzione dati grazie a deduplica globale content-aware;
  • Performance: in fase di recovery: RTO zero; test di D/R in pochi minuti; ricerca predittiva globale;
  • API first: automazione e orchestrazione via RestFul-API nativamente incluse nella piattaforma;
  • Disaster Recovery: D/R nativo e integrato nella soluzione, per permetterne l’estensione verso siti remoti;
  • Riduzione TCO: riduzione costi finanziari, di operation e di business associati al backup, all’archiviazione e al test/dev, significativo risparmio TCO rispetto a soluzioni “legacy”.

Integrazione storage

Integrazione storage

Un esempio, descritto di seguito, fa leva sulle capacità della tecnologia Rubrik di sfruttare le API per dialogare ed integrarsi con piattaforme esterne e diventare il punto di orchestrazione della protezione e gestione dei dati.

Integrazione API tra storage Primario e Backup

Figura 2 – Integrazione API tra storage Primario e Backup

L’esempio coinvolge la tecnologia Rubrik in combinazione con le macchine storage basate su flash disk array di PureStorage e le macchine basate su object storage di CynnySpace con la soluzione The SwARM.

L’ambiente operativo a cui fare riferimento è costituito dalla server farm virtuale gestita attraverso un hypervisor, ad esempio VMware, collegata attraverso la rete SAN ai disk array di PureStorage: in questo caso le tecnologie delle due case produttrici si combinano e sfruttando le API si interfacciano così da creare il canale di comunicazione ideale per prelevare i dati e proteggerli, senza impatto sulla server farm, introducendo un modello di scalabilità di tipo “scale out”, sia per gli elementi storage, sia per le componenti dell’infrastruttura fisica del sistema di backup Rubrik, in grado di realizzare nel data center un sistema di protezione dei dati, combinando le due tecnologie, che fornisce potenzialità di ripristino dei dati 50 volte più veloce rispetto ad una soluzione non integrata e funzionalità software di ricerca dei dati e ripristino di intere macchine virtuali oppure di singoli elementi, rendendoli prontamente operativi.

Una delle funzioni di maggior interesse di Rubrik nella gestione del recupero è detta “live mount”: nella fase di ripristino ogni dato, applicazione, VM, può essere portato in vita direttamente sul sistema Rubrik senza fornire ulteriore spazio storage. Quest’operazione aiuta a ridurre al minimo il “recovery time objective” (RTO) quasi azzerandolo e permette di condurre test di recupero istantanei riutilizzando i dati del backup per i vari casi d’uso.

Sfruttare le API per le comunicazioni dirette tra Rubrik e PureStorage ottimizza l’elaborazione delle operazioni di backup. Ad esempio, nei sistemi che si limitano a interfacciare le funzioni del hypervisor, il backup delle VM avviene attivando la procedura di snapshot: il sistema mantiene fissa l’immagine di base della VM e del suo disco VMDK, creandone uno di delta che viene aggiornato in scrittura dall’hypervisor per tutta la durata dell’operazione di backup, che può così leggere dall’immagine fissata. Alla fine dell’operazione di backup viene effettuata la cancellazione con conseguente consolidamento dei VMDK originale e delta. Chiaramente il procedimento così implementato è di impatto rilevante per le prestazioni della VM. Questo problema prestazionale viene risolto dall’integrazione diretta tra Rubrik e PureStorage. Analogamente alla situazione precedente, viene messo in atto il dispositivo del backup attraverso l’avvio del processo di snapshot, ma questa volta viene avviata anche la procedura di snapshot del FlashArray, con conseguente immediata cancellazione dell’immagine di snapshot del hypervisor, il processo è istantaneo, nell’ordine dei secondi, annullando l’impatto prestazionale sulla VM. Lo snapshot del FlashArray viene presentato all’ambiente dell’hypervisor, viene registrata una VM proxy, una copia della VM originale, le letture CBT (changed block tracking) provengono dalla VM proxy, così da non impattare la VM originale in produzione, su cui la finestra operativa dell’operazione di backup diventa così rapida da essere ininfluente.

Archiviazione storage

Archiviazione storage

In questo contesto è tipica l’esigenza di rendere complementare il sistema di protezione dei dati con le funzioni di archiviazione, integrandole con pari livelli di funzionalità di gestione.

Anche in questo caso l’interfaccia tramite API è fondamentale. Per l’archiviazione si sfrutta la tecnologia storage ad oggetti e l’interfaccia S3. Tipica dei sistemi cloud, ad esempio AWS. Può essere impiegata anche a completamento di progetti on-prem.

È il caso delle soluzioni di CynnySpace, che dispone della tecnologia object sorage declinata sia nella sua veste di servizio cloud che nella realizzazione di storage appliance da installare nei propri data center.

Integrazione Rubrik, Pure Storage e TheSwARM

Figura 3 – Integrazione Rubrik, Pure Storage e TheSwARM

Nell’architettura presentata dallo schema precedente, il modello di protezione dei dati previsto da Rubrik identifica nella propria tecnologia la componente centrale di gestione sia degli aspetti di backup del dato, come descritto in precedenza, proveniente dalle componenti storage della server farm, sia di quegli aspetti di archiviazione che permettono di ottimizzare lo spazio destinato a mantenere le copie dei dati, nonché di mantenimento dei dati per lunghi tempi di conservazione, su piattaforme di storage che impiegano la tecnologia ad oggetti. In questo progetto, le macchine The SwARM con la loro tecnologia si qualificano come elemento ottimale per archiviare e mantenere a lungo termine grossi quantitativi di dati a costi contenuti. Le caratteristiche su cui si basa la scelta dell’impiego di questa tecnologia si sintetizzano nelle seguenti:

  • Scalabilità: l’ingegnerizzazione dell’architettura The SwARM, è impostata per avere scalabilità infinita, raggiungendo facilmente il livello degli Exabyte grazie anche al proprio file system che integra funzioni di self-healing e self-orchestration;
  • Prestazioni: centinaia di microserver (in tecnologia ARM, Advanced RISC Machine, ciascuno della dimensione di un biglietto da visita e dedicato alla gestione di un HD) realizzano un sistema indipendente di elaborazione che permette un livello di parallelismo elaborativo senza precedenti. La tecnologia ARM (la stessa a bordo degli smartphone) rende possibile la realizzazione di un sistema di computing interno al dispositivo storage di grande efficienza energetica per l’attuazione del file system a sciame (tecnologia swarm) cioè auto-organizzato;
  • Durabilità: il livello di undici 9 è la percentuale a cui si arriva nel garantire la protezione ed integrità dei dati: i sistemi progettati per la memorizzazione a lungo termine, tipica delle esigenze di archiviazione, mettono in atto dei controlli attivi sui dati memorizzati e delle tecniche per il mantenimento della loro integrità nel tempo;
  • Automazione: il concetto di “zero-touch” è alla base dei principi secondo cui la tecnologia è progettata, il sistema è autoconfigurante, autoriparante e con una gestione completamente automatizzata, per rendere i costi operativi nulli.

È da sottolineare inoltre che, in un’ottica di progetto, si può adottare l’implementazione della tecnologia The SwARM presso i propri data center in tutti i casi in cui l’architettura o la politica aziendale prediliga il mantenimento in proprio dei dati archiviati oppure, sempre adottando la tecnologia di CynnySpace, presso i data center in cloud, dove tutto il vantaggio operativo della soluzione si trasforma in servizio erogato con il modello “as a service”, con costi estremamente vantaggiosi e con la garanzia del dato sempre disponibile in linea e senza impatto economico derivante dalle operazioni eseguite e dalla capacità trasmissiva consumata.

L’importanza di salvare e archiviare il dato in modo semplice e automatizzato è vitale per garantirne la disponibilità ed integrità attraverso la semplicità operativa. Tuttavia, quando serve, è di fondamentale importanza poterlo recuperare con la stessa semplicità e indipendentemente da dove risiede. Rubrik attraverso la propria interfaccia, permette di archiviare i dati in modo trasparente, senza necessità di schedulare le operazioni e indipendentemente dalla destinazione, rendendoli accessibili attraverso la stessa interfaccia di ricerca e gestione, permettendo il recupero dei dati archiviati, ad esempio una copia della VM originale ad un certo punto nel tempo e riportarla in vita attraverso l’operazione “live mount”.

Download ed Export da Object Storage

Figura 4 – Download ed Export da Object Storage

Il recupero di snapshot dall’infrastruttura di archiviazione basata su object storage è reso efficiente attraverso un sistema di trasferimento trasparente che ne predispone la copia sul cluster Rubrik locale e permette di avviare operazioni specifiche di disponibilità, come ad esempio l’avvio della VM come nuova macchina virtuale su un host ESX, identificandola univocamente in veste di macchina recuperata a partire dalla copia di snapshot, avviandola in sicurezza e mantenendola isolata dalla rete per evitare conflitti.

In breve, quindi, si è visto come un’architettura funzionale ed integrata, basata su 3 soluzioni di elevato livello tecnologico, possa rispondere alle moderne esigenze di protezione e gestione dei dati, in ambienti operativi sempre più diversificati, rispondendo a principi essenziali di scalabilità, automazione, efficacia operativa, cui le moderne organizzazioni aziendali non possono rinunciare per aumentare la loro efficienza e risultare competitive, in un mercato sempre più sfidante e in cui i dati rappresentano sempre più l’elemento fondante della loro esistenza.