IBM Cloud Docs
Comprendere l'alta disponibilità e il disaster recovery per VMware Solutions

Comprendere l'alta disponibilità e il disaster recovery per VMware Solutions

L' alta disponibilitàLa capacità di un servizio o di un carico di lavoro di resistere ai guasti e di continuare a fornire capacità di elaborazione secondo un livello di servizio predefinito. Per i servizi, la disponibilità è definita nell'Accordo sul livello dei servizi. La disponibilità comprende sia gli eventi pianificati che quelli non pianificati, come manutenzione, guasti e disastri. (HA) è la capacità di un servizio di rimanere operativo e accessibile in presenza di guasti imprevisti. Il disaster recoveryLa capacità di un servizio o di un carico di lavoro di riprendersi da incidenti rari e gravi e da guasti su larga scala, come l'interruzione del servizio. Ciò include un disastro fisico che colpisce un'intera regione, il danneggiamento di un database o la perdita di un servizio che contribuisce a un carico di lavoro. L'impatto supera la capacità del progetto di alta disponibilità di gestirlo. è il processo di ripristino dell'istanza di servizio in uno stato funzionante.

VMware Solutions è un servizio globale ad alta disponibilità progettato per essere disponibile anche durante un'interruzione regionale. Tuttavia, il servizio VMware Solutions viene utilizzato solo per fornire risorse VMware all'account cloud. È responsabilità dell'utente progettare e gestire le risorse di VMware per soddisfare gli obiettivi di alta disponibilità e disaster recovery.

Architettura ad alta disponibilità

Caratteristiche di alta disponibilità

Se opportunamente configurato, è possibile creare soluzioni ad alta disponibilità utilizzando il software VMware. Alcune di queste funzioni sono già disponibili nell'offerta di VMware Cloud Foundation for Classic - Automated, mentre altre devono essere configurate.

  • vSphere L'HA può essere utilizzato per ripristinare le macchine virtuali (VM) da un host all'altro in caso di guasto dell'host.
  • vMotion e Distributed Resource Scheduler (DRS) possono essere utilizzati per spostare proattivamente le macchine virtuali da un host all'altro.
  • vSAN il cluster allungato, se combinato con una configurazione di rete appropriata, può essere usato insieme a vSphere HA per recuperare le macchine virtuali da una zona all'altra in caso di guasto della zona.
  • I cluster o le istanze distribuite in più zone possono ospitare applicazioni e database che hanno implementato la propria replica sincrona o asincrona.
  • I cluster o le istanze distribuite in più regioni possono ospitare applicazioni e database che hanno implementato la propria replica asincrona.
  • È possibile utilizzare soluzioni o software di bilanciamento del carico per instradare il traffico verso regioni e zone appropriate.

Architettura di disaster recovery

Funzionalità di disaster recovery

Se opportunamente configurato, è possibile creare soluzioni di disaster recovery utilizzando il software VMware. È necessario configurare queste funzioni.

  • Per replicare i carichi di lavoro da una regione all'altra è possibile utilizzare software di replica come VMware Cloud Director Availability (VCDA), VMware Live Recovery utilizzando la replica vSphere, Veeam CDP e Zerto Replication.
  • È possibile utilizzare software di backup incrementale come Veeam Backup and Replication e Zerto Journaling, opzionalmente in combinazione con IBM Cloud Object Storage (COS) per creare backup locali o remoti dei carichi di lavoro.

Pianificazione del ripristino in caso di disastro

Stabilite un piano di DR dettagliato e mettetelo in pratica regolarmente. Potreste avere piani diversi per scenari diversi. Considerate i seguenti casi da includere:

  • Perdita di un punto di accesso alla rete.
  • Guasto di un singolo host.
  • Guasto di un'intera zona.
  • Il fallimento di un'intera regione.
  • Corruzione dei dati all'interno dei carichi di lavoro virtuali o del piano di gestione.
  • Malware e ransomware all'interno dei carichi di lavoro virtuali o del piano di gestione.

Le vostre responsabilità per HA e DR

È vostra responsabilità testare continuamente il vostro piano per HA e DR.

Potrebbero verificarsi interruzioni della connettività di rete e guasti hardware. È vostra responsabilità assicurarvi di aver implementato e testato in modo appropriato le soluzioni di alta disponibilità e disaster recovery che intendete utilizzare.

Per ulteriori informazioni sulla responsabilità tra l'utente e IBM Cloud® for VMware Solutions, vedere Comprendere le proprie responsabilità quando si utilizza VMware Solutions.

Obiettivo di tempo di ripristino (RTO) e obiettivo di punto di ripristino (RPO)

L'RTO e l'RPO della vostra soluzione di alta disponibilità e disaster recovery dipendono dalla soluzione scelta.

L'unico modo per ottenere un RPO pari a zero è quello di utilizzare la replica sincrona a livello di applicazione e di database, oppure di utilizzare un sottosistema di storage che implementi la replica sincrona (ad esempio, lo storage NFS all'interno della stessa zona, lo storage vSAN all'interno di una singola zona o lo storage vSAN esteso tra due zone). Tutte le altre soluzioni che si integrano con le API dell'hypervisor VMware (ad esempio, Veeam CDP e Zerto replication) avranno un RPO ridotto ma non nullo.

L'RTO più basso si ottiene con le distribuzioni di applicazioni attive su più host o zone, con un bilanciatore di carico o un bilanciatore di carico globale (GLB) configurato davanti ad esse. Le soluzioni che si basano sul riavvio di una VM (ad esempio, vSphere HA) o sulla dichiarazione di un disastro seguita dal riavvio di un intero carico di lavoro (ad esempio, Veeam CDP o Zerto replication) avranno un RTO più lungo.

Gestione delle modifiche

La maggior parte delle modifiche all'ambiente VMware e ai carichi di lavoro avverrà all'interno del software VMware piuttosto che all'interno della console IBM Cloud. È necessario configurare il controllo degli accessi e la registrazione degli audit appropriati per il piano di gestione VMware. Concedete agli utenti i privilegi minimi necessari per il loro lavoro. Considerate l'implementazione di un processo o di una soluzione di change management per il vostro piano di gestione VMware. Inoltre, si consiglia di creare backup manuali di VMware vCenter Server® e VMware NSX® prima di aggiornarli a nuove versioni.

Come IBM mantiene i servizi

IBM® mantiene il servizio VMware Solutions in modo altamente disponibile, replicando i dati e il piano di controllo in più regioni di IBM Cloud per garantire la resilienza. Tutti gli aggiornamenti del servizio VMware Solution seguono le best practice del servizio IBM, compresi i piani di ripristino e i processi di rollback. La manutenzione regolare potrebbe causare brevi interruzioni, mitigate dalla logica di retry della disponibilità del client. IBM ripristina gli aggiornamenti al primo segno di un difetto.

Le modifiche che hanno un impatto sui carichi di lavoro dei clienti sono dettagliate nelle notifiche di IBM Cloud. Per ulteriori informazioni sulla manutenzione programmata, gli annunci e le note di rilascio che hanno un impatto su questo servizio, vedere Notifiche e stato del monitoraggio.