Verständnis von Hochverfügbarkeit und Notfallwiederherstellung für DNS Services
HochverfügbarkeitDie Fähigkeit eines Dienstes oder einer Arbeitslast, Ausfällen standzuhalten und die Verarbeitungsfähigkeit gemäß einem vordefinierten Servicelevel weiterhin bereitzustellen. Für Dienstleistungen ist die Verfügbarkeit im Service Level Agreement definiert. Die Verfügbarkeit umfasst sowohl geplante als auch ungeplante Ereignisse wie Wartungsarbeiten, Ausfälle und Katastrophen. (HA) ist die Fähigkeit eines Dienstes, auch bei unerwarteten Ausfällen betriebsbereit und zugänglich zu bleiben. Der Hauptzweck der Hochverfügbarkeit ist es, potenzielle Fehlerquellen in einer IT-Infrastruktur zu eliminieren. Unter Disaster RecoveryDie Fähigkeit eines Dienstes oder einer Arbeitslast, sich von seltenen, schwerwiegenden Vorfällen und großflächigen Ausfällen, wie z. B. Dienstunterbrechungen, zu erholen. Dies umfasst eine Naturkatastrophe, die eine ganze Region betrifft, die Beschädigung einer Datenbank oder den Verlust eines Dienstes, der zu einer Arbeitsbelastung beiträgt. Die Auswirkungen übersteigen die Fähigkeit des Hochverfügbarkeitsdesigns, sie zu bewältigen. versteht man die Wiederherstellung eines funktionierenden Zustands der Service-Instanz. Es umfasst Verfahren zum Kopieren und Speichern der wesentlichen Daten eines installierten Systems an einem sicheren Ort sowie zur Wiederherstellung dieser Daten, um den normalen Betrieb wiederherzustellen.
DNS Services ist darauf ausgelegt, die Service Level Objectives(SLO) mit dem Standardplan zu erfüllen. DNS Services ist ein hochverfügbarer globaler Dienst, der zur Erhöhung der Ausfallsicherheit mit separaten Fehlerdomänen ausgestattet ist. Die Steuerebene ist sowohl gegen zonale als auch regionale Ausfälle resistent, und ihr Ausfall hat keine Auswirkungen auf die Datenebene. Die Datenebene ist zumindest gegenüber zonalen Ausfällen widerstandsfähig, und ihr Ausfall wirkt sich nicht auf die Steuerungsebene aus.
Weitere Informationen zu den Bereitstellungsregionen und Rechenzentrumsstandorten für DNS Services finden Sie unter Service- und Infrastrukturverfügbarkeit nach Standort.
Architektur für hohe Verfügbarkeit
Steuerebene
IBM Cloud® DNS Services ist ein global verfügbarer Dienst (GA). Die öffentlichen API-Endpunkte für die DNS-Konfiguration sind über einen globalen Load Balancer verfügbar, der in zwei MultizonenregionenEine Region, die über physische Standorte in mehreren Zonen verteilt ist, um die Fehlertoleranz zu erhöhen. (MZR) von IBM Cloud untergebracht ist und eine hohe Verfügbarkeit gewährleistet. Diese Regionen sind Dallas und Washington, DC. Fällt eine Region aus, leitet der globale Load Balancer den API-Datenverkehr automatisch an die andere Region weiter. Wenn zum Beispiel die Region Dallas nicht verfügbar ist, werden die Anfragen an andere verfügbare geografische Regionen weitergeleitet - in diesem Fall Washington, DC.
Im Falle eines globalen Ausfalls wird die Steuerungsebene wiederhergestellt, wobei der Schwerpunkt auf der Verringerung des Datenverlusts bei den Ressourcen liegt. Daher sollten die Kunden auch eine Notfallwiederherstellung planen.
Eine Steuerebene bearbeitet vom Benutzer initiierte DNS-Konfigurationsanforderungen, während eine Datenebene Namensauflösungsanforderungen von der Virtual Private Cloud (VPC) bearbeitet.
Datenebene DNS-Server
Die DNS-Server sind global über mehrere MZRs verteilt und verwenden Anycast-IP-Adressen, um die Latenzzeit zu optimieren und eine hohe Verfügbarkeit zu gewährleisten. Wenn eine Verfügbarkeitszone oder eine ganze Region ausfällt, werden DNS-Anfragen automatisch an die nächstgelegene Verfügbarkeitszone oder Region weitergeleitet. DNS-Daten werden in den folgenden Regionen repliziert, um sowohl die Latenzzeit zu optimieren als auch eine hohe Verfügbarkeit zu gewährleisten:
- Dallas (us-south)
- Washington, D.C. (US-Ost)
- London (eu-gb)
- Madrid (eu-es)
- Frankfurt (eu-de)
- Osaka (jp-osa)
- Tokio (jp-tok)
- Toronto (ca-tor)
- Sydney (au-syd)
- Sao Paulo (br-sao)
Benutzerdefinierte Auflöser für die Datenebene
Ein benutzerdefinierter Resolver ist ein regionales Objekt, das sich aus zonenübergreifenden Objekten (benutzerdefinierte Resolverstandorte) zusammensetzt, die in zonenübergreifenden Subnetzen konfiguriert sind. Es hat sich bewährt, angepasste Resolver in mehreren Teilnetzen zu implementieren, um eine hohe Verfügbarkeit sicherzustellen. Es wird empfohlen, die Implementierung in allen drei Verfügbarkeitszonen durchzuführen.
Bei einem regionalen Ausfall wird dieser Aspekt der Datenebene auf den Zustand der Ressourcen zurückgesetzt, wie er in der Steuerungsebene dargestellt und beibehalten wird.
Funktionen für hohe Verfügbarkeit
DNS Services unterstützt die folgenden Hochverfügbarkeitsfunktionen:
Feature | Beschreibung | Hinweis |
---|---|---|
Benutzerdefinierte Resolver-Standorte | Verwalten Sie, wo Ihr benutzerdefinierter Resolver eingesetzt wird. | Sorgt nur für mehr Widerstandsfähigkeit bei zonalen Ausfällen. |
Sie können Hochverfügbarkeit auf verschiedenen Ebenen innerhalb Ihrer IT-Infrastruktur und zwischen verschiedenen Komponenten Ihres DNS-Clusters erreichen. Welches Verfügbarkeitsniveau für Sie das richtige ist, hängt von mehreren Faktoren ab, u. a. von Ihren geschäftlichen Anforderungen, den Service Level Agreements (SLAs), die Sie mit Ihren Kunden abgeschlossen haben, und den Ressourcen, die Sie bereit sind, einzusetzen.
Der Verfügbarkeitsgrad, den Sie für Ihren Cluster einrichten, wirkt sich auf Ihre Abdeckung im Rahmen der IBM Cloud Hochverfügbarkeits-SLA-Bedingungen aus.
Die Service Level Objectives (SLOs) definieren die Designpunkte, die die IBM Cloud Dienste erfüllen sollen. IBM Cloud® DNS Services ist so konzipiert, dass das folgende Verfügbarkeitsziel erreicht wird.
Verfügbarkeitsziel | Zielwert |
---|---|
Verfügbarkeit % | 99.999% |
Die SLO ist keine Garantie und IBM vergibt keine Credits für das Nichterreichen eines Ziels. In den SLAs sind die Verpflichtungen und Gutschriften aufgeführt, die bei Nichteinhaltung von SLAs erteilt werden. Eine Übersicht über alle SLOs finden Sie unter IBM Cloud service level objectives.
Weitere Informationen zur Serviceverfügbarkeit in Regionen und Rechenzentren finden Sie unter Service- und Infrastrukturverfügbarkeit nach Standort.
Weitere Informationen zu den Standards für Hochverfügbarkeit und Notfallwiederherstellung in IBM Cloud Hochverfügbarkeit und IBM Cloud.
Architektur zur Wiederherstellung im Katastrophenfall
Eine externe Aufzeichnung Ihrer DNS-Konfiguration ist wichtig für die Wiederherstellung von DNS Services im Falle einer Katastrophe. Sowohl der Sicherungs- als auch der Wiederherstellungsprozess können mit Hilfe von Skripten und den Export- und Importprozessen in der Tabelle Disaster Recovery Features automatisiert werden. DNS Services unterstützt Terraform und kann verwendet werden, um Arbeitslasten mit parametrisierten Standorten und Leistungen zu definieren. Kunden können IBM Cloud Schematics nutzen, um Terraform-Skripte zu erstellen und zu verwalten, die wiederum zur Wiederherstellung von Ressourcen an einem verfügbaren Standort während einer Katastrophe verwendet werden können.
Funktionen zur Wiederherstellung im Katastrophenfall
IBM Cloud® DNS Services unterstützt die folgenden Disaster-Recovery-Funktionen:
Feature | Beschreibung | Hinweis |
---|---|---|
DNS-Ressourceneinträge exportieren | Exportieren Sie DNS-Einträge für eine Zone über das Dashboard in eine Textdatei. | Exportiert nur DNS-Einträge für jeweils eine Zone. Exportiert keine Load Balancer- oder andere Nicht-DNS-Eintragsdaten. |
DNS-Ressourceneinträge importieren | Importieren Sie DNS-Einträge aus einer Textdatei in eine Zone über das Dashboard. | Sie müssen die Zone neu erstellen, bevor Sie DNS-Einträge importieren. |
Externe Quelle der Wahrheit | DNS-Zonen, zugelassene Netzwerke, DNS-Ressourcendatensätze, benutzerdefinierte Resolver, benutzerdefinierte Regeln für die Weiterleitung von Resolvern und mehr, die in vom Kunden verwalteten Konfigurationsdateien wie Terraform-Skripten, Shell-Skripten oder Programmen erfasst werden. | Der Kunde muss das Skript oder Programm erstellen und die Konfiguration dort speichern, wo sie im Katastrophenfall verwendet werden kann. |
Sichern und Wiederherstellen | Sicherung einer Dienstinstanz mit einem vom Kunden geschriebenen Skript. | Der Kunde muss das Skript erstellen und die Sicherungskopie dort aufbewahren, wo sie bei der Wiederherstellung verwendet werden kann. |
Planung für DR
Als Kunde sind Sie für die Wiederherstellung Ihrer DNS-Server-Konfigurationsdaten im Falle einer Katastrophe verantwortlich. Sie sollten sicherstellen, dass Sie einen Notfallwiederherstellungsplan erstellen und die folgenden Ausfallszenarien und Lösungen berücksichtigen:
Fehler | Lösung |
---|---|
Zonales Versagen | Entschärfung für benutzerdefinierte Resolver durch Bereitstellung an mehreren Standorten Entschärfung für DNS-Server durch Beantwortung von Anfragen durch die nächstgelegene verfügbare Zone. |
Regionales Versagen | Ausfall für benutzerdefinierte Resolver, bis eine Verfügbarkeitszone wiederhergestellt ist. Bei DNS-Servern werden die Anfragen von der nächstgelegenen verfügbaren Region beantwortet. |
Datenbeschädigung | Wiederherstellung von Dienstkonfigurationen aus einer externen Quelle der Wahrheit. |
Ihre Verantwortlichkeiten für HA und DR
Es liegt in Ihrer Verantwortung, Ihren Plan für HA und DR kontinuierlich zu testen.
Es kann zu Unterbrechungen der Netzanbindung und zu kurzen Zeiten der Nichtverfügbarkeit eines Dienstes kommen. Es liegt in Ihrer Verantwortung, sicherzustellen, dass der Quellcode der Anwendung eine Logik zur Wiederholung der Client-Verfügbarkeit enthält, um eine hohe Verfügbarkeit der Anwendung zu gewährleisten.
Verwenden Sie die folgenden Checklisten, die zu jedem Merkmal gehören, um Ihren Plan zu erstellen und zu üben.
- Angepasster Auflöser
Weitere Informationen über die Verantwortlichkeit zwischen Ihnen und IBM Cloud für IBM Cloud DNS Services finden Sie unter Verstehen Sie Ihre Verantwortlichkeiten bei der Verwendung von IBM Cloud DNS Services.
Änderungsmanagement
Die Änderungsverwaltung umfasst Aufgaben wie die Änderung und Löschung von Konfigurationen.
Gewähren Sie Benutzern und Prozessen die Identity and Access Management (IAM)-Rollen und -Aktionen mit den geringsten Berechtigungen, die für ihre Arbeit erforderlich sind. Weitere Informationen finden Sie unter Wie kann ich ein versehentliches Löschen von Diensten verhindern?
Zu den bewährten Praktiken für die Bewältigung des Wandels gehören auch:
- Planen und dokumentieren Sie Änderungen, indem Sie ein Änderungsprotokoll für alle an Ihrer DNS Services Konfiguration vorgenommenen Änderungen führen.
- Erstellen Sie eine Sicherungskopie der kritischen Konfigurationen, bevor Sie größere Änderungen vornehmen.
- Planen Sie Änderungen mit hoher Auswirkung in Zeiträumen mit geringem Datenverkehr und informieren Sie die betroffenen Teams.
- Überwachen Sie den Zustand und die Metriken Ihrer DNS Services, um sicherzustellen, dass alles wie erwartet funktioniert.
Wie IBM die Wiederherstellung im Katastrophenfall unterstützt
IBM® ergreift im Katastrophenfall spezifische Wiederherstellungsmaßnahmen für IBM Cloud® DNS Services.
Wie IBM sich von regionalen Ausfällen erholt
IBM Cloud verfügt über GeschäftskontinuitätspläneDie Fähigkeit eines Unternehmens, Ausfallzeiten zu kompensieren und geschäftskritische Services normal und unterbrechungsfrei den vordefinierten Service-Level-Agreements entsprechend zu betreiben., die im Falle einer Katastrophe die Wiederherstellung der Dienste innerhalb von Stunden ermöglichen. Sie sind für die Sicherung Ihrer Daten und die zugehörige Wiederherstellung Ihrer Inhalte verantwortlich.
DNS Services bieten Mechanismen zum Schutz Ihrer Daten und zur Wiederherstellung der Dienstfunktionen. Es gibt Pläne zur Aufrechterhaltung des Geschäftsbetriebs, um die angestrebten Ziele für den WiederherstellungspunktBei der Planung der Notfallwiederherstellung wird die Zeit, in der Daten wiederhergestellt werden, in Zeit gemessen (Sekunden, Minuten, Stunden), beginnend mit der wiederhergestellten Instanz und endend am Punkt des Notfalls. (RPO) und die WiederherstellungszeitIn der Notfallwiederherstellungsplanung die Zeitspanne, die ein Geschäftsprozess nach einem Notfall benötigt, um wiederhergestellt zu werden. (RTO) für den Dienst zu erreichen. In der folgenden Tabelle sind die Ziele für DNS Services aufgeführt.
Element der Dienstleistung | RPO | RTO |
---|---|---|
Steuerebene | 0 | < 60 Sek |
Datenebene | 0 | < 60 Sek |
Angepasster Auflöser | 0 | < 60 Sek |
Datenbankwiederherstellung | 24 Std. | 8 Stunden |
Wenn IBM die Dienstinstanz nicht wiederherstellen kann, müssen Sie den Dienst wie in der Disaster-Recovery-Architektur beschrieben wiederherstellen.
Weitere Informationen zur Serviceverfügbarkeit in Regionen und Rechenzentren finden Sie unter Service- und Infrastrukturverfügbarkeit nach Standort.
Wie IBM Dienste unterhält
Alle Upgrades erfolgen nach den bewährten Verfahren von IBM, einschließlich Wiederherstellungsplänen und Rollback-Prozessen. Regelmäßige Wartungsarbeiten können zu kurzen Unterbrechungen führen, die durch eine Logik zur Wiederholung der Client-Verfügbarkeit gemildert werden. Die Änderungen werden nacheinander ausgerollt, Region für Region und Zone für Zone innerhalb einer Region. IBM nimmt Aktualisierungen bei den ersten Anzeichen eines Fehlers zurück.
IBM informiert im Voraus über alle geplanten Wartungsarbeiten. Wenn sich eine Änderung voraussichtlich auf Ihr Arbeitspensum auswirken wird, teilt IBM dies durch offizielle Mitteilungen mit. Um über Wartungsarbeiten, Serviceankündigungen und andere Aktualisierungen auf dem Laufenden zu bleiben, besuchen Sie die Seite Benachrichtigungen und Status der Überwachung.