Verständnis von Hochverfügbarkeit und Notfallwiederherstellung für DNS Services

HochverfügbarkeitDie Fähigkeit eines Dienstes oder einer Arbeitslast, Ausfällen standzuhalten und die Verarbeitungsfähigkeit gemäß einem vordefinierten Servicelevel weiterhin bereitzustellen. Für Dienstleistungen ist die Verfügbarkeit im Service Level Agreement definiert. Die Verfügbarkeit umfasst sowohl geplante als auch ungeplante Ereignisse wie Wartungsarbeiten, Ausfälle und Katastrophen. (HA) ist die Fähigkeit eines Dienstes, auch bei unerwarteten Ausfällen betriebsbereit und zugänglich zu bleiben. Der Hauptzweck der Hochverfügbarkeit ist es, potenzielle Fehlerquellen in einer IT-Infrastruktur zu eliminieren. Unter Disaster RecoveryDie Fähigkeit eines Dienstes oder einer Arbeitslast, sich von seltenen, schwerwiegenden Vorfällen und großflächigen Ausfällen, wie z. B. Dienstunterbrechungen, zu erholen. Dies umfasst eine Naturkatastrophe, die eine ganze Region betrifft, die Beschädigung einer Datenbank oder den Verlust eines Dienstes, der zu einer Arbeitsbelastung beiträgt. Die Auswirkungen übersteigen die Fähigkeit des Hochverfügbarkeitsdesigns, sie zu bewältigen. versteht man die Wiederherstellung eines funktionierenden Zustands der Service-Instanz. Es umfasst Verfahren zum Kopieren und Speichern der wesentlichen Daten eines installierten Systems an einem sicheren Ort sowie zur Wiederherstellung dieser Daten, um den normalen Betrieb wiederherzustellen.

DNS Services ist darauf ausgelegt, die Service Level Objectives(SLO) mit dem Standardplan zu erfüllen. DNS Services ist ein hochverfügbarer globaler Dienst, der zur Erhöhung der Ausfallsicherheit mit separaten Fehlerdomänen ausgestattet ist. Die Steuerebene ist sowohl gegen zonale als auch regionale Ausfälle resistent, und ihr Ausfall hat keine Auswirkungen auf die Datenebene. Die Datenebene ist zumindest gegenüber zonalen Ausfällen widerstandsfähig, und ihr Ausfall wirkt sich nicht auf die Steuerungsebene aus.

Weitere Informationen zu den Bereitstellungsregionen und Rechenzentrumsstandorten für DNS Services finden Sie unter Service- und Infrastrukturverfügbarkeit nach Standort.

Architektur für hohe Verfügbarkeit

Steuerebene

IBM Cloud® DNS Services ist ein global verfügbarer Dienst (GA). Die öffentlichen API-Endpunkte für die DNS-Konfiguration sind über einen globalen Load Balancer verfügbar, der in zwei MultizonenregionenEine Region, die über physische Standorte in mehreren Zonen verteilt ist, um die Fehlertoleranz zu erhöhen. (MZR) von IBM Cloud untergebracht ist und eine hohe Verfügbarkeit gewährleistet. Diese Regionen sind Dallas und Washington, DC. Fällt eine Region aus, leitet der globale Load Balancer den API-Datenverkehr automatisch an die andere Region weiter. Wenn zum Beispiel die Region Dallas nicht verfügbar ist, werden die Anfragen an andere verfügbare geografische Regionen weitergeleitet - in diesem Fall Washington, DC.

Im Falle eines globalen Ausfalls wird die Steuerungsebene wiederhergestellt, wobei der Schwerpunkt auf der Verringerung des Datenverlusts bei den Ressourcen liegt. Daher sollten die Kunden auch eine Notfallwiederherstellung planen.

Eine Steuerebene bearbeitet vom Benutzer initiierte DNS-Konfigurationsanforderungen, während eine Datenebene Namensauflösungsanforderungen von der Virtual Private Cloud (VPC) bearbeitet.

Datenebene DNS-Server

Die DNS-Server sind global über mehrere MZRs verteilt und verwenden Anycast-IP-Adressen, um die Latenzzeit zu optimieren und eine hohe Verfügbarkeit zu gewährleisten. Wenn eine Verfügbarkeitszone oder eine ganze Region ausfällt, werden DNS-Anfragen automatisch an die nächstgelegene Verfügbarkeitszone oder Region weitergeleitet. DNS-Daten werden in den folgenden Regionen repliziert, um sowohl die Latenzzeit zu optimieren als auch eine hohe Verfügbarkeit zu gewährleisten:

Dallas (us-south)
Washington, D.C. (US-Ost)
London (eu-gb)
Madrid (eu-es)
Frankfurt (eu-de)
Osaka (jp-osa)
Tokio (jp-tok)
Toronto (ca-tor)
Sydney (au-syd)
Sao Paulo (br-sao)

Benutzerdefinierte Auflöser für die Datenebene

Ein benutzerdefinierter Resolver ist ein regionales Objekt, das sich aus zonenübergreifenden Objekten (benutzerdefinierte Resolverstandorte) zusammensetzt, die in zonenübergreifenden Subnetzen konfiguriert sind. Es hat sich bewährt, angepasste Resolver in mehreren Teilnetzen zu implementieren, um eine hohe Verfügbarkeit sicherzustellen. Es wird empfohlen, die Implementierung in allen drei Verfügbarkeitszonen durchzuführen.

Bei einem regionalen Ausfall wird dieser Aspekt der Datenebene auf den Zustand der Ressourcen zurückgesetzt, wie er in der Steuerungsebene dargestellt und beibehalten wird.

Funktionen für hohe Verfügbarkeit

DNS Services unterstützt die folgenden Hochverfügbarkeitsfunktionen:

HA-Funktionen für DNS Services
Feature	Beschreibung	Hinweis
Benutzerdefinierte Resolver-Standorte	Verwalten Sie, wo Ihr benutzerdefinierter Resolver eingesetzt wird.	Sorgt nur für mehr Widerstandsfähigkeit bei zonalen Ausfällen.

Sie können Hochverfügbarkeit auf verschiedenen Ebenen innerhalb Ihrer IT-Infrastruktur und zwischen verschiedenen Komponenten Ihres DNS-Clusters erreichen. Welches Verfügbarkeitsniveau für Sie das richtige ist, hängt von mehreren Faktoren ab, u. a. von Ihren geschäftlichen Anforderungen, den Service Level Agreements (SLAs), die Sie mit Ihren Kunden abgeschlossen haben, und den Ressourcen, die Sie bereit sind, einzusetzen.

Der Verfügbarkeitsgrad, den Sie für Ihren Cluster einrichten, wirkt sich auf Ihre Abdeckung im Rahmen der IBM Cloud Hochverfügbarkeits-SLA-Bedingungen aus.

Die Service Level Objectives (SLOs) definieren die Designpunkte, die die IBM Cloud Dienste erfüllen sollen. IBM Cloud® DNS Services ist so konzipiert, dass das folgende Verfügbarkeitsziel erreicht wird.

SLO für DNS Services
Verfügbarkeitsziel	Zielwert
Verfügbarkeit %	99.999%

Die SLO ist keine Garantie und IBM vergibt keine Credits für das Nichterreichen eines Ziels. In den SLAs sind die Verpflichtungen und Gutschriften aufgeführt, die bei Nichteinhaltung von SLAs erteilt werden. Eine Übersicht über alle SLOs finden Sie unter IBM Cloud service level objectives.

Weitere Informationen zur Serviceverfügbarkeit in Regionen und Rechenzentren finden Sie unter Service- und Infrastrukturverfügbarkeit nach Standort.

Weitere Informationen zu den Standards für Hochverfügbarkeit und Notfallwiederherstellung in IBM Cloud Hochverfügbarkeit und IBM Cloud.

Architektur zur Wiederherstellung im Katastrophenfall

Eine externe Aufzeichnung Ihrer DNS-Konfiguration ist wichtig für die Wiederherstellung von DNS Services im Falle einer Katastrophe. Sowohl der Sicherungs- als auch der Wiederherstellungsprozess können mit Hilfe von Skripten und den Export- und Importprozessen in der Tabelle Disaster Recovery Features automatisiert werden. DNS Services unterstützt Terraform und kann verwendet werden, um Arbeitslasten mit parametrisierten Standorten und Leistungen zu definieren. Kunden können IBM Cloud Schematics nutzen, um Terraform-Skripte zu erstellen und zu verwalten, die wiederum zur Wiederherstellung von Ressourcen an einem verfügbaren Standort während einer Katastrophe verwendet werden können.

Funktionen zur Wiederherstellung im Katastrophenfall

IBM Cloud® DNS Services unterstützt die folgenden Disaster-Recovery-Funktionen:

Feature	Beschreibung	Hinweis
DNS-Ressourceneinträge exportieren	Exportieren Sie DNS-Einträge für eine Zone über das Dashboard in eine Textdatei.	Exportiert nur DNS-Einträge für jeweils eine Zone. Exportiert keine Load Balancer- oder andere Nicht-DNS-Eintragsdaten.
DNS-Ressourceneinträge importieren	Importieren Sie DNS-Einträge aus einer Textdatei in eine Zone über das Dashboard.	Sie müssen die Zone neu erstellen, bevor Sie DNS-Einträge importieren.
Externe Quelle der Wahrheit	DNS-Zonen, zugelassene Netzwerke, DNS-Ressourcendatensätze, benutzerdefinierte Resolver, benutzerdefinierte Regeln für die Weiterleitung von Resolvern und mehr, die in vom Kunden verwalteten Konfigurationsdateien wie Terraform-Skripten, Shell-Skripten oder Programmen erfasst werden.	Der Kunde muss das Skript oder Programm erstellen und die Konfiguration dort speichern, wo sie im Katastrophenfall verwendet werden kann.
Sichern und Wiederherstellen	Sicherung einer Dienstinstanz mit einem vom Kunden geschriebenen Skript.	Der Kunde muss das Skript erstellen und die Sicherungskopie dort aufbewahren, wo sie bei der Wiederherstellung verwendet werden kann.

Planung für DR

Als Kunde sind Sie für die Wiederherstellung Ihrer DNS-Server-Konfigurationsdaten im Falle einer Katastrophe verantwortlich. Sie sollten sicherstellen, dass Sie einen Notfallwiederherstellungsplan erstellen und die folgenden Ausfallszenarien und Lösungen berücksichtigen:

DR-Szenarien für DNS Services
Fehler	Lösung
Zonales Versagen	Entschärfung für benutzerdefinierte Resolver durch Bereitstellung an mehreren Standorten Entschärfung für DNS-Server durch Beantwortung von Anfragen durch die nächstgelegene verfügbare Zone.
Regionales Versagen	Ausfall für benutzerdefinierte Resolver, bis eine Verfügbarkeitszone wiederhergestellt ist. Bei DNS-Servern werden die Anfragen von der nächstgelegenen verfügbaren Region beantwortet.
Datenbeschädigung	Wiederherstellung von Dienstkonfigurationen aus einer externen Quelle der Wahrheit.

Ihre Verantwortlichkeiten für HA und DR

Es liegt in Ihrer Verantwortung, Ihren Plan für HA und DR kontinuierlich zu testen.

Es kann zu Unterbrechungen der Netzanbindung und zu kurzen Zeiten der Nichtverfügbarkeit eines Dienstes kommen. Es liegt in Ihrer Verantwortung, sicherzustellen, dass der Quellcode der Anwendung eine Logik zur Wiederholung der Client-Verfügbarkeit enthält, um eine hohe Verfügbarkeit der Anwendung zu gewährleisten.

Verwenden Sie die folgenden Checklisten, die zu jedem Merkmal gehören, um Ihren Plan zu erstellen und zu üben.

Angepasster Auflöser
- Sicherstellen, dass die DNS-Zonen- und -Ressourcendatensatzdaten korrekt und präzise sind.
- Erstellen Sie regelmäßig Backups Ihrer DNS-Zonen und Ressourceneinträge.
- Um eine hohe Verfügbarkeit zu erreichen, konfigurieren Sie benutzerdefinierte Auflöser mit mindestens zwei Auflöserstandorten. Am besten ist es, in jeder Verfügbarkeitszone einen Standort einzurichten.
- Um eine korrekte Hochverfügbarkeit von sekundären Zonen mit mehreren benutzerdefinierten Auflösungsstandorten zu gewährleisten, konfigurieren Sie Ihren On-Prem-Resolver so, dass Zonentransfers zu allen erstellten benutzerdefinierten Auflösungsstandorten möglich sind.

Weitere Informationen über die Verantwortlichkeit zwischen Ihnen und IBM Cloud für IBM Cloud DNS Services finden Sie unter Verstehen Sie Ihre Verantwortlichkeiten bei der Verwendung von IBM Cloud DNS Services.

Änderungsmanagement

Die Änderungsverwaltung umfasst Aufgaben wie die Änderung und Löschung von Konfigurationen.

Gewähren Sie Benutzern und Prozessen die Identity and Access Management (IAM)-Rollen und -Aktionen mit den geringsten Berechtigungen, die für ihre Arbeit erforderlich sind. Weitere Informationen finden Sie unter Wie kann ich ein versehentliches Löschen von Diensten verhindern?

Zu den bewährten Praktiken für die Bewältigung des Wandels gehören auch:

Planen und dokumentieren Sie Änderungen, indem Sie ein Änderungsprotokoll für alle an Ihrer DNS Services Konfiguration vorgenommenen Änderungen führen.
Erstellen Sie eine Sicherungskopie der kritischen Konfigurationen, bevor Sie größere Änderungen vornehmen.
Planen Sie Änderungen mit hoher Auswirkung in Zeiträumen mit geringem Datenverkehr und informieren Sie die betroffenen Teams.
Überwachen Sie den Zustand und die Metriken Ihrer DNS Services, um sicherzustellen, dass alles wie erwartet funktioniert.

Wie IBM die Wiederherstellung im Katastrophenfall unterstützt

IBM® ergreift im Katastrophenfall spezifische Wiederherstellungsmaßnahmen für IBM Cloud® DNS Services.

Wie IBM sich von regionalen Ausfällen erholt

IBM Cloud verfügt über GeschäftskontinuitätspläneDie Fähigkeit eines Unternehmens, Ausfallzeiten zu kompensieren und geschäftskritische Services normal und unterbrechungsfrei den vordefinierten Service-Level-Agreements entsprechend zu betreiben., die im Falle einer Katastrophe die Wiederherstellung der Dienste innerhalb von Stunden ermöglichen. Sie sind für die Sicherung Ihrer Daten und die zugehörige Wiederherstellung Ihrer Inhalte verantwortlich.

DNS Services bieten Mechanismen zum Schutz Ihrer Daten und zur Wiederherstellung der Dienstfunktionen. Es gibt Pläne zur Aufrechterhaltung des Geschäftsbetriebs, um die angestrebten Ziele für den WiederherstellungspunktBei der Planung der Notfallwiederherstellung wird die Zeit, in der Daten wiederhergestellt werden, in Zeit gemessen (Sekunden, Minuten, Stunden), beginnend mit der wiederhergestellten Instanz und endend am Punkt des Notfalls. (RPO) und die WiederherstellungszeitIn der Notfallwiederherstellungsplanung die Zeitspanne, die ein Geschäftsprozess nach einem Notfall benötigt, um wiederhergestellt zu werden. (RTO) für den Dienst zu erreichen. In der folgenden Tabelle sind die Ziele für DNS Services aufgeführt.

RPO und RTO für DNS Services
Element der Dienstleistung	RPO	RTO
Steuerebene	0	< 60 Sek
Datenebene	0	< 60 Sek
Angepasster Auflöser	0	< 60 Sek
Datenbankwiederherstellung	24 Std.	8 Stunden

Wenn IBM die Dienstinstanz nicht wiederherstellen kann, müssen Sie den Dienst wie in der Disaster-Recovery-Architektur beschrieben wiederherstellen.

Weitere Informationen zur Serviceverfügbarkeit in Regionen und Rechenzentren finden Sie unter Service- und Infrastrukturverfügbarkeit nach Standort.

Wie IBM Dienste unterhält

Alle Upgrades erfolgen nach den bewährten Verfahren von IBM, einschließlich Wiederherstellungsplänen und Rollback-Prozessen. Regelmäßige Wartungsarbeiten können zu kurzen Unterbrechungen führen, die durch eine Logik zur Wiederholung der Client-Verfügbarkeit gemildert werden. Die Änderungen werden nacheinander ausgerollt, Region für Region und Zone für Zone innerhalb einer Region. IBM nimmt Aktualisierungen bei den ersten Anzeichen eines Fehlers zurück.

IBM informiert im Voraus über alle geplanten Wartungsarbeiten. Wenn sich eine Änderung voraussichtlich auf Ihr Arbeitspensum auswirken wird, teilt IBM dies durch offizielle Mitteilungen mit. Um über Wartungsarbeiten, Serviceankündigungen und andere Aktualisierungen auf dem Laufenden zu bleiben, besuchen Sie die Seite Benachrichtigungen und Status der Überwachung.