Back to Design Solutions for Organizational Complexity

Multi-site disaster recovery

5 minutes 5 Questions

Multi-site disaster recovery represents the highest tier of AWS disaster recovery strategies, offering near-zero Recovery Time Objective (RTO) and Recovery Point Objective (RPO). This approach involves running fully functional production workloads simultaneously across two or more AWS Regions or a …

Multi-Site Disaster Recovery: Complete Guide for AWS Solutions Architect Professional

Why Multi-Site Disaster Recovery is Important

Multi-site disaster recovery represents the highest tier of disaster recovery strategies, providing near-zero downtime and minimal data loss. Organizations with mission-critical applications, such as financial trading platforms, healthcare systems, and e-commerce giants, cannot afford extended outages. The cost of downtime often exceeds millions of dollars per hour, making the investment in multi-site DR essential for business continuity and regulatory compliance.

What is Multi-Site Disaster Recovery?

Multi-site disaster recovery is an active-active deployment strategy where your application runs simultaneously in two or more AWS Regions or locations. Unlike pilot light or warm standby approaches, multi-site DR maintains fully operational environments in multiple locations, capable of handling production traffic at all times. This strategy offers:

- RTO (Recovery Time Objective): Near-zero, typically seconds to minutes
- RPO (Recovery Point Objective): Near-zero, often real-time or seconds
- Cost: Highest among all DR strategies, as you run full production capacity in multiple locations

How Multi-Site Disaster Recovery Works

Architecture Components:

1. Active-Active Infrastructure: Identical production environments running in multiple AWS Regions, each capable of serving 100% of traffic independently.

2. Global Traffic Management: Amazon Route 53 with latency-based, geolocation, or weighted routing policies distributes traffic across regions. Health checks automatically detect failures and redirect traffic.

3. Data Synchronization: Amazon Aurora Global Database provides cross-region replication with less than one second lag. DynamoDB Global Tables offer multi-region, multi-master replication. S3 Cross-Region Replication ensures data availability.

4. Stateless Application Design: Applications should be designed to be stateless, with session data stored in ElastiCache Global Datastore or DynamoDB Global Tables.

5. Infrastructure as Code: AWS CloudFormation StackSets or Terraform ensures consistent deployment across all regions.

Failover Process:

In a multi-site configuration, failover is often automatic and seamless. Route 53 health checks detect endpoint failures and stop routing traffic to unhealthy regions within seconds. Users experience minimal or no service interruption as traffic flows to healthy regions.

Key AWS Services for Multi-Site DR

- Amazon Route 53: DNS failover and traffic routing
- AWS Global Accelerator: Improved global performance and automatic failover
- Amazon Aurora Global Database: Sub-second cross-region replication
- DynamoDB Global Tables: Multi-region, multi-master database
- Amazon S3: Cross-Region Replication for object storage
- AWS CloudFormation StackSets: Multi-region infrastructure deployment
- Amazon ElastiCache Global Datastore: Cross-region session management

Exam Tips: Answering Questions on Multi-Site Disaster Recovery

Tip 1: Recognize the Trigger Words
Look for phrases like near-zero RTO/RPO, active-active, no downtime acceptable, mission-critical, or highest availability requirements. These indicate multi-site DR is the correct answer.

Tip 2: Understand Cost Trade-offs
When a question mentions cost optimization alongside DR requirements, multi-site is rarely the answer unless the scenario explicitly states that cost is not a concern and maximum availability is required.

Tip 3: Know the DR Strategy Hierarchy
Understand the four DR strategies in order of cost and recovery speed: Backup and Restore (cheapest, slowest) → Pilot Light → Warm Standby → Multi-Site (most expensive, fastest). Questions may ask you to recommend the appropriate strategy based on RTO/RPO requirements.

Tip 4: Aurora Global Database vs DynamoDB Global Tables
Choose Aurora Global Database for relational workloads requiring SQL compatibility. Select DynamoDB Global Tables for NoSQL workloads requiring multi-master writes across regions.

Tip 5: Route 53 is Almost Always Involved
Any multi-site DR question will likely involve Route 53 for DNS-based traffic management. Know the difference between failover, latency-based, and weighted routing policies.

Tip 6: Watch for Data Consistency Requirements
If a question emphasizes strong consistency across regions, remember that multi-site architectures typically offer eventual consistency. Special consideration is needed for applications requiring strong consistency.

Tip 7: Eliminate Partial Solutions
Answers suggesting single-region solutions or manual intervention during failover are incorrect for true multi-site DR scenarios. Look for fully automated, multi-region solutions.

Tip 8: Consider the Complete Picture
The correct answer typically addresses compute, database, storage, and networking components together. Partial solutions addressing only one layer are usually incorrect.

Test mode:

Exam (Timed)

Practice (With explanations)

Start practice test

Unlock Premium Access

AWS Certified Solutions Architect - Professional

Access to ALL Certifications: Study for any certification on our platform with one subscription
8734 Superior-grade AWS Certified Solutions Architect - Professional practice questions
Unlimited practice tests across all certifications
Detailed explanations for every question
SAP-C02: 5 full exams plus all other certification exams
100% Satisfaction Guaranteed: Full refund if unsatisfied
Risk-Free: 7-day free trial with all premium features!

More Multi-site disaster recovery questions

29 questions (total)

Start 29 question test