Disaster Recovery Plan: Template e Guia Passo a Passo
Um plano de disaster recovery (DRP) bem estruturado pode ser a diferença entre recuperar suas operações em horas ou em semanas. Veja o template completo e aprenda a criar o seu.
Por que Todo Negócio Precisa de um DRP Formal
Pontos-Chave
- Um
DRPtestado transforma recuperação de semanas em horas- O custo médio global de uma violação atingiu US$ 4,88 milhões, segundo o IBM Cost of a Data Breach Report
- A ISO 22301 define
BIAeRTO/RPOcomo núcleo do planejamento de continuidade- Ataques de ransomware atingem maioria das organizações anualmente, conforme o Sophos State of Ransomware
- Testes semestrais são o mínimo —
DRPsem teste é ficção documentada
Um Disaster Recovery Plan (DRP) é um dos documentos mais críticos para qualquer empresa que depende de tecnologia — e hoje, praticamente todas dependem. Pesquisas setoriais mostram que uma fatia significativa das PMEs que sofrem perda total de dados encerra atividades em poucos meses. Ainda assim, a maioria das empresas brasileiras opera sem um DRP formalizado.
O DRP não é um documento técnico guardado na gaveta. É um roteiro acionável que permite à equipe de TI — e a toda a organização — agir de forma coordenada quando o pior acontece. Seja um ataque de ransomware, falha de servidor, incêndio no datacenter ou erro humano apagando produção, o DRP define o que fazer, quem faz e em quanto tempo.
Neste guia, você encontra um template completo adaptado à realidade brasileira, com seções que podem ser usadas como base direta para o plano da sua empresa.
DRP, BCP e a Relação com Backup
O DRP foca recuperação de TI. O BCP (Business Continuity Plan) abrange pessoas, processos e instalações. O DRP é um componente do BCP, e ambos dependem de uma base de backup corporativo sólida. Sem backup confiável, não há DRP — só esperança.
Soluções modernas integram o DRP com BaaS e DRaaS, viabilizando replicação contínua para nuvem e failover automatizado. Isso reduz drasticamente RTO e RPO, permitindo recuperação em minutos.
Template de Disaster Recovery Plan
Seção 1: Visão Geral e Escopo
- Nome do documento: Plano de Recuperação de Desastres — [Nome da Empresa]
- Versão: controle de versões com histórico
- Data de aprovação e próxima revisão (máximo 6 meses)
- Patrocinador executivo: C-level responsável
- Gestor do plano: responsável pela manutenção (CIO,
CISO) - Escopo: quais sistemas, sites e processos estão cobertos
- Exclusões: o que explicitamente não está coberto
Seção 2: Equipe de Resposta (DR Team)
- Coordenador do DR — autoridade de decisão durante o incidente
- Líder técnico de infraestrutura — executa restaurações
- Líder de aplicações — valida sistemas restaurados
- Líder de rede — reestabelece conectividade
- Comunicação e crise — mídia, clientes, parceiros
- Jurídico e compliance — notificações
LGPDà ANPD - Liderança executiva — decisões estratégicas
Cada função precisa ter um titular e um substituto documentados. Contatos 24/7 obrigatórios.
Seção 3: Análise de Impacto ao Negócio (BIA)
A base de todo DRP, conforme a ISO 22301. Para cada sistema crítico:
- Impacto financeiro por hora de indisponibilidade
- Impacto operacional (processos dependentes)
- Impacto regulatório (
LGPD,BACEN,ANS) - Impacto reputacional
- Dependências upstream e downstream
RTOeRPOdefinidos e validados
Seção 4: Classificação de Sistemas (Tiers)
| Tier | Criticidade | RTO | RPO | Estratégia |
|---|---|---|---|---|
| 0 | Missão crítica | < 1h | < 15 min | Replicação ativa + DRaaS |
| 1 | Crítico | 1-4h | 1h | Replicação assíncrona |
| 2 | Importante | 4-24h | 4-12h | BaaS com snapshots |
| 3 | Padrão | 24-72h | 24h | Backup diário |
Seção 5: Cenários de Desastre Cobertos
- Ransomware e malware destrutivo — ver proteção contra ransomware
- Falha de hardware crítico (servidor, storage, switch core)
- Falha de datacenter (energia, refrigeração, conectividade)
- Desastres naturais (enchente, incêndio, terremoto)
- Erro humano (exclusão acidental, comando destrutivo)
- Ataque à cadeia de suprimentos (comprometimento de fornecedor)
- Indisponibilidade de provedor cloud
Seção 6: Procedimentos de Recuperação (Runbooks)
Para cada sistema, um runbook detalhado com:
- Descrição do sistema e dependências
- Pré-requisitos de recuperação (credenciais, DNS, rede)
- Passos numerados de restauração
- Testes de validação pós-restauração
- Critérios de aceite para considerar o sistema "em produção"
- Rollback caso a restauração falhe
Seção 7: Comunicação Durante o Incidente
- Matriz de escalada — quem aciona quem, em quanto tempo
- Canais primários e secundários (WhatsApp, telefone, e-mail pessoal)
- Templates de comunicação para clientes, mídia, funcionários
- Ponto único de verdade (war room físico ou virtual)
- Cadência de updates (a cada 30 min nas 4 primeiras horas)
Seção 8: Infraestrutura de Recuperação
- Localização dos backups (primário e secundário)
- Tecnologia de backup (imutável, offsite, air-gapped)
- Provedor de
DRaaS - Site alternativo (hot, warm ou cold)
- Contratos de emergência com fornecedores
Seção 9: Testes e Validação
Um DRP sem testes é ficção documentada. Estabeleça cronograma:
- Trimestral: testes parciais (restauração de sistemas individuais)
- Semestral: teste completo de failover
- Anual: simulação full-scale com todos os times
- Após mudanças relevantes: teste direcionado
Cada teste gera relatório com RTO real medido, gaps identificados e ações corretivas.
Seção 10: Manutenção e Atualização
- Revisão formal a cada 6 meses
- Atualização após qualquer mudança arquitetural significativa
- Atualização após incidentes reais (lições aprendidas)
- Aprovação executiva a cada nova versão
Checklist de Implementação do DRP
- Patrocínio executivo formalizado
- Gestor do plano nomeado
- Equipe de resposta definida com titulares e suplentes
BIAconcluída para sistemas críticosRTOeRPOaprovados pelas áreas de negócio- Sistemas classificados em tiers
- Tecnologia de backup adequada a cada tier implementada
- Backup imutável para proteção anti-ransomware
- Regra
3-2-1-1-0atendida - Runbooks documentados para cada sistema crítico
- Matriz de comunicação definida
- Primeiro teste executado e documentado
- Cronograma de testes futuros aprovado
- Plano integrado ao política de backup corporativa
- Aderência a LGPD e normas setoriais validada
Checklist de Seções Obrigatórias do DRP
Um DRP completo precisa conter todas as seções listadas abaixo. Use esta tabela para auditar seu plano existente ou validar um novo documento antes da aprovação executiva.
| Seção | Conteúdo Mínimo | Responsável pela Elaboração | Frequência de Revisão |
|---|---|---|---|
| Visão geral e escopo | Objetivo do plano, sistemas cobertos, exclusões, versão e datas | Gestor do DRP / CISO | A cada revisão do plano |
| Equipe de resposta | Nomes, funções, contatos 24/7, substitutos | RH + TI | Trimestral |
| BIA (Análise de Impacto) | Impacto financeiro, operacional, regulatório e reputacional por sistema | Negócio + TI | Anual |
| Classificação de sistemas | Tiers com RTO/RPO e estratégia de proteção |
Arquiteto de TI | Semestral |
| Cenários de desastre | Lista de cenários cobertos com probabilidade e impacto | Segurança + TI | Anual |
| Runbooks de recuperação | Passos detalhados, pré-requisitos, validações, rollback | Equipe técnica | A cada mudança de infra |
| Comunicação de crise | Matriz de escalada, templates, canais, cadência de updates | Comunicação + TI | Semestral |
| Infraestrutura de recuperação | Locais de backup, tecnologias, provedores, site alternativo | Arquiteto de TI | A cada mudança de infra |
| Plano de testes | Cronograma, tipos de teste, métricas, critérios de sucesso | Gestor do DRP | Anual |
| Manutenção e governança | Processo de revisão, aprovações, controle de versão | Gestor do DRP | A cada revisão |
| Apêndices | Inventário de ativos, diagramas de rede, contratos, licenças | TI | Contínua |
Dica prática: se uma seção estiver incompleta ou ausente, marque-a como "em construção" com data-alvo de conclusão. Um DRP parcial documentado é melhor que nenhum plano.
Matriz RTO/RPO por Tipo de Sistema
A definição de RTO e RPO precisa ser granular. Cada tipo de sistema tem características diferentes de criticidade, volume de mudanças e complexidade de restauração. Use esta matriz como ponto de partida e ajuste conforme a realidade da sua empresa.
| Sistema | RPO Recomendado | RTO Recomendado | Estratégia de Backup | Estratégia de DR |
|---|---|---|---|---|
| ERP / Sistema financeiro | < 15 min | < 1h | CDP ou transaction log a cada 5 min | DRaaS com failover automatizado |
| Banco de dados de produção | < 15 min | < 1h | Transaction log + full diário | Replicação assíncrona + DRaaS |
| E-commerce / Portal web | < 30 min | < 30 min | CDP + snapshots a cada hora | Failover automático para nuvem |
| Active Directory / LDAP | 4-12h | < 1h | Backup diário (muda pouco) | Bare-metal recovery prioritário |
| E-mail corporativo | 1-4h | 2-4h | Incremental a cada 4h | Failover para instância secundária |
| File server / NAS | 4-24h | 4-12h | Incremental diário + offsite | Restauração a partir de nuvem |
| Microsoft 365 / Google Workspace | 4-12h | 4-24h | Backup diário via API | Restauração granular |
| Servidor de aplicação | 1-4h | 1-4h | Snapshot + incremental | VM replicada em standby |
| Sistemas de monitoramento / logs | 24-48h | 24-72h | Backup diário básico | Reconstrução manual aceitável |
| Ambiente de desenvolvimento / teste | 48-72h | 72h+ | Backup semanal | Reconstrução a partir de código-fonte |
A matriz acima segue a classificação por tiers apresentada na Seção 4 do template. Sistemas Tier 0 e Tier 1 exigem investimento em DRaaS, enquanto Tier 2 e Tier 3 podem utilizar BaaS com restauração manual. O equilíbrio entre custo e RTO é definido pela BIA — nunca pela intuição.
Calendário de Testes de DR: Template Anual
Testes de DR não podem ser ad hoc. Um calendário pré-aprovado garante que os testes aconteçam e que a equipe se prepare adequadamente. Use este template como base e ajuste ao calendário operacional da sua empresa.
| Mês | Tipo de Teste | Escopo | Duração Estimada | Participantes |
|---|---|---|---|---|
| Janeiro | Tabletop exercise | Revisão do plano com toda a equipe de DR. Cenário: ransomware | 2-3 horas | Equipe DR + diretoria |
| Fevereiro | Teste parcial | Restauração de banco de dados crítico em ambiente isolado | 4 horas | DBA + infra |
| Março | Teste de comunicação | Acionar cadeia de comunicação de crise (canais primários e secundários) | 1 hora | Todos os membros da equipe DR |
| Abril | Teste parcial | Bare-metal recovery de servidor AD/DNS | 4-6 horas | Infra + rede |
| Maio | Teste de failover parcial | Failover de 1 sistema Tier 0 para ambiente DRaaS | 4 horas | Infra + aplicações |
| Junho | Teste completo de failover | Failover de todos os sistemas Tier 0 e Tier 1. Operação no site de DR por 2h | 6-8 horas | Equipe DR completa |
| Julho | Tabletop exercise | Cenário: falha de datacenter (incêndio/enchente). Revisão de lições do 1º semestre | 2-3 horas | Equipe DR + diretoria |
| Agosto | Teste parcial | Restauração de Microsoft 365 / Google Workspace (caixas de e-mail + SharePoint) | 3-4 horas | Infra + suporte |
| Setembro | Teste de rede | Failover de links de internet, validação de VPN para site de DR | 2-3 horas | Rede + infra |
| Outubro | Teste parcial | Restauração de ERP completo em ambiente isolado. Validação ponta a ponta | 6-8 horas | Infra + aplicações + negócio |
| Novembro | Teste de failover parcial | Failover de sistemas Tier 1 para ambiente DRaaS | 4-6 horas | Infra + aplicações |
| Dezembro | Simulação full-scale anual | Simulação completa de desastre. Failover total. Operação em DR por 4h. Failback | 8-12 horas | Toda a organização |
Cada teste deve gerar um relatório formal contendo: cenário simulado, tempo real de recuperação vs RTO declarado, gaps identificados, ações corretivas com prazo e responsável. Armazene esses relatórios junto ao DRP — eles são evidência para auditorias de LGPD, compliance e certificações como ISO 22301.
Gatilhos de Revisão do DRP: Quando Atualizar o Plano
O DRP não é um documento estático. Além das revisões periódicas (mínimo semestral), existem eventos específicos que devem disparar uma revisão imediata. Ignorar esses gatilhos significa operar com um plano desatualizado — que pode falhar justamente quando for necessário.
| Gatilho | Tipo de Revisão | Prazo Máximo | Exemplo |
|---|---|---|---|
| Mudança de infraestrutura | Atualizar runbooks + classificação de tiers | 30 dias após a mudança | Migração de ERP para nuvem, novo servidor de banco de dados |
| Incidente real de segurança | Revisão completa + lições aprendidas | 15 dias após resolução | Ataque de ransomware, vazamento de dados |
| Mudança regulatória | Atualizar compliance + comunicação | 30 dias após publicação | Nova resolução LGPD, exigência BACEN |
| Fusão ou aquisição | Revisão completa (novos sistemas, equipes, processos) | 60 dias após integração | Aquisição de empresa com infraestrutura própria |
| Troca de fornecedor crítico | Atualizar infraestrutura de recuperação + contatos | 15 dias após go-live | Novo provedor de nuvem, novo link de internet |
| Saída de membro-chave da equipe DR | Atualizar equipe + treinar substituto | 7 dias após saída | Saída do líder técnico de infraestrutura |
| Resultado insatisfatório em teste | Revisão das seções com falhas identificadas | 15 dias após o teste | RTO real de 8h quando o declarado era 2h |
| Mudança significativa no negócio | Atualizar BIA + classificação de criticidade | 30 dias após a mudança | Lançamento de e-commerce, abertura de filial |
| Revisão periódica | Revisão completa do plano | A cada 6 meses | Calendário fixo (janeiro e julho, por exemplo) |
Processo de revisão: o gestor do DRP deve manter uma lista de gatilhos ativos e monitorar proativamente. Cada revisão gera uma nova versão do documento com histórico de alterações. A versão atualizada precisa ser aprovada pelo patrocinador executivo e comunicada a toda a equipe de DR.
Matriz RACI: Papéis e Responsabilidades no DR
Durante um incidente, confusão sobre quem decide, quem executa e quem precisa ser informado atrasa a recuperação e pode transformar um incidente gerenciável em uma crise. A matriz RACI (Responsible, Accountable, Consulted, Informed) elimina essa ambiguidade.
| Atividade | Coordenador DR | Líder Infra | Líder Apps | Líder Rede | Comunicação | Jurídico | Diretoria |
|---|---|---|---|---|---|---|---|
| Declarar incidente de DR | A | C | C | C | I | I | R |
| Isolar sistemas afetados | A | R | C | R | I | I | I |
| Executar restauração de dados | A | R | C | I | I | I | I |
| Executar failover DRaaS | A | R | R | R | I | I | I |
| Validar sistemas restaurados | A | C | R | C | I | I | I |
| Comunicar clientes e mídia | C | I | I | I | R | A | C |
| Notificar ANPD (LGPD) | C | I | I | I | C | R | A |
| Autorizar failback | R | C | C | C | I | I | A |
| Elaborar relatório pós-incidente | R | C | C | C | C | C | A |
| Atualizar DRP com lições aprendidas | R | C | C | C | I | C | A |
Legenda:
- R = Responsável (executa a atividade)
- A = Aprovador (autoridade final, presta contas)
- C = Consultado (contribui com expertise antes da decisão)
- I = Informado (recebe atualização de status)
Adapte esta matriz à estrutura da sua empresa. Em PMEs, uma mesma pessoa pode acumular múltiplos papéis — mas garanta que cada atividade tenha pelo menos um R e um A claramente designados. Se o coordenador de DR estiver indisponível durante o incidente, o substituto documentado assume todas as funções A.
Cenários Práticos de Aplicação da Matriz RACI
Cenário 1: Ransomware criptografa servidores de produção (sexta-feira, 22h)
- Alerta automático dispara notificação para o Líder de Infra (R: isolar sistemas)
- Líder de Infra contata o Coordenador DR (A: declarar incidente)
- Coordenador escala para Diretoria (R: aprovar ativação do plano de DR)
- Comunicação é informada (I) e prepara templates de notificação
- Jurídico avalia obrigação de notificação à ANPD
- Líder de Infra executa failover DRaaS (R); Líder de Apps valida (R)
Cenário 2: Falha de storage no datacenter principal (terça-feira, 14h)
- Líder de Infra detecta falha e inicia bare-metal recovery (R)
- Coordenador DR avalia se é necessário declarar incidente formal (A)
- Líder de Rede é consultado sobre conectividade com site de DR (C)
- Diretoria é informada sobre previsão de restauração (I)
- Após restauração, Líder de Apps valida todos os sistemas (R)
Erros Comuns ao Criar um DRP
Erro 1: Criar e esquecer
O DRP precisa ser vivo. Documento em PDF engavetado não salva ninguém em crise.
Erro 2: Pular a BIA
Sem análise de impacto, o plano tenta proteger tudo da mesma forma e acaba protegendo nada adequadamente.
Erro 3: Não envolver o negócio
DRP não é só TI. Exige diretoria, finanças, operações, jurídico, comunicação.
Erro 4: Não testar
O primeiro teste real é geralmente um balde de água fria. Teste antes que o desastre teste você.
Erro 5: Ignorar dependências
Sistemas não existem isolados. ERP precisa de banco, banco precisa de AD, AD precisa de DNS. O runbook tem que refletir essa cadeia.
Próximos Passos
- Calcule
RTOeRPOdos seus sistemas críticos - Para PMEs, veja disaster recovery para PMEs
- Implemente backup imutável antes de qualquer outro item do
DRP - Avalie
DRaaSpara reduzirRTOdrasticamente - Revise os hubs de disaster recovery e proteção contra ransomware
- Saiba como recuperar dados após ransomware para incluir cenário específico
Fale com um especialista da DataBackup via WhatsApp e receba um template personalizado para o seu setor.
Um plano de disaster recovery só funciona com infraestrutura adequada. A DataBackup combina backup imutável + DRaaS com Run Direct para restaurar VMs em menos de 4 horas. Teste 14 dias grátis.
Proteger Minha Empresa Falar com Especialista