Facebook down: O que sua empresa pode fazer para não cair no limbo?
Na última segunda-feira, 4 de outubro de 2021, o Facebook (incluindo suas outras aplicações Instagram e WhatsApp) passou pelo maior evento de indisponibilidade da sua história. Todas as redes sociais ficaram totalmente fora do ar por um período de aproximadamente sete horas.
Segundo o relatório oficial do Facebook, o erro ocorreu devido a uma falha na configuração dos equipamentos de rede. Pelo que tudo indica, o problema foi causado por uma configuração errada em seus roteadores de Border Gateway Protocol (BGP) que fazem a comutação do tráfego entre os seus "Pontos de Presença" (POPs).
Mas por que levou tanto tempo para retomarem os serviços? Tudo leva a crer que ocorreu o famoso "tiro no pé", ou seja, quando há um erro de configuração, a rede "desliga-se da internet" e perde-se o acesso aos equipamentos e/ou sistemas de suporte internos para poder corrigir o problema sem impactar o acesso aos usuários.
Mas, o que podemos aprender com esse erro e o que fazer para mitigar esse risco?
Primeiro ponto que devemos destacar: É preciso sempre pensar na sua árvore de dependências. Isso significa, mapear todos os componentes da sua infraestrutura e a relação entre eles. Neste caso específico, aparentemente, as ferramentas de suporte dependiam da rede.
Ter um plano contra desastres é um ponto chave. As pessoas precisam ter informações e serem treinadas sobre como agir quando há um problema como este. No caso do Facebook, pelo relatório público disponibilizado, houve problema de acesso dos engenheiros e analistas às ferramentas do dia a dia que seriam utilizadas para que o ambiente voltasse ao ar.
Ter implantada uma política de escopo de poderes de administração nos equipamentos também é muito importante. Mapear atividades versus pessoas e sistemas, inclusive com controle de aprovações, tendem a reduzir erros de configuração.
Na disciplina de gestão de redes, uma boa prática é construir uma rede de gerenciamento apartada Out of Band (OFB). Essa rede não pode ter qualquer dependência da sua rede de produção e pode ser construída com equipamentos de mercado ou soluções específicas. Um bom engenheiro de redes consegue desenhar a melhor solução para cada cenário.
Em uma visão geral, a sugestão para minimizar riscos é ter um ambiente bem projetado, documentado e pensado para que, em eventos extremos como esse, a recuperação do ambiente aconteça de forma mais rápida possível.
Artur Araujo é Diretor e chefe de Tecnologia Pinpoint e especialista em gerenciamento e desenvolvimento em infraestrutura de TI, redes e telecomunicações e segurança da informação.
Compartilhe:: Participe do GRUPO SEGS - PORTAL NACIONAL no FACEBOOK...:
https://www.facebook.com/groups/portalnacional/
<::::::::::::::::::::>
IMPORTANTE.: Voce pode replicar este artigo. desde que respeite a Autoria integralmente e a Fonte... www.segs.com.br
<::::::::::::::::::::>
No Segs, sempre todos tem seu direito de resposta, basta nos contatar e sera atendido. - Importante sobre Autoria ou Fonte..: - O Segs atua como intermediario na divulgacao de resumos de noticias (Clipping), atraves de materias, artigos, entrevistas e opinioes. - O conteudo aqui divulgado de forma gratuita, decorrem de informacoes advindas das fontes mencionadas, jamais cabera a responsabilidade pelo seu conteudo ao Segs, tudo que e divulgado e de exclusiva responsabilidade do autor e ou da fonte redatora. - "Acredito que a palavra existe para ser usada em favor do bem. E a inteligencia para nos permitir interpretar os fatos, sem paixao". (Autoria de Lucio Araujo da Cunha) - O Segs, jamais assumira responsabilidade pelo teor, exatidao ou veracidade do conteudo do material divulgado. pois trata-se de uma opiniao exclusiva do autor ou fonte mencionada. - Em caso de controversia, as partes elegem o Foro da Comarca de Santos-SP-Brasil, local oficial da empresa proprietaria do Segs e desde ja renunciam expressamente qualquer outro Foro, por mais privilegiado que seja. O Segs trata-se de uma Ferramenta automatizada e controlada por IP. - "Leia e use esta ferramenta, somente se concordar com todos os TERMOS E CONDICOES DE USO".
<::::::::::::::::::::>

Adicionar comentário