Como os departamentos de TI se adaptaram ao caos da CrowdStrike em apenas 7 dias.

Como os Departamentos de TI se Esforçaram para Resolver o Caos da CrowdStrike

O caos provocado pela falha no software da CrowdStrike abalou empresas de todo o mundo, desde companhias aéreas a hospitais, afetando desde grandes corporações a pequenos negócios. Os profissionais de TI tiveram que agir rapidamente para resolver o problema e restabelecer os sistemas.

A Urgência de Resolver o Problema

Para uma empresa de serviços funerários da Costa Oeste, o problema precisava ser resolvido com urgência. O administrador de sistemas da empresa teve que trabalhar quase 20 horas seguidas, dirigindo-se de um local a outro para reiniciar dezenas de computadores manualmente e garantir que os serviços funerários e a comunicação com os hospitais não fossem interrompidos. “As pessoas estão de luto e precisamos garantir que tudo esteja funcionando para que elas possam realizar os serviços”, explica o administrador.

O Impacto em Diferentes Setores

Como os departamentos de TI se adaptaram ao caos da CrowdStrike em apenas 7 dias.
Source: wired.com

O problema da CrowdStrike afetou empresas e organizações de diversos setores. Em um sistema de saúde no estado de Maryland, a equipe técnica precisou trabalhar durante a madrugada para restabelecer os servidores e consertar mais de 5.000 dispositivos. Isso chegou a bloquear até mesmo as ligações telefônicas para o hospital e o sistema de dispensação de medicamentos, forçando a equipe a anotar tudo à mão e levar os remédios pessoalmente à farmácia.

Desafios Adicionais

Além da enorme quantidade de equipamentos a serem consertados, a falta de funcionários também dificultou o processo. Com equipes técnicas reduzidas em anos recentes, os profissionais que restaram tiveram que trabalhar jornadas de 12 a 14 horas por dia, correndo o risco de se esgotarem. “Queremos garantir que tudo funcione e que as pessoas sejam atendidas, mas é muito difícil fazer isso quando não temos funcionários suficientes”, desabafa o administrador do sistema de saúde.

Problemas com o BitLocker

A criptografia do Windows, o BitLocker, também se tornou um complicador. Com os computadores no estado defeituoso, os usuários não conseguiam digitar as chaves necessárias para desbloqueá-los e aplicar o patch. Isso exigiu que os profissionais de TI encontrassem maneiras complicadas de resolver o problema.

Impacto em Parceiros e Terceiros

Mesmo empresas que não eram clientes da CrowdStrike tiveram que lidar com os reflexos do problema. Um CISO do Centro-Oeste relata que sua equipe precisou tratar manualmente cerca de 120 computadores que rodavam o software afetado. Mas os maiores transtornos vieram de parceiros e outras empresas terceirizadas que também sofreram com as interrupções, como sistemas de Medicaid e Seguridade Social.

Reações e Aprendizados

Após dias de intenso trabalho, a maioria dos sistemas já foi restabelecida. Mas a situação evidenciou a fragilidade da dependência que as empresas têm de fornecedores de infraestrutura, como a CrowdStrike. “Tudo o que é preciso é um fornecedor de infraestrutura como a CrowdStrike”, ressalta o CISO. Isso levanta questionamentos sobre como o software de monitoramento é projetado e a interconexão dos sistemas digitais atuais.

Conclusão

O incidente envolvendo a CrowdStrike foi um teste de nível superior para os profissionais de TI, que tiveram que improvisar soluções manuais e coordenar equipes remotas para resolver o problema. Embora a situação tenha sido resolvida na maior parte, o episódio serviu como um alerta sobre a necessidade de investir em treinamento, redundância e resiliência dos sistemas, de modo a evitar que um único problema cause tamanha disrupção.

Leia mais: