BLOG

Resiliência Global: Protegendo a infraestrutura crítica em meio a interrupções na nuvem

Miniatura de Chin Keng Lim
Chin Keng Lim
Publicado em 16 de outubro de 2024

As recentes interrupções globais causadas pela CrowdStrike criaram um alerta para muitas organizações. Os conselhos das empresas estão perguntando aos CIOs como eles podem mitigar a próxima interrupção global, que pode causar interrupções em seus aplicativos de missão crítica (sem culpa deles). Governos em todo o mundo também estão questionando como evitar danos colaterais dessa interrupção global em serviços públicos essenciais, especialmente em infraestrutura de informação crítica (CII), como bancos, transporte e assistência médica.

De acordo com um relatório recente da Gartner sobre a construção de resiliência digital, a grande maioria das organizações (88%) tem uma estratégia de resiliência digital definida. No entanto, interrupções globais de provedores de serviços de nuvem (CSPs) e provedores de segurança de Software como Serviço (SaaS) continuam a impactar colateralmente as organizações. Isso demonstra que a estratégia de resiliência digital implementada hoje na maioria das organizações pode não ter considerado pontos únicos de falha de CSPs e provedores de segurança SaaS.

O tempo de inatividade não planejado do aplicativo não é apenas uma violação de conformidade; ele pode levar à insatisfação que pode fazer com que seus clientes corram para os concorrentes. Isso significa que o tempo de inatividade pode levar a perdas em vários níveis, mas trabalhar na proteção de sua infraestrutura e aplicativos também pode levar a uma melhor conformidade, uma experiência mais satisfatória para o cliente e, ao mesmo tempo, ajudar a reduzir os custos de infraestrutura.

É fundamental entender o custo total das operações locais em comparação com aquelas na nuvem. A nuvem pode ser econômica devido à sua elasticidade, acomodando picos de uso e reduzindo custos com seu modelo de pagamento conforme o uso. Se uma implantação de aplicativo de missão crítica adotar um padrão de design de nuvem híbrida ativa-ativa e o ciclo de vida do hardware existente for considerado no cálculo, você verá uma economia de custos substancial — até 75% para cargas de trabalho de inteligência artificial (IA), de acordo com a pesquisa da Dell .

O que é resiliência global?

Resiliência global se refere à capacidade das organizações de resistir, se adaptar e se recuperar de falhas de infraestrutura global e ataques cibernéticos. Envolve o desenvolvimento de estratégias, capacidades e infraestrutura para prevenir, detectar, responder e se recuperar de interrupções globais.

Um aspecto fundamental da resiliência global é manter uma infraestrutura robusta, onde os sistemas e redes de TI sejam flexíveis, escaláveis e capazes de lidar com cargas ou falhas inesperadas. Isso é alcançado aproveitando ambientes multicloud e maximizando o valor oferecido pela nuvem.

Igualmente importante é manter a mais alta eficácia em segurança cibernética. Medidas de segurança fortes devem ser implementadas para proteger contra ameaças cibernéticas e, ao mesmo tempo, garantir a integridade e a disponibilidade dos dados, sem introduzir pontos únicos de falha. É fundamental reconhecer que muitas soluções SaaS de segurança cibernética baseadas em nuvem são pontos únicos de falha em termos de arquitetura, o que significa que quando elas caem, seus clientes sofrem impactos colaterais.

Processos adaptáveis também são essenciais para a resiliência global. As empresas precisam desenvolver fluxos de trabalho operacionais flexíveis que possam se ajustar rapidamente a mudanças no ambiente, nas condições de mercado ou na tecnologia. Isso garante a capacidade de se adaptar rapidamente diante de novos desafios.

O que as empresas podem fazer para serem mais resilientes globalmente?

As empresas precisam se concentrar em três ações principais ao arquitetar aplicativos globalmente resilientes.

  1. Categorize os aplicativos em quatro níveis
    Comece identificando e categorizando seus aplicativos nas seguintes camadas:

    • Aplicações de missão crítica: Exigem resiliência global, garantindo que estejam sempre operacionais, não importa as circunstâncias.
    • Aplicações críticas para os negócios: A resiliência global é opcional, mas recomendada para reduzir interrupções.
    • Aplicações operacionais de negócios: Mantenha operações regulares, mas não exija resiliência global.
    • Aplicações administrativas: Aplicativos não essenciais que dão suporte a funções comerciais, mas não são essenciais para a continuidade imediata.
  2. Mapear padrões de design de resiliência global para cada camada de aplicação
    Dependendo do nível, as empresas podem implementar diferentes padrões de resiliência:

    • Implantação distribuída:
      • Híbrido em camadas: Os aplicativos front-end são implantados na nuvem, enquanto os sistemas back-end existentes permanecem no local.
      • Híbrido particionado: Combina nuvem pública e local em uma implantação ativa-ativa, fornecendo resiliência contra falhas em sites únicos e otimizando custos.
      • Análise híbrida: Separa as tarefas de processamento de transações on-line (OLTP) e processamento analítico on-line (OLAP), permitindo que a nuvem pública lide com análises complexas enquanto mantém as principais operações no local.
      • Híbrido de ponta: Gerencia localmente cargas de trabalho críticas aos negócios e com prazos apertados (por exemplo, inferência de IA na borda da rede) enquanto usa a nuvem/no local para outras tarefas.
         
    • Implantação redundante:
      • Padrão redundante: Distribui cargas de trabalho entre diferentes nuvens ou ambientes com base nas necessidades de produção e desenvolvimento.
      • Padrão híbrido de continuidade de negócios: Utiliza failover de nuvem pública para sistemas de espera fria econômicos.
      • Padrão de explosão de nuvens: Lida com cargas de trabalho básicas de forma privada e envia para a nuvem para obter capacidade extra quando necessário.
  3. Adapte arquiteturas de referência de resiliência global a cada nível
    As empresas devem estabelecer uma arquitetura de referência com base nessas camadas de aplicativos. Isso serve como um guia estratégico para implantar cargas de trabalho novas e existentes, reduzindo o tempo de geração de valor e alinhando as necessidades de resiliência técnica e comercial. Para aplicações de missão crítica , um padrão de design "híbrido particionado" é essencial. Isso significa implantar o mesmo frontend em ambientes locais e na nuvem para garantir resiliência contra falhas em sites únicos. Ao seguir essas etapas, as empresas podem não apenas proteger suas operações, mas também obter a flexibilidade necessária para prosperar em um ambiente global baseado na nuvem.
A resiliência global pode ser aprimorada adaptando arquiteturas de referência de resiliência para cada nível.
A resiliência global pode ser aprimorada adaptando arquiteturas de referência de resiliência para cada nível.

Existem estruturas sobre resiliência global?

Existem diversas estruturas e modelos de resiliência digital que as organizações podem adotar para melhorar sua capacidade de resposta e recuperação de interrupções. Algumas das estruturas notáveis incluem:

  • Estrutura de segurança cibernética do Instituto Nacional de Padrões e Tecnologia (NIST)
  • Organização Internacional para Padronização (ISO)/Comissão Eletrotécnica Internacional (IEC) 27001
  • Objetivos de controle para tecnologias de informação e relacionadas (COBIT)
  • Biblioteca de Infraestrutura de Tecnologia da Informação (ITIL)
  • Estrutura de Gestão de Continuidade de Negócios (BCM)
  • Lei de Resiliência Operacional Digital (DORA)
  • Integração do Modelo de Maturidade de Capacidade (CMMI)

Ao adotar essas estruturas, as organizações podem criar uma abordagem estruturada para aumentar sua resiliência digital e se preparar melhor para possíveis interrupções.

Estratégias-chave para resiliência global

Garantir resiliência global requer alta disponibilidade, escalabilidade e segurança robusta para aplicativos. As organizações podem conseguir isso aproveitando tecnologias-chave que aumentam tanto o desempenho quanto a proteção.

ADCs: O controlador de entrega de aplicativos (ADC) BIG-IP da F5, o F5 NGINX ADC e o Application Delivery Controller as a Service (ADCaaS) distribuído na nuvem podem otimizar a distribuição de tráfego e dimensionar aplicativos em data centers, nuvens e ambientes híbridos para garantir disponibilidade e desempenho.

Segurança cibernética: Ferramentas como firewalls de aplicativos da web (WAFs), segurança de interface de programação de aplicativos (API) e proteção contra negação de serviço (DoS) protegem aplicativos contra ameaças cibernéticas, garantindo a continuidade mesmo durante ataques.

Implantações em nuvem e híbridas: Redes multicloud e configurações híbridas melhoram a flexibilidade, permitindo uma resposta rápida a interrupções.

Automação e orquestração: Automatizar a entrega e a segurança de aplicativos reduz erros e diminui os tempos de resposta, o que aumenta a resiliência.

Visibilidade e análise: O monitoramento e a análise em tempo real permitem respostas proativas a problemas de desempenho e ameaças à segurança.

Ao implementar essas tecnologias, as organizações podem garantir que seus aplicativos permaneçam disponíveis, escaláveis e seguros em um ambiente digital em constante mudança.

Construindo uma estratégia de resiliência global abrangente

No mundo interconectado de hoje, criar resiliência global é crucial para manter a integridade dos aplicativos. Ao se concentrar em áreas-chave como entrega de aplicativos, segurança cibernética robusta e estratégias de nuvem adaptáveis, as organizações podem proteger melhor seus serviços contra interrupções e dimensionar para atender às demandas em evolução. Implementar a automação e obter visibilidade em tempo real do desempenho do sistema pode fortalecer ainda mais os esforços de resiliência. Com uma abordagem abrangente e bem pensada, as empresas podem garantir que seus aplicativos permaneçam confiáveis, seguros e prontos para enfrentar os desafios do futuro.

Converse conosco na GovWare em Cingapura de 15 a 17 de outubro no Sands Expo Convention Center, estande P06, onde compartilharemos insights sobre como você pode criar e fortalecer a resiliência cibernética e de nuvem, além de proteger, entregar e otimizar aplicativos em qualquer lugar.