블로그

글로벌 회복력: 클라우드 중단 중 중요 인프라 보호

Chin Keng Lim 썸네일
친켄림
2024년 10월 16일 게시

최근 CrowdStrike로 인해 발생한 글로벌 서비스 중단은 많은 조직에 경각심을 불러일으켰습니다. 회사 이사회는 CIO에게 다음의 글로벌 정전이 발생하여 회사의 임무 수행에 필수적인 애플리케이션이 중단될 수 있는 경우(자신의 잘못이 아님에도 불구하고) 어떻게 완화할 수 있는지 묻고 있습니다. 전 세계 정부는 이러한 세계적 혼란으로 인해 필수적인 공공 서비스, 특히 은행, 운송, 의료와 같은 중요 정보 인프라(CII)에 부수적 피해가 발생하는 것을 방지하는 방법에 대해 고민하고 있습니다.

최근 Gartner가 발표한 디지털 회복력 구축에 대한 보고서 에 따르면, 대다수의 조직(88%)이 정의된 디지털 회복력 전략을 갖추고 있는 것으로 나타났습니다. 그러나 클라우드 서비스 공급업체(CSP)와 SaaS(Software as a Service) 보안 공급업체의 글로벌 중단은 계속해서 기업에 부수적인 영향을 미치고 있습니다. 이는 현재 대부분 조직에서 시행 중인 디지털 회복성 전략이 CSP와 SaaS 보안 제공업체의 단일 실패 지점을 고려하지 않았음을 보여줍니다.

계획되지 않은 애플리케이션 다운타임은 규정 위반일 뿐만 아니라 고객이 경쟁사로 옮겨갈 수 있는 불만으로 이어질 수도 있습니다. 즉, 가동 중지로 인해 여러 측면에서 손실이 발생할 수 있지만 인프라와 애플리케이션을 보호하기 위해 노력하면 규정 준수를 강화하고 고객 경험 만족도를 높일 수 있으며 동시에 인프라 비용을 절감하는 데도 도움이 됩니다.

온프레미스 운영의 총 비용과 클라우드 운영의 총 비용을 비교하는 것이 중요합니다. 클라우드는 탄력성 덕분에 비용 효율성이 높고, 사용량 급증에 대응하고, 사용량에 따라 요금을 지불하는 모델로 비용을 절감할 수 있습니다. Dell 조사에 따르면 미션 크리티컬 애플리케이션 배포에 액티브-액티브 하이브리드 클라우드 디자인 패턴을 채택하고 기존 하드웨어의 수명 주기를 계산에 반영하면 상당한 비용 절감 효과가 나타납니다. 인공 지능(AI) 워크로드의 경우 최대 75%까지 절감 효과가 나타 납니다.

글로벌 회복력이란 무엇인가?

글로벌 회복성은 기업이 글로벌 인프라 장애 및 사이버 공격을 견뎌내고 적응하고 복구할 수 있는 능력을 말합니다. 여기에는 전 세계적인 정전을 예방하고 감지하며 대응하고 복구하기 위한 전략, 역량 및 인프라를 개발하는 것이 포함됩니다.

글로벌 회복력의 핵심 측면은 예상치 못한 부하나 장애를 처리할 수 있는 유연하고 확장 가능한 IT 시스템과 네트워크를 갖춘 강력한 인프라를 유지하는 것입니다. 이는 멀티클라우드 환경을 활용하고 클라우드가 제공하는 가치를 극대화함으로써 달성됩니다.

사이버보안에서 최고의 효율성을 유지하는 것도 마찬가지로 중요합니다. 단일 장애 지점이 발생하지 않으면서도 데이터 무결성과 가용성을 보장하는 동시에 사이버 위협으로부터 보호하려면 강력한 보안 조치를 구현해야 합니다. 많은 클라우드 기반 사이버 보안 SaaS 솔루션이 구조적으로 단일 장애 지점이라는 점을 인식하는 것이 중요합니다. 즉, 솔루션이 다운되면 고객이 부수적인 영향을 받게 됩니다.

글로벌 회복력을 위해서는 적응 가능한 프로세스도 필수적입니다. 기업은 환경, 시장 상황 또는 기술의 변화에 신속하게 적응할 수 있는 유연한 운영 워크플로를 개발해야 합니다. 이를 통해 새로운 도전에 직면했을 때 신속하게 방향을 전환할 수 있는 능력이 보장됩니다.

기업은 글로벌 회복력을 높이기 위해 무엇을 할 수 있습니까?

기업은 전 세계적으로 복원력이 뛰어난 애플리케이션을 구축할 때 세 가지 핵심 작업에 집중해야 합니다.

  1. 애플리케이션을 4가지 계층으로 분류합니다.
    먼저, 다음 계층으로 애플리케이션을 식별하고 분류하세요.

    • 임무 수행에 중요한 애플리케이션: 어떤 상황에서도 항상 운영이 가능하도록 글로벌 회복력이 필요합니다.
    • 비즈니스에 중요한 애플리케이션: 글로벌 복원력은 선택 사항이지만 중단을 줄이기 위해 권장됩니다.
    • 비즈니스 운영 애플리케이션: 정기적인 운영을 유지하지만 글로벌 회복력은 필요하지 않습니다.
    • 관리용 애플리케이션: 즉각적인 연속성에 필수적이지 않지만 비즈니스 기능을 지원하는 비필수 애플리케이션입니다.
  2. 각 애플리케이션 계층에 글로벌 복원력 설계 패턴을 매핑합니다.
    계층에 따라 기업은 다양한 복원력 패턴을 구현할 수 있습니다.

    • 분산 배포:
      • 계층형 하이브리드: 프런트엔드 애플리케이션은 클라우드에 배포되는 반면, 기존 백엔드 시스템은 온프레미스에 유지됩니다.
      • 분할된 하이브리드: 퍼블릭 클라우드와 온프레미스를 활성-활성 배포로 결합하여 단일 사이트 장애에 대한 회복성을 제공하고 비용을 최적화합니다.
      • 분석 하이브리드: OLTP(온라인 거래 처리)와 OLAP(온라인 분석 처리) 작업을 분리하여 퍼블릭 클라우드에서 복잡한 분석을 처리하는 동시에 핵심 운영을 온프레미스에서 유지할 수 있습니다.
      • 에지 하이브리드: 다른 작업에는 클라우드/온프레미스를 활용하면서, 시간에 민감하고 비즈니스에 중요한 워크로드(예: 네트워크 엣지에서의 AI 추론)는 로컬에서 관리합니다.
         
    • 중복 배포:
      • 중복 패턴: 프로덕션 및 개발 요구 사항에 따라 다양한 클라우드나 환경에 작업 부하를 분산합니다.
      • 비즈니스 연속성 하이브리드 패턴: 비용 효율적인 콜드 스탠바이 시스템을 위해 퍼블릭 클라우드 장애 조치를 활용합니다.
      • 구름 터지는 패턴: 기본 작업 부하를 비공개로 처리하고 필요 시 추가 용량을 위해 클라우드로 버스트합니다.
  3. 각 계층에 맞게 글로벌 복원력 참조 아키텍처를 맞춤화합니다.
    기업은 이러한 애플리케이션 계층을 기반으로 참조 아키텍처를 구축해야 합니다. 이는 기존 및 새로운 워크로드를 배포하고, 가치 실현 시간을 단축하고, 기술 및 비즈니스 복원력 요구 사항을 조정하기 위한 전략적 가이드 역할을 합니다. 임무 수행에 중요한 애플리케이션 의 경우 "분할 하이브리드" 디자인 패턴이 필수적입니다. 즉, 단일 사이트 장애에 대한 복원력을 보장하기 위해 온프레미스와 클라우드 환경 모두에 동일한 프런트엔드를 배포하는 것을 의미합니다. 이러한 단계를 따르면 기업은 운영을 보호할 수 있을 뿐만 아니라 글로벌 클라우드 중심 환경에서 성공하는 데 필요한 유연성도 얻을 수 있습니다.
각 계층에 맞게 복원력 참조 아키텍처를 조정하면 글로벌 복원력을 강화할 수 있습니다.
각 계층에 맞게 복원력 참조 아키텍처를 조정하면 글로벌 복원력을 강화할 수 있습니다.

글로벌 회복력에 대한 프레임워크가 있나요?

조직이 혼란에 대응하고 복구하는 능력을 강화하기 위해 도입할 수 있는 디지털 회복성을 위한 여러 프레임워크와 모델이 있습니다. 주목할 만한 프레임워크는 다음과 같습니다.

  • 미국 국립표준기술원(NIST) 사이버보안 프레임워크
  • 국제 표준화 기구(ISO)/국제 전기 기술 위원회(IEC) 27001
  • 정보 및 관련 기술에 대한 제어 목표(COBIT)
  • 정보기술 인프라 라이브러리(ITIL)
  • 비즈니스 연속성 관리(BCM) 프레임워크
  • 디지털 운영 회복력 법(DORA)
  • 역량 성숙도 모델 통합(CMMI)

이러한 프레임워크를 채택함으로써 조직은 디지털 회복력을 강화하고 잠재적인 중단에 더 잘 대비할 수 있는 체계적인 접근 방식을 만들 수 있습니다.

글로벌 회복력을 위한 핵심 전략

글로벌 복원력을 보장하려면 애플리케이션의 높은 가용성, 확장성 및 강력한 보안이 필요합니다. 조직은 성능과 보호 기능을 모두 강화하는 핵심 기술을 활용하여 이를 달성할 수 있습니다.

ADC: F5의 BIG-IP 앱 전송 컨트롤러(ADC), F5 NGINX ADC 및 분산형 클라우드 애플리케이션 전송 컨트롤러(ADCaaS)는 데이터 센터, 클라우드 및 하이브리드 환경에서 트래픽 분산을 최적화하고 애플리케이션을 확장하여 가용성과 성능을 보장할 수 있습니다.

사이버 보안: 웹 애플리케이션 방화벽(WAF), 애플리케이션 프로그래밍 인터페이스(API) 보안, 서비스 거부(DoS) 보호와 같은 도구는 사이버 위협으로부터 애플리케이션을 보호하고 공격 중에도 연속성을 보장합니다.

클라우드 및 하이브리드 배포: 멀티클라우드 네트워킹과 하이브리드 설정은 유연성을 향상시켜 중단 발생 시 신속하게 대응할 수 있습니다.

자동화 및 오케스트레이션: 애플리케이션 전달 및 보안을 자동화하면 오류가 줄어들고 응답 시간이 단축되어 복원력이 향상됩니다.

가시성 및 분석: 실시간 모니터링과 분석을 통해 성능 문제와 보안 위협에 사전에 대응할 수 있습니다.

이러한 기술을 구현함으로써 조직은 끊임없이 변화하는 디지털 환경에서도 애플리케이션의 가용성, 확장성, 보안을 유지할 수 있습니다.

포괄적인 글로벌 회복력 전략 구축

오늘날 상호 연결된 세상에서 애플리케이션의 무결성을 유지하려면 글로벌 복원력을 구축하는 것이 매우 중요합니다. 애플리케이션 제공, 견고한 사이버보안, 적응형 클라우드 전략과 같은 핵심 분야에 집중함으로써 조직은 서비스를 중단으로부터 더 잘 보호하고 변화하는 요구 사항에 맞춰 확장할 수 있습니다. 자동화를 구현하고 시스템 성능에 대한 실시간 가시성을 확보하면 복원력 강화 노력을 더욱 강화할 수 있습니다. 포괄적이고 잘 고안된 접근 방식을 통해 기업은 자사 애플리케이션의 신뢰성과 보안을 보장하고 미래의 도전에 대처할 준비가 되어 있는지 확인할 수 있습니다.

10월 15일부터 17일까지 싱가포르의 샌즈 엑스포 컨벤션 센터 P06 부스에서 열리는 GovWare 에서 저희와 이야기를 나눠보세요. 사이버 및 클라우드 복원력을 구축하고 강화하고, 어디서나 앱을 보호하고 제공하고 최적화하는 방법에 대한 통찰력을 공유해드리겠습니다.