블로그 | CTO 사무실

클라우드 재송환과 SRE 운영 간의 흥미로운 연결

로리 맥비티 썸네일
로리 맥비티
2022년 7월 28일 게시

 

나는 철학을 좋아한다. 저는 학위를 받으려면 약 3과목이 모자라는데, 몇 년에 한 번씩 언젠가는 졸업할 거라고 스스로에게 말합니다. 저는 제 큰 아들에게도 이런 애정을 물려줬습니다. 아들은 컴퓨터 과학과 데이터 과학 학위를 받았고, 철학 학위도 받았습니다 . 네, 우리의 문자 대화는 종종 매우 흥미로웠습니다. 물어봐주셔서 감사합니다.

따라서 저는 통계학 및 논리학에서 사후 오류로 알려진 것에 대해 잘 알고 있습니다. 여기서 "상관관계는 인과관계가 아니다"라는 말이 유래했습니다. 이것은 사건 Y가 사건 X를 따랐다면 사건 Y는 사건 X에 의해 발생했다고 가정하는 논리적 오류입니다. 이 오류에 대한 가장 유명한 주장은 Bobby Henderson이 내놓은 것으로, 그는 상관관계에서 인과관계를 가정하는 것이 얼마나 어리석은지 보여주며, 그의 차트에서 지구 온난화가 세계의 해적 수 감소로 인해 발생했다고 보여주었습니다.

네, 말이 안 됩니다. 하지만 사람들이 인과관계를 도출하는 많은 차트도 말이 안 됩니다. 두 데이터 포인트가 서로 매핑되었다고 해서 하나가 다른 하나의 원인이라는 것을 의미하지는 않습니다. 많은 경우, 둘을 연관시키는 것조차 논리적으로 말이 되지 않습니다. 결국, 해적과 지구 온난화? 실제로 아무도 그것을 심각하게 받아들이지 않습니다. 

하지만 SRE 운영과 클라우드 재이전 간의 관계에 대한 질문을 깊이 파고들면서 언급해야 할 중요한 사항입니다.

분명히 말씀드리자면, 저는 SRE 관행을 도입하면 클라우드 재이전이 발생한다고 말하려는 것이 아닙니다. 하지만 저는 둘 사이에 가깝고 의미 있는 관계가 있다고 말하고 싶습니다. 클라우드 공급업체인 Google이 SRE를 관행으로 만들었다는 사실은 실수가 아닙니다. SRE와 관련된 모델, 사고방식, 기술 세트는 클라우드 인프라와 서비스를 성공적으로 운영하는 데 필수적입니다.

클라우드 재송환은 실제입니다

퍼블릭 클라우드 재송환 자체는 일부 계층에서는 다소 금기시되는 주제입니다. Andreessen Horowitz가 " 클라우드 비용, 조 달러의 역설 "을 출판하고 회사들이 클라우드에서 이전하여 상당한 비용 절감을 실현하고 있다고 제안했을 때 발생한 논란을 고려하십시오. 어떤 사람들은 그런 일이 일어나지 않는다고 믿겠지만, 그런 일이 일어났다는 것을 뒷받침하는 충분한 데이터와 일화적 증거가 있습니다.

2021년 보고서에서 우리는 시장에 퍼블릭 클라우드 환수에 대해 질문했습니다 . 단 13%만이 앱을 회수했고, 14%는 회수를 계획하고 있었습니다. 1년 후, 두 수치를 합친 비율은 각각 40%포인트 증가해 37%와 30%가 되었습니다 . 이는 특이한 일이 아니며, 유사한 결과를 보고하는 신뢰할 만한 분석 회사가 여럿 있습니다. 흥미로운 점은 귀국율이 전 세계적으로 동일한 것은 아니라는 점이다. APCJ와 LATAM은 EMEA와 NA에 비해 귀국 가능성이 훨씬 낮습니다.  

저는 기업들이 퍼블릭 클라우드에서 앱을 다시 가져오고 있다고 생각하는데, 문제는 '그렇게 하고 있는가?'가 아니라 '얼마나 많은 워크로드를 빼내고 있으며, 어디로 가고 있는가?'입니다. 이는 우리가 2023년 응용 전략 현황 연구를 완료하는 내년에 답하고자 하는 질문입니다.

현재 우리는 SRE 운영이라는 귀환을 가능하게 하는 가능성을 파헤쳐 왔습니다. 클라우드 비용 증가가 국내 이전 욕구의 원동력이라고 하더라도 다른 곳에서 효율적으로 운영할 기술이 없고 따라서 더 낮은 비용의 혜택을 누릴 수 없다면 왜 국내 이전을 해야 합니까?

그리고 우리는 SRE 운영 관행과 기술이 기업이 해당 워크로드를 다른 퍼블릭 클라우드, 온프레미스 또는 에지로 옮기든 결정을 정당화하는 데 필요한 효율성과 비용 절감을 다시 가져와 유지할 수 있도록 한다고 가정합니다.

데이터 파헤치기

표면적으로 보면 SRE 관행 도입 및 적용과 클라우드 환수 사이에는 강력한 상관관계가 있는데, 이는 클라우드와 유사한 방식으로 운영할 수 있는 조직, 즉 SRE 관행을 도입하고 효과적으로 장난감(앱)을 집어 들고 집으로(사내 또는 다른 곳에서) 돌아갈 수 있는 조직이 있다는 것을 나타냅니다 .

송환 sre

다시 말해, SRE 관행을 채택하지 않은 조직 중 퍼블릭 클라우드에서 앱을 다시 가져온 조직은 4%에 불과합니다. SRE 관행을 도입한 사람 중 무려 73%가 앱을 다시 국내로 이전했습니다.

물론 관행을 도입한다는 것은 반드시 관행을 적용한다는 것을 의미하지는 않습니다. 그래서 우리는 조직이 실제로 어떻게 애플리케이션, 시스템, 인프라를 운영하는지 살펴보았습니다. 구체적으로 우리는 SRE 관행을 사용하는 운영의 비율을 살펴보았습니다. 놀랍지 않게도 비슷한 결과가 나왔습니다.

클라우드 재송환

SRE 관행을 사용하여 앱, 시스템 및 인프라를 전혀 운영하지 않는 기업 중 81%는 귀환 하지 않습니다 . 반대로, 앱, 시스템 및 인프라 운영의 76%~99%에 SRE 관행을 사용하는 사람 중 54%는 다시 본국으로 복귀했습니다. 재귀환이 본격화되는 시점은 조직이 SRE 관행을 사용하여 앱, 시스템 및 인프라의 4분의 1(25%) 이상을 운영하는 시점입니다.

APCJ와 LATAM이 귀국할 가능성이 훨씬 낮았다는 걸 기억하시나요? 또한 앱, 시스템 및 인프라를 운영하는 데 SRE 관행을 활용할 가능성도 훨씬 낮습니다. 실제로 LATAM과 APCJ에서는 4분의 1(26%)이 넘는 지역(29%)이 SRE 방식을 사용하여 앱, 시스템 및 인프라를 전혀 운영하지 않았습니다. EMEA에서는요? 그건 단 5%에 불과해요. 북미에서는 2%로 더 낮습니다.

의미 있는 관계인가, 아니면 흥미로운 우연인가?

조직이 SRE를 운영 관행으로 받아들이는 것과 퍼블릭 클라우드 재이전 비율 사이에는 확실한 상관관계가 있는 것으로 보입니다. 하지만 이는 의미 있는 관계일까요, 아니면 그저 호기심을 돋우는 우연일까요?

제 블로그이기 때문에 이것이 의미 있는 관계라고 주장하고 싶습니다.

SRE와 관련된 관행과 기술 세트는 대규모로 클라우드 환경을 운영하는 데 전적으로 적합합니다. 앞서 말했듯이 SRE를 만들고 그에 대한 책을 쓴 곳이 바로 Google이라는 것은 우연이 아닙니다. 그리고 저는 이전에도 말씀드렸고(다시 말씀드리겠습니다) 클라우드의 가치는 운영 모델에 있습니다. 이를 통해 HTTP 교환이나 고객 세션으로 측정하든 거래당 비용을 획기적으로 낮출 수 있습니다. 이를 통해 비용 효율적인 애플리케이션 및 디지털 서비스 확장이 가능해집니다.

자동화와 중단 없는 사건보다는 의미 있는 사건에 집중하는 관행을 활용하면 높은 수준의 가용성과 성능을 유지하는 업무를 담당하는 사람(따라서 전문 지식)의 비용 효율적인 규모를 제공합니다.

SRE 관행을 채택하고 활용하면 조직은 퍼블릭 클라우드, 온프레미스 또는 에지에서든 운영을 효율적으로 확장 할 수 있습니다 . 그리고 데이터를 살펴보면 기업들이 그 역량을 바로 그러한 목적으로 사용하는 것으로 보입니다.

디지털 비즈니스에 필요한 아키텍처를 현대화하고 SRE 운영을 도입하는 방법에 대해 자세히 알아보려면 O'Reilly에서 출간한 새로운 책인 Enterprise Architecture for Digital Business를 읽어보세요.