블로그 | CTO 사무실

애플리케이션을 위한 다음 여정: 데이터의 바다에서 가치 추출

켄 아로라 썸네일
켄 아로라
2020년 3월 30일 게시


"데이터는 새로운 오일" 또는 "데이터는 디지털 경제의 윤활유입니다." 만약 여러분이 저와 비슷하다면, 이런 문구들을 들어봤을 것입니다. 심지어는 진부할 정도로 경영대학원에서 나오는 문구인 "데이터 소진으로 인한 수익화"라는 문구도 들어봤을 것입니다. 하지만 모든 클리셰와 마찬가지로 이 표현 역시 근본적인 진실에 기반을 두고 있으며, 이 경우처럼 상호 보완적인 두 가지 진실에 기반을 두고 있습니다. 첫 번째 진실은 일반적인 운영 과정에서 생성되는 데이터 부산물에는 잠재적 가치가 담겨 있다는 관찰입니다. 두 번째로 관련이 있지만 종종 언급되지 않는 진실은 그 잠재된 가치를 추출하는 집중적인 과정이 여러 단계로 구성된 여정이라는 점인데, 그 과정에서 자연스럽게 진행되고 성숙해지는 단계가 있기는 합니다.

한 걸음 물러서서 보면, 운영 데이터를 수집하여 비즈니스 가치를 창출한다는 개념은 결코 새로운 것이 아닙니다. 실제로, 식료품 및 배달 부문과 같이 물류 최적화에 의존하는 산업은 오랫동안 이 개념을 이해하고 수용해 왔습니다. 마찬가지로, " 디지털 혁신 "을 향한 현대 기업의 추세는 이 아이디어를 일반화한 것으로, 일반적으로 내부 비즈니스 프로세스와 워크플로에 먼저 적용됩니다. 주목할 점은 애플리케이션과 애플리케이션 서비스 분야에서도 유사한 진화가 있다는 것입니다. 이 글에서는 애플리케이션과 애플리케이션 서비스의 발전이 데이터 가치 추출이라는 더 큰 메가트렌드와 어떻게 상호 작용하고 조화를 이루는지에 대해 중점적으로 설명하고, 이러한 공생이 현재 어디에 있는지, 그리고 마지막으로 가까운 미래에 어디로 향하고 있는지에 대해 설명하고자 합니다.

1단계: 수집 및 보고 

이 여정은 데이터 수집부터 시작됩니다. 데이터는 시스템의 연료라고 생각하면 도움이 됩니다. 연료가 없으면 작업을 수행하는 엔진에 연료를 공급할 수 없습니다. 표면적으로 보면 애플리케이션 서비스 솔루션이 보안, 안정성, 성능 관리 및 오케스트레이션을 위해 다양한 이벤트와 통계를 제공한다는 점을 고려하면 이는 이미 이루어진 일처럼 보입니다. 하지만 데이터는 종종 구조화되지 않았고, 구문은 가변적이며, 의미론은 종종 임시방편입니다. 간단하지만 흔한 예를 생각해 보세요. 귀하의 데이터에서는 시간의 개념이 어떻게 표현됩니까? 일반적으로 타임스탬프와 같이 개념적으로 간단한 것도 표현하는 방법에는 여러 가지가 있습니다. 이는 사건과 통계를 설명하는 기본적인 "원자"를 공통적으로 표현하는 링과 프랑카가 필요하다는 것을 보여줍니다. 기술 용어로 이를 "데이터 수집"이라고 하며, 일관된 데이터 스키마를 기반으로 구축하고 필요에 따라 어댑터/변환기를 활용합니다. 이러한 요구는 역사적으로 SIEM 공급업체의 성장과 가치를 가능하게 한 주요 동인 중 하나였으며, 이들은 다양한 보안 지점 솔루션 전반에 걸쳐 보안에 대한 종합적인 관점을 제공하기 위해 표준화된 어휘를 제공해야 하는 요구 사항을 충족했습니다. 데이터를 통합적으로 표현하고 , 현재 무슨 일이 일어나고 있는지, 과거에 무슨 일이 일어났는지에 대한 체계적이고 전체적인 목격자 보고서를 출력하는 능력이 오늘날 대부분의 업계가 겪고 있는 여정의 단계입니다. 오늘날 애플리케이션 생태계에서 이는 주로 SIEM과 APM 시장 수직 부문에서 입증됩니다.

2단계: 증류하고 설명하다 

여정의 다음 단계는 목격자 보고를 이해하는 것입니다. 공통점을 찾고, 데이터를 설명 가능한 패턴으로 정리하고, 이상 징후를 식별하는 것입니다. 관련된 데이터의 양이 방대하기 때문에, 이 활동에서는 일반적으로 인간의 도움이나 컴퓨터의 보강이 필요합니다. 이러한 지원은 종종 인간이 안내하는 데이터 탐색 및 시각화를 보강한 고급, 종종 감독되지 않는 통계적 분류 기술을 사용하는 형태로 이루어질 수 있습니다. 

DoS 방지 도메인의 한 예는 들어오는 트래픽의 지리적 특성을 시각화하는 것입니다. 이는 종종 소수의 국가에서 발생하는 악성 트래픽을 식별하는 데 사용됩니다. 또 다른 예는 인간 행동과 봇 행동의 속성을 분석하는 사용자 행동 분석(UBA) 도구 분야입니다. 이러한 솔루션은 종종 통계 분석을 사용하여 웹 상호작용이 인간과 얼마나 관련이 있는지에 대한 확률을 지정합니다. 

이 여정의 단계인 " 추출 및 설명 "은 이전의 " 수집 및 보고 " 단계에서 진화한 것입니다. 기본적으로는 분석을 적용할 방대하고 구조화된 데이터 풀이 있는 데 여전히 의존합니다. 앞서 언급했듯이, 이러한 접근 방식은 애플리케이션 보안을 위한 최근의 (그러나 범위가 좁은) 포인트 솔루션의 기반이 됩니다.

3단계: 추론 및 예측

이 여정의 세 번째 단계는 " Distill & Describe "의 겸손한 분석을 넘어서 더욱 심층적인 분석적 추론을 통해 예상되는 미래 관찰에 대한 예측 과 전망으로 나아가는 것입니다. 이는 예상되는 미래의 행동에 대한 지능적인 외삽법을 실시하여 단순한 반응 이상의 솔루션을 제공합니다. 애플리케이션 인프라 계층의 한 예는 애플리케이션 성능 관리(APM) 공간에서 찾을 수 있습니다. 즉, 시간 기반 동작 패턴을 식별하고 이러한 패턴을 사용하여 향후 리소스 요구 사항을 예측하는 것입니다. 또 다른 예로, 애플리케이션 비즈니스 로직 사용 사례를 사용하면 여행 사이트에서 머신 러닝 ("ML") 기술을 사용하여 미래 날짜에 대한 특정 경로에 대한 공급과 수요를 예측할 수 있습니다. 여기에서 가장 자주 사용되는 기술은 고급 분석 기술로, 특히 시계열 및 선형 회귀 기술을 기반으로 하는 기술로, 이전 단계에서 발견된 데이터 패턴을 기반으로 합니다. 

4단계: 이유와 처방

네 번째이자 마지막 단계는 전체 시스템에 대한 실행 가능한 조정 및 시정 조치를 실행하기 위한 "루프 닫기"입니다. 이전 두 단계의 분석은 일련의 사전 예방적 권장 사항으로 변환됩니다. 이 시점에서 시스템은 공격과 환경 변화에 대응할 수 있는 적응력과 견고성을 갖추게 됩니다. 예를 들어, 이 기능을 활용하는 개념적 애플리케이션 인프라는 예측 수요에 따라 컨테이너 워크로드 인스턴스를 사전에 생성하거나 파괴할 수 있는 기능을 갖추고 있습니다. 또는 애플리케이션 보안의 맥락에서 이전에 학습된 봇넷 동작을 기반으로 봇넷에서 생성된 트래픽을 사전에 필터링할 수도 있습니다. 주목할 만한 예는 오늘날 비즈니스 로직 분야에서 이미 존재합니다. 다시 말해, 예상되는 공급과 수요에 기반한 동적 가격 책정의 형태입니다. 

기반 기술은 종종 규칙 기반이며, 규칙을 사용하여 예측을 실행으로 전환합니다. 그러나 애플리케이션 인프라와 애플리케이션 서비스의 맥락에서 이러한 접근 방식은 구성 및 오케스트레이션을 위한 의도 기반 또는 선언적 지침과 결합되는 경우가 많습니다.

여정을 가속화하다

"수집 및 보고"에서 "정제 및 설명", "추론 및 예측"을 거쳐 마지막으로 "추론 및 처방"으로 이어지는 이 여정은 자연스러운 진행입니다. 각각의 점진적인 발전은 이전 발전에 기반을 두고 더욱 새롭고 획기적인 수준의 가치를 창출합니다. 오늘날 애플리케이션 인프라 및 서비스 분야의 과제에 대한 솔루션 세트는 데이터 가치 추출 진행 과정에서 성숙도가 고르지 않으며 일반적으로 다양한 포인트 솔루션에 잘 통합되지 않았습니다. 

데이터 "엔진"의 "연료"라고 할 수 있는 선행 지원 단계는 다양한 애플리케이션 서비스에서 가시성을 확보하는 것입니다. 애플리케이션 제공 체인의 여러 지점에 배포되고 일관된 데이터 의미론과 연합 데이터 저장소의 원칙과 결합된 이러한 계측은 F5가 애플리케이션 서비스의 미래를 향한 여정을 가속화하는 방법 중 하나입니다. 우리는 더 나은 포인트 솔루션 통합을 허용하기 위해 데이터 퍼널을 확대하고 관련 기술 구성 요소의 고급 개발을 신속하게 진행함으로써 고객에게 가치를 제공하는 속도를 더욱 높이고자 합니다. 

향후 기사에서는 데이터 중심 아키텍처에 대해 더 자세히 설명하고, 핵심 기술을 심층적으로 살펴보고, 여러 주권 데이터 파이프라인에서 여러 데이터 생태계의 상호 작용을 살펴보는 등, 자세히 살펴보고자 합니다.