데이터 처리 장치(DPU)란 무엇인가요?

DPU(데이터 처리 장치)는 데이터 중심 작업의 부담을 덜고 가속화하도록 설계된 특수 프로세서로, 중앙 처리 장치(CPU)가 애플리케이션별 워크로드를 처리하는 데 집중할 수 있도록 해줍니다. 고속 네트워킹, 스토리지 요청, 보안 처리를 위해 설계된 DPU는 최신 고밀도 데이터 센터와 고성능 컴퓨팅(HPC) 요구 사항에 적합합니다.

DPU 심층 이해

DPU와 그에 대응하는 인프라 처리 장치(IPU)는 CPU에서 일반적이고 처리량이 많은 작업을 오프로드해야 하는 요구 사항에 부응합니다. 암호화 작업, 스토리지 I/O 작업, 고대역폭 네트워킹 패킷 처리를 줄이면 CPU가 컨테이너 기반 애플리케이션, 클라우드 또는 하이퍼바이저 파티셔닝, 인공 지능(AI) 컴퓨팅 집약적 작업에 필요한 더 높은 밀도의 애플리케이션 작업을 타겟으로 삼을 수 있습니다.

주요 기능은 다음과 같습니다.

  • 네트워킹: DPU는 스마트 네트워크 인터페이스 카드(SmartNIC)에서 제공하는 기능을 기반으로 거의 라인 속도에 가까운 속도로 대용량 패킷 흐름을 처리하여 VXLAN을 포함한 네트워크 오버레이 오프로드를 제공하고 방화벽 지원, TLS 오프로드, 부하 분산, 트래픽 라우팅과 같은 보안 및 애플리케이션 제공 컨트롤러 서비스를 제공합니다. 또한 DPU는 암호학적으로 안전한 의사난수 생성기(CSPRNG)에 엔트로피 소스를 제공할 수 있습니다.
  • 저장: DPU는 호스트와 스토리지 간 데이터 전송을 가속화하고, 패브릭(oF) 프로토콜을 통한 비휘발성 메모리 익스프레스(NVMe)와 같은 고급 스토리지 프로토콜을 지원하여 솔리드 스테이트 스토리지와 하이퍼컨버지드 인프라(HCI)에 필요한 속도를 높입니다. DPU는 암호화/복호화 지원, 압축, 중복 제거 처리도 제공하여 CPU 부하를 더욱 줄입니다.
  • 가상화: 하이퍼바이저와 컨테이너 기반 네트워킹 작업을 오프로드하면 HCI 인프라를 분할하고 테넌트하여 작업 밀도를 높일 수 있는 기능이 향상되어 인프라에 대한 ROI가 증가합니다.

DPU 사용의 이점

HCI 및 HPC 환경에서 애플리케이션별 작업에 맞춰 CPU 성능을 최적화하는 것은 컴퓨팅 밀도와 전력 사용량이 인프라 비용 이점을 측정하는 새로운 지표가 되면서 점점 더 중요해지고 있습니다. 네트워킹 속도와 지연 시간 감소, 스토리지 성능의 발전, 그리고 더 많은 사용자에게 컴퓨팅 리소스를 제공해야 하는 필요성은 CPU에 필요한 비애플리케이션 특정 작업에 더욱 부담을 줍니다. HPC 산업에서 채택한 현재 허용되는 성공 측정 기준은 CPU 밀도와 성능으로 정의됩니다.

처리 능력 데이터 포인트의 비율은 다음을 포함하되 이에 국한되지 않습니다.

  • CPU 코어 수(랙, 노드 또는 사용자가 사용할 수 있는 총 개수)
  • 초당 부동 소수점 연산(FLOPS)1
  • 전력 소비량(평균 및 최대 킬로와트로 측정)
  • 물리적 공간 측정(제곱피트 또는 미터로 측정)

오랫동안 HPC에서 슈퍼컴퓨터의 출시 시점과 시간 경과에 따른 성능을 측정하는 데 사용되어 온 이러한 측정 방식은 두 산업 간의 기술이 지속적으로 융합됨에 따라 기존 데이터 센터에도 점차 많이 적용되고 있습니다.

DPU는 애플리케이션과 컴퓨팅 집약적 파이프라인에 대한 CPU 가용성을 높이는 방법을 제공하는데, 이는 CPU가 하위 수준의 비컴퓨팅 작업을 처리해야 하는 경우 병목 현상이 발생할 수 있기 때문입니다. 밀도와 애플리케이션 작업이 증가하면 이러한 작업은 더욱 복잡해지므로 DPU는 이러한 병목 현상을 완화하는 방법을 제공합니다. 데이터 센터 인프라에 DPU를 추가하면 CPU가 코어당 더 나은 성능을 제공하는 데 집중할 수 있습니다. 또는 컴퓨팅 리소스를 분할하여 테넌트화하여 더 많은 사용자가 시스템 리소스에 액세스할 수 있도록 할 수 있습니다.

F5는 DPU와 어떻게 작동하나요?

F5는 SmartNIC, ASIC, FPGA 기술을 활용한 성공을 바탕으로 컴퓨팅 인프라 내에서 DPU의 처리 및 인라인 트래픽 위치를 활용하여 HCI/HPC 인프라의 작업 부하 용량, 성능 및 보안을 늘리고 개선합니다.

F5는 NVIDIA Bluefield-3 DPU를 활용하여 컴퓨팅 리소스를 극대화하는 동시에 대규모 컴퓨팅 리소스를 구축하려는 서비스 제공업체와 대기업에 여러 가지 이점을 제공합니다. 여기에는 다음이 포함되지만 이에 국한되지는 않습니다.

  • 간소화된 통합: F5는 네트워킹, 보안, 트래픽 관리, 부하 분산을 DPU 통합에 초점을 맞춘 통합 서비스 제품군으로 결합합니다. 이 솔루션은 HCI/HPC 인프라 전반에서 이러한 서비스에 대한 통합된 뷰를 제공하며, 컴퓨팅 집약적 워크로드를 최적화하는 데 필요한 관찰 가능성과 세부적인 제어 기능을 제공합니다.
  • 강화된 보안: F5는 방화벽, 분산 서비스 거부(DDoS) 완화, API 보호, 암호화, 인증서 관리 등의 중요한 보안 기능을 DPU에 오프로드하여 지원합니다.
  • 향상된 성능: F5는 네트워킹과 보안을 가속화하는데, 이는 클라우드 규모로 애플리케이션을 제공하는 데 필요한 고밀도 인프라의 요구 사항을 충족하는 데 중요합니다.
  • 다중 테넌시 지원: F5는 확장 가능한 멀티 테넌트 아키텍처를 지원하여 서비스 제공자가 동일한 인프라에서 다수의 테넌트를 안전하게 호스팅하는 동시에 작업 부하와 데이터를 분리하고 안전하게 유지할 수 있도록 합니다.

DPU 및 F5 통합 솔루션에 대한 자세한 내용을 보려면 오른쪽 리소스를 클릭하세요.


1과학 기반 HPC 측정을 위한 표준 측정은 전통적으로 단일 또는 이중 정밀도 부동 소수점 정밀도(FP32 및 FP64)로 구성되었습니다. 현재 AI 추세에서는 성능이 절반 이하로 측정됩니다(FP16). 더 작은 정밀도의 메모리 주소 지정(부동 소수점 및 정수 데이터 유형)을 사용하면 언어 모델의 학습 속도가 빨라지고 메모리 사용량이 줄어듭니다.