Una unidad de procesamiento de datos (DPU) es un procesador especializado diseñado para descargar y acelerar las tareas centradas en datos, liberando las unidades centrales de procesamiento (CPU) para procesar cargas de trabajo específicas de la aplicación. Diseñadas para procesar redes de alta velocidad, solicitudes de almacenamiento y procesamiento de seguridad, las DPU son adecuadas para centros de datos modernos de alta densidad y demandas de computación de alto rendimiento (HPC).
Las DPU y sus contrapartes, las unidades de procesamiento de infraestructura (IPU), responden a un requisito de descargar tareas comunes y de alto rendimiento de las CPU. La reducción de las tareas de cifrado, las operaciones de E/S de almacenamiento y el procesamiento de paquetes de redes de gran ancho de banda permite que las CPU aborden tareas de aplicação de mayor densidad que requieren las aplicações basadas en contenedores, la partición de hipervisor o nube y las tareas intensivas en computación de inteligencia artificial (IA).
Varias funciones clave incluyen:
Optimizar el rendimiento de la CPU para tareas específicas de aplicaciones en entornos HCI y HPC es cada vez más importante a medida que la densidad de cómputo y el uso de energía se convierten en nuevas métricas para los beneficios de costos de infraestructura. Los avances en la velocidad de las redes y la reducción de latencia, el rendimiento del almacenamiento y la necesidad de proporcionar recursos computacionales a más usuarios exigen aún más las tareas no específicas de la aplicación que deben realizar las CPU. Las medidas de éxito actualmente aceptadas, adoptadas de la industria HPC, se definen por la densidad y el rendimiento de la CPU.
Las relaciones de los puntos de datos de potencia de procesamiento incluyen, entre otras:
Estas mediciones, utilizadas desde hace tiempo por las HPC para medir el rendimiento de las supercomputadoras en el lanzamiento y a lo largo del tiempo, se están aplicando cada vez más a los centros de datos tradicionales a medida que la tecnología entre las dos industrias continúa convergiendo.
Las DPU proporcionan una manera de aumentar la disponibilidad de la CPU para aplicação y procesos de procesamiento intensivos, lo que puede generar cuellos de botella si se requiere que la CPU maneje tareas de nivel inferior que no son de procesamiento. Estas tareas se agravan cuando aumentan las densidades y las tareas de aplicação , por lo que las DPU proporcionan una forma de aliviar este cuello de botella. Al agregar DPU a la infraestructura del centro de datos, se liberan CPU para proporcionar un mejor rendimiento por núcleo. Como alternativa, los recursos computacionales se pueden particionar y almacenar para permitir que más usuarios accedan a los recursos del sistema.
Basándose en su éxito en el uso de tecnologías SmartNIC, ASIC y FPGA, F5 aprovecha el procesamiento y la ubicación del tráfico en línea de una DPU dentro de la infraestructura computacional para aumentar y mejorar la capacidad de carga de trabajo, el rendimiento y la seguridad de las infraestructuras HCI/HPC.
Al aprovechar las DPU NVIDIA Bluefield-3, F5 ofrece múltiples beneficios para los proveedores de servicios y las grandes empresas que buscan desarrollar recursos informáticos a gran escala y, al mismo tiempo, maximizar los recursos informáticos. Estos incluyen, entre otros:
Para obtener más información sobre las soluciones integradas de DPU y F5, haga clic en los recursos a la derecha.
1Las mediciones estándar para mediciones de HPC basadas en la ciencia tradicionalmente consistían en precisión de punto flotante de precisión simple o doble (FP32 y FP64). Las tendencias actuales de IA ahora miden el rendimiento a la mitad o menos (FP16). El uso de direcciones de memoria de menor precisión (tipos de datos de punto flotante y entero) permite un entrenamiento más rápido y un menor consumo de memoria de los modelos de lenguaje.