BLOG | OFICINA DEL CTO

Cálculo restringido: El caso de la optimización del hardware en el borde

Miniatura de Lori MacVittie
Lori MacVittie
Publicado el 20 de septiembre de 2021


Hay una escena en la película Apolo 13 en la que se resalta la importancia de la energía para el funcionamiento de los equipos. La energía necesaria para operar y posteriormente reiniciar la nave es fundamental para el (alerta de spoiler) éxito final del regreso de los astronautas a la Tierra.

El poder lo es todo
Ed Harris, interpretando a Gene Kranz, ilustra que el poder lo es todo en la película Apolo 13.

La realidad que muchos de nosotros ignoramos, hasta que nos quedamos sin electricidad debido a una tormenta u otro evento externo, es que cada aplicação que ejecutamos consume energía. Nuestra dependencia actual de las aplicações para operar nuestras luces, cerrar nuestras puertas y hacer funcionar nuestros automóviles significa que la energía se calcula tanto en forma de consumo eléctrico como de ciclos de CPU.

Podemos bromear sobre lo lento que funciona nuestro navegador hoy y admitir tímidamente que puede ser porque tenemos treinta o más pestañas abiertas, pero la verdad es que el poder de procesamiento no es ilimitado. En cualquier entorno restringido, como el edge, hay incluso menos potencia informática para ejecutar la automatización, el procesamiento de datos y las comunicaciones de las que dependemos prácticamente todos los días para trabajar, vivir y divertirnos.

Aunque hemos ampliado los límites de la ingeniería de lo posible, los gritos del fin de la Ley de Moore continúan recordándonos que solo podemos meter una cierta cantidad de transistores en una pulgada cuadrada. Hay un límite en la cantidad de componentes que podemos instalar en un teléfono, y un límite en la cantidad de potencia computacional que podemos esperar de un rack de servidores instalado en una torre de telefonía celular.

Por lo tanto, el borde (compuesto por todos los dispositivos, puntos finales y nodos de cómputo restringidos) necesita una forma de aumentar su potencia computacional disponible sin un aumento complementario en tamaño y espacio. Esta necesidad está detrás del renacimiento de la infraestructura , un movimiento que pasa desapercibido para la mayoría de las personas y que se centra en aprovechar el poder de procesamiento especializado (optimizado) para aumentar de manera efectiva la capacidad general de estos entornos restringidos.

La evolución de la computación optimizada por hardware

El camino evolutivo para la computación optimizada por hardware comenzó hace mucho tiempo con “tarjetas” de aceleración especializadas orientadas a la criptografía y eventualmente produjo la GPU (unidad de procesamiento gráfico) y ahora la DPU (unidad de procesamiento de datos).

Cada evolución extrajo tareas de procesamiento específicas que quedaron codificadas, literalmente, en el silicio para producir exponencialmente más capacidad para procesar datos de manera más rápida y eficiente. Esta es la base de las tarjetas de aceleración criptográfica de mediados de la década de 2000 que eventualmente incentivaron la adopción de SSL Everywhere al mejorar drásticamente el rendimiento del procesamiento de cifrado y descifrado (criptográfico). Se produjeron avances similares en mercados adyacentes, centrados en mejorar la velocidad de procesamiento del almacenamiento. El TOE (motor de descarga TCP) es “un dispositivo de red que implementa protocolos TCP/IP en una tarjeta de hardware. La interfaz TOE también le proporciona a Data ONTAP una interfaz con la infraestructura de 1 o 10 GbE. La tarjeta TOE PCIe 10-GbE es totalmente compatible con aplicações NFS, CIFS y iSCSI TCP en Data ONTAP.     

Básicamente, cada vez que hemos necesitado mejorar la capacidad en entornos restringidos, ya sea que la restricción fuera económica o física, hemos visto la introducción de componentes de hardware optimizados.

La DPU, actualmente la favorita del momento gracias a NVIDIA y al creciente interés en aplicações relacionadas con IA y ML, es la manifestación actual de nuestros esfuerzos por superar las limitaciones físicas en el cómputo.

El papel de la DPU en el borde

Los entornos como el edge necesitan el aumento de potencia que brinda la computación optimizada por hardware. Ya sea para su uso en fabricación, donde IIoT (Internet industrial de las cosas) requiere procesamiento de datos en tiempo real con una latencia extremadamente baja (menos de 20 ms), o en atención médica, donde la velocidad de procesamiento de los datos de salud puede significar la diferencia entre la vida y la muerte, la computación optimizada por hardware es un requisito.

Esto significa que cualquier plataforma centrada en aplicaciones que busque permitir que las organizaciones aprovechen el edge debe incluir la computación optimizada por hardware como una capacidad clave.

La DPU representa una democratización del poder computacional optimizado. Combinado con la pila de software adecuada y habilitado por la plataforma correcta , el edge podrá ofrecer las mismas eficiencias y beneficios a la empresa que actualmente disfrutan los grandes proveedores a hiperescala.

Es por eso que seguimos trabajando con socios como NVIDIA . Si bien el software lo devora todo, incluido el edge, sigue siendo el hardware el que lo impulsa todo. Y esa potencia se puede aumentar sin necesidad de más espacio aprovechando la optimización del hardware.