BLOG | ESCRITÓRIO DO DIRETOR DE TECNOLOGIA

Cálculo restrito: O caso da otimização de hardware na borda

Miniatura de Lori MacVittie
Lori MacVittie
Publicado em 20 de setembro de 2021


Há uma cena no filme Apollo 13 em que a importância da energia para a operação de equipamentos é enfatizada. A energia necessária para operar e posteriormente reiniciar a nave é essencial para o (alerta de spoiler) sucesso eventual do retorno dos astronautas à Terra.

O poder é tudo
Ed Harris, interpretando Gene Kranz, ilustra que o poder é tudo no filme Apollo 13.

A realidade que muitos de nós ignoramos — até ficarmos sem energia devido a uma tempestade ou outro evento externo — é que todos os aplicativos que executamos consomem energia. Nossa dependência atual de aplicativos para operar nossas luzes, trancar nossas portas e dirigir nossos carros significa que a energia é calculada tanto na forma de consumo elétrico quanto de ciclos de CPU.

Podemos brincar sobre o quão lento nosso navegador está hoje e admitir timidamente que isso pode ser porque temos trinta ou mais abas abertas, mas a verdade é que o poder de computação não é ilimitado. Em qualquer ambiente restrito — como o edge — há ainda menos poder de computação para executar a automação, o processamento de dados e as comunicações dos quais dependemos virtualmente todos os dias para o trabalho, a vida e a diversão.

Embora tenhamos expandido os limites da engenharia do que é possível, os gritos do fim da Lei de Moore continuam a nos lembrar que há apenas um número limitado de transistores que podemos espremer em uma polegada quadrada. Há apenas um número limitado de componentes que podemos forçar em um telefone, e há apenas um número limitado de poder de computação que podemos esperar de um rack de servidores instalado em uma torre de celular.

Portanto, a borda — composta por todos os dispositivos, pontos de extremidade e nós de computação restritos — precisa de uma maneira de aumentar seu poder de computação disponível sem um aumento complementar em tamanho e espaço. Essa necessidade está por trás do renascimento da infraestrutura ; um movimento que passa despercebido pela maioria das pessoas e que se concentra em alavancar o poder de computação especializado (otimizado) para aumentar efetivamente a capacidade geral desses ambientes restritos.

A evolução da computação otimizada por hardware

O caminho evolutivo para computação otimizada por hardware começou há muito tempo com “placas” de aceleração especializadas visando criptografia e, eventualmente, produziu a GPU (unidade de processamento gráfico) e agora a DPU (unidade de processamento de dados).

Cada evolução extraiu tarefas de processamento específicas que se tornam codificadas, literalmente, em silício para produzir exponencialmente mais capacidade de processar dados de forma mais rápida e eficiente. Essa é a base para os cartões de aceleração criptográfica de meados dos anos 2000, que eventualmente incentivaram a adoção do SSL Everywhere, melhorando drasticamente o desempenho do processamento de criptografia e descriptografia (criptográfica). Avanços semelhantes ocorreram em mercados adjacentes, com foco na melhoria das velocidades de processamento de armazenamento. O TOE (TCP offload engine) é “um dispositivo de rede que implementa protocolos TCP/IP em uma placa de hardware. A interface TOE também fornece ao Data ONTAP uma interface para a infraestrutura de 1 ou 10 GbE. A placa PCIe TOE de 10 GbE oferece suporte total aos aplicativos NFS, CIFS e iSCSI TCP no Data ONTAP.”     

Basicamente, toda vez que precisamos melhorar a capacidade em ambientes restritos – seja essa restrição econômica ou física – vimos a introdução de componentes de hardware otimizados.

A DPU, atualmente a queridinha do momento graças à NVIDIA e ao crescente interesse em aplicações relacionadas a IA e ML, é a manifestação atual de nossos esforços para superar restrições físicas na computação.

O papel da DPU na ponta

Ambientes como o edge precisam do aumento de potência que vem da computação otimizada por hardware. Seja para uso na fabricação, onde a IIoT (Internet Industrial das Coisas) requer processamento de dados em tempo real com latência extremamente baixa (menos de 20 ms), ou na área da saúde, onde a velocidade de processamento de dados de saúde pode significar a diferença entre a vida e a morte, a computação otimizada por hardware é um requisito.

Isso significa que qualquer plataforma centrada em aplicativos que busque permitir que as organizações aproveitem a vantagem da borda deve incluir computação otimizada por hardware como um recurso essencial.

A DPU representa uma democratização do poder computacional otimizado. Combinado com o pacote de software certo e habilitado pela plataforma certa , o edge poderá oferecer as mesmas eficiências e benefícios às empresas atualmente desfrutados por grandes provedores de hiperescala.

É por isso que continuamos trabalhando com parceiros como a NVIDIA . Embora o software esteja consumindo tudo – incluindo a borda – ainda é o hardware que alimenta tudo. E essa potência pode ser aumentada sem exigir mais espaço, aproveitando a otimização de hardware.