BLOG

A F5 ajuda provedores de serviços e empresas a desbloquear todo o potencial de implantações de IA com DPUs NVIDIA BlueField-3

Ahmed Guetari Miniatura
Ahmed Guetari
Publicado em 23 de outubro de 2024

Nas últimas décadas, o mundo dos negócios enfrentou muitos pontos de inflexão estimulados por revoluções tecnológicas, e a F5 está lá para ajudar nossos clientes nesses momentos críticos.

Quando as organizações começaram a embarcar em suas transformações digitais, os aplicativos se tornaram o coração do negócio, e a F5 garantiu que eles pudessem ser entregues e protegidos em escala. Mais recentemente, quando o 5G prometeu revolucionar o mundo dos negócios com velocidades, serviços e confiabilidade sem precedentes, a F5 estava lá para ajudar as empresas de telefonia móvel a implantar o núcleo 5G nativo da nuvem em escala.

Agora, mais uma vez, estamos em um ponto de inflexão, provavelmente o maior que nossa indústria já enfrentou, à medida que as organizações buscam maneiras de abraçar o poder da IA. À medida que os clientes implementam essa tecnologia transformadora, a F5 os ajuda a desbloquear todo o potencial de suas implantações de IA em larga escala.

A dificuldade de atingir o desempenho ideal

A crescente adoção de clusters de IA está impulsionando a transformação em direção à computação acelerada. Tentar usar práticas estabelecidas em computação de uso geral, rede, segurança e monitoramento geralmente resulta em ineficiências, atrasos e custos crescentes.

Os imensos requisitos de processamento de dados da IA colocam uma pressão considerável na infraestrutura de rede tradicional, dificultando a manutenção do desempenho ideal. A unidade de processamento de dados (DPU) NVIDIA BlueField surgiu como uma solução essencial. Ao descarregar e acelerar tarefas de segurança e rede de alta largura de banda, como processamento de pacotes, criptografia e compactação, as DPUs BlueField-3 oferecem conectividade de rede em nuvem ideal. Essa otimização melhora o desempenho geral e acelera o acesso da unidade de processamento gráfico (GPU) aos dados.

Provedores de serviços e grandes empresas estão construindo infraestruturas de IA em larga escala ou fábricas de IA , usando a plataforma de computação acelerada full-stack da NVIDIA para executar treinamento e inferência de modelos de IA generativos em escala. As empresas precisam maximizar seus investimentos em fábricas de IA, que podem ser significativos. No entanto, sem a base certa, a infraestrutura de IA pode ser subutilizada. 

Gerenciando com eficiência o vasto tráfego direcionado aos servidores de IA

O F5 BIG-IP Next para Kubernetes implantado em DPUs NVIDIA BlueField-3 foi projetado para resolver esses problemas. A solução se concentra em descarregar e acelerar o F5 BIG-IP Next Service Proxy for Kubernetes (SPK) nas DPUs BlueField-3 da NVIDIA . Ele se baseia na liderança da F5 em abordar desafios críticos de entrega e segurança de aplicativos durante as principais inflexões do mercado, ao mesmo tempo em que aproveita as inovações da NVIDIA em computação acelerada e rede de alto desempenho. 

O F5 BIG-IP Next SPK foi desenvolvido para resolver os problemas que os provedores de serviços enfrentaram com o Kubernetes durante a transição para o 5G. A infraestrutura 5G é construída em uma arquitetura em contêiner nativa da nuvem, com cargas de trabalho de contêiner gerenciadas usando o Kubernetes. No entanto, o Kubernetes não foi originalmente projetado para os casos de uso complexos exigidos por um ambiente 5G. O BIG-IP Next SPK ajudou empresas de telecomunicações a adaptar a rede Kubernetes para uma infraestrutura 5G, dando a elas a visibilidade, o controle e a segurança necessários para dimensionar dinamicamente suas redes 5G. Nos últimos anos, os provedores de serviços usaram o BIG-IP para dar vida à tecnologia 5G para milhões de assinantes.  

Assim como o BIG-IP Next SPK desempenhou um papel fundamental na habilitação do 5G Core para a última inflexão do mercado, ele está evoluindo agora para enfrentar os desafios da inflexão do mercado de IA e da entrega de carga de trabalho de IA, que compartilham semelhanças com cargas de trabalho 5G, mas envolvem volumes de tráfego exponencialmente maiores. Para atender às demandas dessa nova inflexão de mercado, a F5 está lançando o BIG-IP Next para Kubernetes implantado em DPUs NVIDIA BlueField-3 para gerenciar efetivamente o vasto tráfego direcionado aos servidores de IA.

Esta solução transforma a entrega de aplicativos modernos para atender às demandas de IA generativa. É uma implementação nativa do Kubernetes da plataforma BIG-IP da F5 que lida com cargas de trabalho de rede, segurança e balanceamento de carga, situada no ponto de demarcação entre o cluster de IA e outras partes dos data centers. O BIG-IP Next para Kubernetes mapeia namespaces de cluster de IA para locação de rede de data center, oferecendo segurança adequada e gerenciamento simplificado. Ao aproveitar os aceleradores de hardware do BlueField-3 DPU, o BIG-IP Next para Kubernetes acelera uma variedade de serviços de rede e dados, otimizando a eficiência energética ao descarregar recursos de computação da CPU.

Por exemplo, em seu evento Networking @Scale 2024 no início deste ano, a Meta mencionou que o treinamento de seu modelo de linguagem de aprendizagem de código aberto (LLM) Llama 3 foi prejudicado pela latência da rede, o que foi resolvido ajustando as interações de hardware e software. Essa abordagem aumentou o desempenho geral em 10%. Embora 10% possa parecer um ganho pequeno, para um modelo que leva meses para ser treinado, essa melhoria se traduz em semanas de economia de tempo.

Reduzindo a complexidade das implantações de IA

O F5 BIG-IP Next para Kubernetes implantado em DPUs BlueField-3 oferece vários benefícios para provedores de serviços e grandes empresas que buscam construir infraestruturas de IA em larga escala. Isso inclui:

  • Integração simplificada: Até agora, as organizações enfrentavam a complexidade de reunir componentes de software de diferentes fornecedores para entregar e proteger seus aplicativos de IA. O BIG-IP Next para Kubernetes combina rede, segurança, gerenciamento de tráfego e balanceamento de carga em uma única solução, simplificando a complexidade das implantações de IA. Ele também oferece uma visão integrada dessas funções em toda a infraestrutura de IA, juntamente com a rica observabilidade e o controle granular necessários para otimizar as cargas de trabalho de IA. 
  • Segurança aprimorada: O BIG-IP Next para Kubernetes oferece suporte a recursos de segurança críticos e arquitetura de confiança zero, incluindo firewall de borda, mitigação de negação de serviço distribuída (DDoS), proteção de API, prevenção de intrusão, criptografia e gerenciamento de certificados, transferindo essas funções para a DPU e liberando recursos valiosos da CPU.
  • Desempenho melhorado: O BIG-IP Next para Kubernetes acelera a rede e a segurança, o que é essencial para atender às demandas da infraestrutura de IA para fornecer aplicativos em escala de nuvem.
  • Suporte multilocação: O BIG-IP Next para Kubernetes permite uma arquitetura multilocatário para que os provedores de serviços possam hospedar com segurança vários usuários na mesma infraestrutura de IA, mantendo suas cargas de trabalho e dados de IA separados.

Entrega bem-sucedida de data centers otimizados para IA

Ao considerar cuidadosamente os desafios e as soluções disponíveis, as organizações podem fornecer com sucesso data centers otimizados para IA sem interromper as operações existentes ou comprometer a segurança. O F5 BIG-IP Next para Kubernetes implantado em DPUs BlueField-3 surge como uma opção atraente, fornecendo integração perfeita, segurança aprimorada e desempenho aprimorado para cargas de trabalho de IA, incluindo LLMs de grande escala como o Llama 3.

Para saber mais, leia nosso comunicado à imprensa e a postagem do blog da NVIDIA .