BLOG

Implante, proteja e otimize modelos de IA para aplicativos inteligentes com F5 e Intel

Miniatura de Sanjay Shitole
Sanjay Shitole
Publicado em 06 de maio de 2024

Aplicativos com tecnologia de IA estão se tornando mais comuns e registrando um crescimento significativo de usuários. Uma análise de dados de 2023 descobriu que, embora os novos downloads de aplicativos móveis tenham aumentado apenas 1% em relação ao ano anterior, os 20 principais aplicativos que tinham IA integrada em seus conjuntos de recursos tiveram um crescimento médio de 11%.1 No entanto, implementar e proteger facilmente os modelos de IA para alimentar esses aplicativos pode ser uma barreira para desenvolvedores e equipes de TI.

Alimentando aplicativos mais inteligentes com IA

A nova geração de aplicativos inteligentes usa automação de IA com base em entradas de dados — por exemplo, um aplicativo de seguro que monitora condições climáticas severas — ou pode usar aprendizado de máquina para adaptar e melhorar a experiência do usuário. A Gartner estima que até 2026, 30% dos novos aplicativos usarão IA para impulsionar interfaces de usuário adaptáveis e personalizadas, ante menos de 5% atualmente.2 

Mas muitas organizações não têm as habilidades necessárias para criar ou usar os modelos de IA de que precisam. De acordo com uma pesquisa do Fórum Econômico Mundial, os executivos estimam que até 40% de sua força de trabalho geral pode precisar de requalificação para trabalhar efetivamente com IA.3 Em resposta, novas soluções estão surgindo para permitir que os desenvolvedores aproveitem modelos de IA com o mínimo de código.

Os modelos de IA também exigem poder computacional significativo, o que pode criar limitações. Embora colocar modelos de IA perto da fonte de entrada reduza a latência para inferência, os locais de borda geralmente não têm os recursos necessários para um desempenho aceitável de IA.

Tornando a IA mais acessível

Para abordar a facilidade de uso e a otimização de recursos do desenvolvedor, a Intel desenvolveu o OpenVINO, um kit de ferramentas de código aberto que acelera a inferência de IA ao mesmo tempo em que oferece um espaço menor e uma abordagem de "escreva uma vez, implante em qualquer lugar". Ele permite que os programadores desenvolvam soluções de IA escaláveis e eficientes com relativamente poucas linhas de código. O OpenVINO também pode converter e otimizar modelos de IA para executá-los em data centers, na nuvem ou na borda.

Embora o OpenVINO torne a IA mais acessível para cenários do mundo real, como inferência de IA, ela precisa de recursos de segurança e entrega, assim como os aplicativos. Uma implantação do OpenVINO pode consistir em centenas ou milhares de servidores de modelo baseados em contêineres. Para fornecer resultados de inferência de forma confiável aos usuários ou aplicativos, você precisa de uma maneira de monitorar a integridade do servidor e gerenciar o tráfego. O F5 NGINX Plus pode proteger servidores modelo OpenVINO.

Protegendo modelos de IA com F5 NGINX Plus

Embora seja possível usar a versão de código aberto do NGINX com o OpenVINO, usar o NGINX Plus adiciona recursos valiosos, como alta disponibilidade, verificações de integridade ativas e suporte premiado. O NGINX Plus também fornece balanceamento de carga e terminação SSL para que aplicativos e usuários possam se conectar de forma confiável e segura aos seus servidores modelo OpenVINO.

Para maior disponibilidade, o NGINX Plus pode ser implantado como um par ativo-passivo. Isso cria uma solução de alta disponibilidade, usando o primário para processar ativamente o tráfego enquanto o backup monitora a integridade e assume o controle em caso de problemas. O cache de conteúdo e a terminação SSL melhoram o desempenho reduzindo a carga nos servidores do modelo OpenVINO.

As verificações de integridade ativas no NGINX Plus monitoram seus servidores modelo para garantir que o tráfego seja enviado apenas para servidores disponíveis. Proteja e valide o tráfego criptografado de entrada usando certificados mTLS e use análises e painéis para antecipar ou solucionar problemas com seus servidores. A natureza leve do NGINX Plus, bem como o suporte de alto nível para instalação, implantação e depuração, facilitam a adoção para atender às necessidades do seu aplicativo com tecnologia de IA.

Construindo aplicativos com tecnologia de IA com confiança

A combinação do NGINX Plus e do OpenVINO facilita a adição de IA a aplicativos em qualquer lugar de forma segura e consistente. Implante facilmente em data centers, nuvens ou sites de ponta, mantendo a disponibilidade e o desempenho.

Usar o NGINX Plus com o OpenVINO é apenas parte de uma colaboração contínua entre a F5 e a Intel. Saiba mais sobre a parceria em f5.com/intel .

Fontes

1. Data.ai, State of Mobile 2024 , janeiro de 2024

2. Gartner, cresce a demanda por aplicativos inteligentes alimentados por IA , setembro. 2023

3.  Fórum Econômico Mundial, Por que devemos eliminar a lacuna de habilidades para aproveitar o poder da IA , janeiro de 2024