BLOG

Las fábricas de IA producen las aplicaciones más modernas: Aplicaciones de IA

Miniatura de Paul Pindell
Pablo Pindell
Publicado el 30 de enero de 2025
Miniatura de Hunter Smit
Hunter Smit
Publicado el 30 de enero de 2025

Durante los últimos meses, F5 ha analizado en profundidad las fábricas de IA. Al comienzo de nuestra serie, definimos una fábrica de IA como una inversión masiva en almacenamiento, redes y computación que satisface requisitos de inferencia y entrenamiento de alto volumen y alto rendimiento. Las fábricas de IA, al fin y al cabo, son una analogía de cómo se crean, perfeccionan e implementan los modelos y servicios de IA. Al igual que una planta de fabricación tradicional que transforma materiales en productos terminados, las fábricas de IA crean aplicaciones de IA. 

En este artículo del blog, describiremos las similitudes y diferencias entre una aplicación de IA y una aplicación moderna, destacando las necesidades de entrega y seguridad y analizando estas aplicaciones de IA modernas en el contexto de la Arquitectura de referencia de IA de F5 .

Evolución de las aplicaciones modernas

Las aplicaciones modernas han experimentado una evolución significativa, impulsada por la necesidad de agilidad, escalabilidad y experiencias de usuario mejoradas. La llegada de la computación en la nube ha marcado un punto crucial en esta evolución, proporcionando las bases para sistemas altamente distribuidos que pueden escalar de manera eficiente y operar sin problemas en múltiples entornos. La modernización de aplicación es la evolución hacia sistemas basados ​​en API, lo que llevó a la arquitectura a ser híbrida y multicloud. 

Las aplicaciones de IA aumentan la dependencia de las API y establecen la nube híbrida y multicloud como la nueva normalidad. Las tecnologías de contenedorización han revolucionado aún más la implementación de aplicación al permitir entornos consistentes y aislados para el software independientemente de la infraestructura subyacente. Estos avances no sólo son fundamentales para las aplicaciones modernas tradicionales, sino que también sirven como columna vertebral para las fábricas de IA. La agilidad que brindan la computación en la nube y la contenerización son esenciales para gestionar las intensas demandas computacionales del entrenamiento y la implementación de modelos de IA.

Las herramientas de orquestación como Kubernetes son esenciales para gestionar aplicaciones en contenedores a escala. Kubernetes automatiza la implementación, el escalamiento y la gestión de estas aplicaciones. En los flujos de trabajo de IA, Kubernetes coordina la implementación de cargas de trabajo de IA en múltiples sistemas, asignando recursos de manera eficiente y permitiendo un escalamiento perfecto de los modelos de IA.

Un aspecto crítico de este proceso es MLOps, que aborda los desafíos únicos de desarrollar, entrenar y poner en funcionamiento modelos de IA. MLOps admite la integración y entrega continuas (CI/CD), lo que garantiza que los modelos de IA se prueben, actualicen e implementen continuamente. Además, la adopción de arquitecturas de microservicios ha transformado el desarrollo de aplicación modernas al dividir los sistemas monolíticos en servicios más pequeños que se pueden implementar de forma independiente. Este enfoque acelera la CI/CD, lo que genera actualizaciones de software más rápidas y confiables.

La seguridad siempre ha sido una piedra angular en la evolución de las aplicaciones modernas. Con el aumento de amenazas cibernéticas sofisticadas, las aplicaciones modernas han integrado medidas de seguridad avanzadas como firewalls de aplicación web (WAF), protección distribuida contra denegación de servicio (DDoS) y seguridad de API. Es fundamental distinguir entre los ataques DDoS de capa 3/4 dirigidos a las capas de red y transporte y los ataques DoS de capa 7 dirigidos a la capa de aplicación . 

A medida que avanza la IA, el modelo de amenaza evoluciona, especialmente para los modelos de lenguaje grandes (LLM) a los que se accede a través de interfaces de procesamiento del lenguaje natural (PLN). Los riesgos para los LLM incluyen vulnerabilidades como las destacadas en el Top 10 de OWASP para aplicaciones LLM, como ataques de inyección rápida y amenazas de extracción de datos, junto con ataques DoS específicos del modelo. Estos avances de seguridad garantizan que las aplicaciones de IA sigan siendo resistentes y seguras, manteniendo la integridad y confiabilidad de las soluciones impulsadas por IA frente a las amenazas cambiantes.

Arquitectura de referencia de IA de F5

Si ha estado siguiendo nuestra serie sobre fábricas de IA, hemos explorado temas como seguridad de API , segmentación de red , gestión de tráfico , generación aumentada por recuperación (RAG) y unidades de procesamiento de datos (DPU) . Demos un paso atrás y analicemos cómo una fábrica de IA encaja en la arquitectura de referencia de IA de F5, cómo las fábricas de IA producen aplicaciones de IA y los requisitos para entregarlas y protegerlas.

Arquitectura de referencia de IA de F5.

Con base en nuestras casi tres décadas de experiencia ayudando a los clientes a ofrecer aplicaciones de alto rendimiento, F5 desarrolló una arquitectura de referencia de IA que incluye siete bloques de construcción (inferencia, RAG, gestión de corpus RAG, ajuste, capacitación, integración de servicios externos y desarrollo) y cuatro tipos de implementación (IA-SaaS, alojado en la nube, autoalojado y alojado en el borde). Para obtener más información sobre estos temas, visita nuestro blog que define una fábrica de IA . Como las aplicaciones de IA son las más modernas de las aplicaciones modernas, conectadas con API y extremadamente distribuidas, esta arquitectura de referencia aborda los desafíos de rendimiento, operaciones y seguridad que son esenciales para ofrecer aplicaciones de IA. 

Dos de los componentes básicos más comunes para las fábricas de IA son el entrenamiento y la inferencia; sin embargo, cada componente es necesario para crear una aplicación de IA completamente funcional. Algunas organizaciones pueden construir una fábrica de IA para gestionar las funciones necesarias para el entrenamiento o la inferencia. Otros pueden confiar en terceros para consumir servicios para el entrenamiento de modelos o proporcionar infraestructura para la inferencia.

Las aplicaciones de IA en esencia están distribuidas y potencialmente se ejecutan en plataformas de contenedores Kubernetes distribuidas. Esta es la definición exacta de una aplicación moderna y de donde proviene nuestra frase, “una aplicación de IA es simplemente la más moderna de las aplicaciones modernas”. ¿Pero qué significa esto para las empresas que están construyendo fábricas de IA? Las aplicaciones de IA necesitan los mismos servicios de entrega y seguridad que las aplicaciones modernas actuales, como el ingreso de Kubernetes, la salida de múltiples inquilinos, la gestión del tráfico basada en DNS, la resiliencia y la observabilidad. Por razones de seguridad, se requieren protección DDoS, protección de aplicación web y API y tecnologías de optimización. 

Si bien puede parecer sorprendente que nos centremos en las características de entrega y seguridad comunes a la IA y a las aplicaciones modernas, en lugar de centrarnos únicamente en las preocupaciones de seguridad específicas de la IA, este enfoque es intencional. Las aplicaciones de IA presentan riesgos únicos, pero a menudo se pasan por alto los aspectos básicos de la seguridad y la entrega de aplicación en favor de características nuevas e innovadoras. Al abordar primero las necesidades compartidas de seguridad y entrega (lo que llamamos las necesidades más fáciles de abordar), las organizaciones pueden realizar mejoras inmediatas utilizando su experiencia existente en seguridad de aplicaciones. Si bien las aplicaciones de IA pueden involucrar nuevos componentes, aún dependen en gran medida de interacciones web y API, que están dentro de las capacidades de los equipos actuales de NetOps y SecOps. Al comenzar con estrategias de seguridad y entrega comprobadas, los equipos pueden construir una base sólida y abordar gradualmente los desafíos únicos que plantean las aplicaciones de IA.

Aspectos destacados de la arquitectura de referencia de IA de F5 no solo el resultado de la fábrica de IA, sino también los desafíos y riesgos para lograr que la aplicación de IA tenga éxito para los objetivos comerciales de la organización. Para ello, decidimos utilizar un par de listas complementarias de los 10 principales riesgos y desafíos: el OWASP Top 10 for LLM Aplicações y el F5 Aplicação Delivery Top 10 . Hemos mapeado cada componente y la interconexión de los bloques de construcción y delineamos dónde se aplican los OWASP LLM Top 10 y el F5 Aplicação Delivery Top 10. En el caso siguiente, vea un ejemplo de inferencia de IA.

La arquitectura de referencia de inteligencia artificial de F5 destaca el bloque de construcción de inferencia con los 10 mejores de entrega de aplicación de F5 y los 10 mejores de OWASP LLM superpuestos.

La arquitectura de referencia de inteligencia artificial de F5 destaca el bloque de construcción de inferencia con los 10 mejores de entrega de aplicación de F5 y los 10 mejores de OWASP LLM superpuestos.

Cada componente y punto de interconexión dentro de una aplicación de IA se beneficia de las protecciones de seguridad y entrega bien establecidas diseñadas para aplicaciones modernas. Esto no quiere decir que estas protecciones convencionales sólo sean suficientes para proteger las aplicaciones de IA. Al aprovechar estas soluciones de seguridad y entrega comprobadas como base, las organizaciones pueden lograr una mejora significativa en la postura de seguridad y entrega de sus aplicaciones de IA. Desde este sólido punto de partida, los equipos pueden desarrollar progresivamente habilidades especializadas y adoptar las herramientas avanzadas necesarias para abordar los desafíos y riesgos únicos que presentan las aplicaciones de IA.

En este momento, la arquitectura de referencia de IA F5 está disponible como vista previa . Los clientes tendrán la oportunidad de explorar la Arquitectura de Referencia de IA completa en una experiencia interactiva a partir de fines del próximo mes en AppWorld , la principal conferencia sobre seguridad y entrega de aplicación de F5.

F5 apoya fábricas de IA y aplicaciones modernas

F5 es líder en distribución y seguridad de aplicación . Soluciones como F5 BIG-IP proporcionan servicios esenciales que incluyen equilibrio de carga, gestión del tráfico y seguridad. Estas capacidades comúnmente conocidas para las aplicaciones tradicionales son igualmente críticas para que las aplicaciones de IA brinden los más altos niveles de confiabilidad, rendimiento y protección.

Para las empresas que construyen fábricas de IA, las capacidades en las que confían de F5 para la entrega y seguridad de aplicación son las capacidades necesarias para las fábricas de IA. F5 BIG-IP Local Traffic Manager , combinado con hardware especialmente diseñado con F5 rSeries y VELOS , permite la ingesta de datos de alto rendimiento para entrenamiento y ajuste, y protege las aplicaciones de IA de las amenazas de seguridad más exigentes. Los servicios de nube distribuida de F5 permiten la creación de redes multicloud seguras y la protección de aplicación web y API. Además, recientemente anunciado, F5 BIG-IP Next para Kubernetes implementado en DPU NVIDIA BlueField-3 descarga la gestión del tráfico y la seguridad de la CPU a la DPU para una infraestructura de IA a gran escala, lo que desbloquea mayor eficiencia, control y rendimiento para las aplicaciones de IA.

Para obtener más información sobre cómo F5 puede proteger y escalar las fábricas de IA, comuníquese con su equipo de cuentas de F5 hoy mismo. El enfoque de F5 en la IA no termina aquí: explore cómo F5 protege y distribuye aplicaciones de IA en todas partes .