Les charges de travail d’IA et d’apprentissage automatique (IA/ML) révolutionnent la manière dont les entreprises fonctionnent et innovent. Kubernetes , la norme de facto pour l'orchestration et la gestion des conteneurs, est la plateforme de choix pour alimenter des charges de travail de modèles de langage volumineux (LLM) évolutifs et des modèles d'inférence dans des environnements hybrides multicloud.
Dans Kubernetes, les contrôleurs Ingress jouent un rôle essentiel dans la fourniture et la sécurisation des applications conteneurisées. Déployés à la périphérie d'un cluster Kubernetes, ils servent de point central de gestion des communications entre les utilisateurs et les applications.
Dans ce blog, nous explorons comment les contrôleurs Ingress et F5 NGINX Connectivity Stack pour Kubernetes peuvent aider à simplifier et à rationaliser la diffusion, l'expérimentation, la surveillance et la sécurité des modèles pour les charges de travail AI/ML.
Lors du déploiement de modèles d'IA/ML à grande échelle, les fonctionnalités et capacités prêtes à l'emploi de Kubernetes peuvent vous aider à :
Dans le même temps, les organisations peuvent être confrontées à des défis en matière de mise en œuvre, d’expérimentation, de surveillance et de sécurisation des modèles d’IA/ML en production à grande échelle :
Les contrôleurs d'entrée de classe entreprise comme le contrôleur d'entrée F5 NGINX peuvent aider à relever ces défis. En exploitant un outil qui combine les fonctionnalités du contrôleur Ingress, de l'équilibreur de charge et de la passerelle API, vous pouvez obtenir une meilleure disponibilité, une meilleure protection et une meilleure visibilité à grande échelle, quel que soit l'endroit où vous exécutez Kubernetes. De plus, cela réduit la complexité et les coûts opérationnels.
NGINX Ingress Controller peut également être étroitement intégré à une technologie de protection d'application de couche 7 de pointe de F5 qui aide à atténuer les 10 principales cybermenaces de l'OWASP pour les applications LLM et à défendre les charges de travail AI/ML contre les attaques DoS.
Les contrôleurs d'entrée peuvent simplifier et rationaliser le déploiement et l'exécution des charges de travail IA/ML en production grâce aux fonctionnalités suivantes :
NGINX Connectivity Stack pour Kubernetes inclut NGINX Ingress Controller et F5 NGINX App Protect pour fournir des communications rapides, fiables et sécurisées entre les clusters Kubernetes exécutant des applications AI/ML et leurs utilisateurs, sur site et dans le cloud. Il permet de simplifier et de rationaliser la mise à disposition, l'expérimentation, la surveillance et la sécurité des modèles dans n'importe quel environnement Kubernetes, améliorant ainsi les capacités du fournisseur de cloud et des offres Kubernetes pré-packagées avec un degré de protection, de disponibilité et d'observabilité plus élevé à grande échelle.
NGINX propose un ensemble complet d'outils et de blocs de construction pour répondre à vos besoins et améliorer la sécurité, l'évolutivité et la visibilité de votre plateforme Kubernetes.
Vous pouvez commencer dès aujourd'hui en demandant un essai gratuit de 30 jours de Connectivity Stack pour Kubernetes .
« Cet article de blog peut faire référence à des produits qui ne sont plus disponibles et/ou qui ne sont plus pris en charge. Pour obtenir les informations les plus récentes sur les produits et solutions F5 NGINX disponibles, explorez notre famille de produits NGINX . NGINX fait désormais partie de F5. Tous les liens NGINX.com précédents redirigeront vers un contenu NGINX similaire sur F5.com."