BLOG

Accélération de l'IA d'entreprise : Données unifiées pour RAG avec F5, NetApp et Google Cloud

Vignette de Matthew Emes
Matthieu Emes
Publié le 4 mars 2025

À mesure que les organisations adoptent de plus en plus de technologies d’IA, elles constatent qu’il peut être difficile de maintenir à jour les grands modèles linguistiques (LLM) avec leurs dernières données propriétaires. Cela a conduit à l’adoption de la génération augmentée de récupération (RAG), qui ajoute des données supplémentaires pour améliorer l’inférence de l’IA pour des réponses plus précises et plus utiles. Transférer ces données supplémentaires au LLM en toute sécurité peut s'avérer difficile, nécessitant une solution de connectivité sécurisée.

La révolution RAG dans l'IA d'entreprise

Les LLM traditionnels, bien que puissants, sont limités par leurs données de formation et ne peuvent pas accéder aux informations spécifiques à l'organisation. RAG permet aux LLM d'interroger des sources de connaissances externes lors de la génération, produisant des résultats qui reflètent à la fois les connaissances générales du modèle et les données propriétaires d'une organisation.

Cependant, comme la plupart des organisations sont passées à des environnements informatiques multicloud et hybrides, leurs données sont souvent réparties sur plusieurs sources. Cette distribution rend difficile la mise en œuvre efficace de RAG, car les organisations doivent garantir un accès sécurisé à toutes les sources de données pertinentes tout en maintenant les performances et la rentabilité à grande échelle. Pour résoudre ce défi, il faut trouver un moyen de connecter en toute sécurité les magasins de données de toutes les sources avec des LLM, c'est pourquoi F5, NetApp et Google Cloud se sont associés pour proposer une solution. 

Un flux de travail RAG de base qui comprend un récupérateur pour obtenir des données pertinentes à partir d'un grand modèle de langage, en les combinant avec le contexte nécessaire pour générer des informations précises et contextuellement pertinentes.

Une approche unifiée de l'accès aux données

Les services cloud distribués F5 incluent une mise en réseau multicloud sécurisée pour connecter des applications et des données entre les clouds et les environnements sur site. En utilisant la dorsale privée du réseau mondial F5, F5 Distributed Cloud Network Connect fonctionne avec NetApp pour déplacer et stocker rapidement et en toute sécurité les données où et quand elles sont nécessaires.

Spécifiquement pour RAG, Distributed Cloud Network Connect relie le stockage NetApp dans le cloud ou sur site aux LLM , y compris la plateforme Vertex AI de Google Cloud, pour une inférence sécurisée, rapide et pertinente. Cette solution crée un cadre transparent pour accéder aux sources de données distribuées dans des environnements hybrides et multicloud.

Les capacités de mise en réseau multicloud sécurisées de F5 servent de base, permettant un accès efficace et protégé aux données dans différents environnements tout en maintenant une observabilité et une orchestration centralisées. Les organisations peuvent utiliser Distributed Cloud Network Connect avec Google Cloud NetApp Volumes , NetApp Cloud Volumes ONTAP pour Google Cloud et d'autres systèmes de stockage de données NetApp , offrant une connectivité sécurisée et des performances rapides nécessaires aux charges de travail de l'IA.

La plateforme Vertex AI de Google Cloud complète la solution en exploitant cet accès unifié aux données pour faciliter le RAG lors du développement applications LLM augmentées en contexte. L'utilisation efficace des ressources de la plateforme et son infrastructure d'IA sécurisée aident les organisations à maintenir leur rentabilité tout en faisant évoluer leurs opérations d'IA.

Cette solution commune présente plusieurs avantages :

  • Sécurité renforcée : La mise en réseau multicloud de F5 intègre des fonctions de sécurité, notamment des pare-feu application Web, une défense contre les robots et une protection des API, ainsi qu'une application cohérente des politiques pour défendre les données propriétaires et les modèles d'IA, même dans des environnements hybrides complexes.
  • Réseau crypté : Les connexions de couche 3 entre les modèles d’IA et le stockage NetApp (sur site et dans le cloud) sont cryptées pour protéger les données sensibles en transit.
  • Performances optimisées : Avec des points de présence dans le monde entier, le réseau mondial F5 minimise la latence et offre un contrôle sur les vitesses de transfert pour les applications d'IA réactives.
  • Opérations multicloud simplifiées : Les organisations peuvent gérer la sécurité et la mise en réseau du cloud vers les sites et jusqu'à la périphérie avec la console F5 Distributed Cloud et laisser Distributed Cloud Network Connect gérer les complexités de la mise en réseau multicloud.
  • Rationalisation des outils : Réduisez le nombre d’outils de sécurité et de mise en réseau requis pour prendre en charge RAG et l’IA.

F5, NetApp et Google Cloud se sont associés pour aider les clients à mettre en œuvre RAG en toute sécurité dans des environnements hybrides et multicloud.

Un chemin simplifié vers la productivité de l’IA

Les organisations peuvent tirer parti de leurs investissements existants dans l’infrastructure F5, NetApp et Google Cloud pour créer une solution RAG sécurisée, ce qui en fait un choix pratique pour les entreprises cherchant à améliorer leurs capacités d’IA. Ce partenariat permet aux organisations d’exploiter leurs données pour obtenir des informations basées sur l’IA tout en maintenant la sécurité et le contrôle. En simplifiant l’accès aux données pour les applications RAG, les organisations peuvent se concentrer sur la valorisation de l’IA plutôt que sur la gestion de la complexité de l’infrastructure.

Les services cloud distribués F5 sont disponibles sur Google Cloud Marketplace .