À mesure que les organisations adoptent de plus en plus de technologies d’IA, elles constatent qu’il peut être difficile de maintenir à jour les grands modèles linguistiques (LLM) avec leurs dernières données propriétaires. Cela a conduit à l’adoption de la génération augmentée de récupération (RAG), qui ajoute des données supplémentaires pour améliorer l’inférence de l’IA pour des réponses plus précises et plus utiles. Transférer ces données supplémentaires au LLM en toute sécurité peut s'avérer difficile, nécessitant une solution de connectivité sécurisée.
Les LLM traditionnels, bien que puissants, sont limités par leurs données de formation et ne peuvent pas accéder aux informations spécifiques à l'organisation. RAG permet aux LLM d'interroger des sources de connaissances externes lors de la génération, produisant des résultats qui reflètent à la fois les connaissances générales du modèle et les données propriétaires d'une organisation.
Cependant, comme la plupart des organisations sont passées à des environnements informatiques multicloud et hybrides, leurs données sont souvent réparties sur plusieurs sources. Cette distribution rend difficile la mise en œuvre efficace de RAG, car les organisations doivent garantir un accès sécurisé à toutes les sources de données pertinentes tout en maintenant les performances et la rentabilité à grande échelle. Pour résoudre ce défi, il faut trouver un moyen de connecter en toute sécurité les magasins de données de toutes les sources avec des LLM, c'est pourquoi F5, NetApp et Google Cloud se sont associés pour proposer une solution.
Un flux de travail RAG de base qui comprend un récupérateur pour obtenir des données pertinentes à partir d'un grand modèle de langage, en les combinant avec le contexte nécessaire pour générer des informations précises et contextuellement pertinentes.
Les services cloud distribués F5 incluent une mise en réseau multicloud sécurisée pour connecter des applications et des données entre les clouds et les environnements sur site. En utilisant la dorsale privée du réseau mondial F5, F5 Distributed Cloud Network Connect fonctionne avec NetApp pour déplacer et stocker rapidement et en toute sécurité les données où et quand elles sont nécessaires.
Spécifiquement pour RAG, Distributed Cloud Network Connect relie le stockage NetApp dans le cloud ou sur site aux LLM , y compris la plateforme Vertex AI de Google Cloud, pour une inférence sécurisée, rapide et pertinente. Cette solution crée un cadre transparent pour accéder aux sources de données distribuées dans des environnements hybrides et multicloud.
Les capacités de mise en réseau multicloud sécurisées de F5 servent de base, permettant un accès efficace et protégé aux données dans différents environnements tout en maintenant une observabilité et une orchestration centralisées. Les organisations peuvent utiliser Distributed Cloud Network Connect avec Google Cloud NetApp Volumes , NetApp Cloud Volumes ONTAP pour Google Cloud et d'autres systèmes de stockage de données NetApp , offrant une connectivité sécurisée et des performances rapides nécessaires aux charges de travail de l'IA.
La plateforme Vertex AI de Google Cloud complète la solution en exploitant cet accès unifié aux données pour faciliter le RAG lors du développement applications LLM augmentées en contexte. L'utilisation efficace des ressources de la plateforme et son infrastructure d'IA sécurisée aident les organisations à maintenir leur rentabilité tout en faisant évoluer leurs opérations d'IA.
Cette solution commune présente plusieurs avantages :
F5, NetApp et Google Cloud se sont associés pour aider les clients à mettre en œuvre RAG en toute sécurité dans des environnements hybrides et multicloud.
Les organisations peuvent tirer parti de leurs investissements existants dans l’infrastructure F5, NetApp et Google Cloud pour créer une solution RAG sécurisée, ce qui en fait un choix pratique pour les entreprises cherchant à améliorer leurs capacités d’IA. Ce partenariat permet aux organisations d’exploiter leurs données pour obtenir des informations basées sur l’IA tout en maintenant la sécurité et le contrôle. En simplifiant l’accès aux données pour les applications RAG, les organisations peuvent se concentrer sur la valorisation de l’IA plutôt que sur la gestion de la complexité de l’infrastructure.
Les services cloud distribués F5 sont disponibles sur Google Cloud Marketplace .