Unternehmen setzen zunehmend auf KI-Technologien und haben festgestellt, dass es eine Herausforderung sein kann, große Sprachmodelle (LLMs) mit ihren neuesten proprietären Daten auf dem neuesten Stand zu halten. Dies hat zur Einführung der Retrieval-Augmented Generation (RAG) geführt, die zusätzliche Daten hinzufügt, um die KI-Inferenz zu verbessern und so genauere und nützlichere Antworten zu erzielen. Es kann eine Herausforderung sein, diese zusätzlichen Daten sicher zum LLM zu übermitteln. Daher ist eine Lösung für eine sichere Konnektivität erforderlich.
Herkömmliche LLMs sind zwar leistungsstark, jedoch durch ihre Trainingsdaten beschränkt und haben keinen Zugriff auf organisationsspezifische Informationen. RAG ermöglicht LLMs, während der Generierung externe Wissensquellen abzufragen und Ergebnisse zu erzeugen, die sowohl das umfassende Wissen des Modells als auch die proprietären Daten einer Organisation widerspiegeln.
Da die meisten Unternehmen jedoch auf Multicloud- und Hybrid-IT-Umgebungen umgestiegen sind, sind ihre Daten oft auf mehrere Quellen verteilt. Diese Verteilung erschwert die effektive Implementierung von RAG, da Unternehmen einen sicheren Zugriff auf alle relevanten Datenquellen gewährleisten müssen, ohne dabei Leistung und Kosteneffizienz im großen Maßstab aufrechtzuerhalten. Um diese Herausforderung zu meistern, ist eine Möglichkeit erforderlich, Datenspeicher aller Quellen sicher mit LLMs zu verbinden. Aus diesem Grund haben sich F5, NetApp und Google Cloud zusammengeschlossen, um eine Lösung anzubieten.
Ein grundlegender RAG-Workflow, der einen Retriever zum Abrufen relevanter Daten aus einem großen Sprachmodell umfasst und diese mit dem erforderlichen Kontext kombiniert, um genaue, kontextrelevante Informationen zu generieren.
Die Distributed Cloud Services von F5 umfassen sichere Multicloud-Netzwerke zum Verbinden von Apps und Daten über Clouds und lokale Umgebungen hinweg. F5 Distributed Cloud Network Connect nutzt das private Backbone des F5 globales Netzwerk und arbeitet mit NetApp zusammen, um Daten schnell und sicher zu verschieben und zu speichern, wo und wann sie benötigt werden.
Speziell für RAG verbindet Distributed Cloud Network Connect NetApp-Speicher in der Cloud oder vor Ort mit LLMs , einschließlich der Vertex AI-Plattform von Google Cloud, für sichere, schnelle und relevante Inferenzen. Diese Lösung schafft ein nahtloses Framework für den Zugriff auf verteilte Datenquellen in Hybrid- und Multicloud-Umgebungen.
Die sicheren Multicloud-Netzwerkfunktionen von F5 dienen als Grundlage und ermöglichen einen effizienten, geschützten Datenzugriff über verschiedene Umgebungen hinweg bei gleichzeitiger Aufrechterhaltung einer zentralen Beobachtbarkeit und Orchestrierung. Organisationen können Distributed Cloud Network Connect mit Google Cloud NetApp Volumes , NetApp Cloud Volumes ONTAP für Google Cloud und anderen NetApp-Datenspeichersystemen verwenden und so die sichere Konnektivität und schnelle Leistung nutzen, die für KI-Workloads erforderlich sind.
Die Vertex AI-Plattform von Google Cloud vervollständigt die Lösung, indem sie diesen einheitlichen Datenzugriff nutzt, um RAG bei der Entwicklung kontexterweiterter LLM- Applications zu erleichtern. Die effiziente Ressourcennutzung und die sichere KI-Infrastruktur der Plattform helfen Unternehmen dabei, die Kosteneffizienz aufrechtzuerhalten und gleichzeitig ihre KI-Aktivitäten zu skalieren.
Diese gemeinsame Lösung bietet mehrere Vorteile:
F5, NetApp und Google Cloud haben sich zusammengeschlossen, um Kunden bei der sicheren Implementierung von RAG in Hybrid- und Multicloud-Umgebungen zu unterstützen.
Organisationen können ihre vorhandenen Investitionen in die Infrastruktur von F5, NetApp und Google Cloud nutzen, um eine sichere RAG-Lösung zu erstellen. Damit ist sie eine praktische Wahl für Unternehmen, die ihre KI-Fähigkeiten verbessern möchten. Durch die Partnerschaft können Unternehmen ihre Daten für KI-gestützte Erkenntnisse nutzen und gleichzeitig Sicherheit und Kontrolle wahren. Durch die Vereinfachung des Datenzugriffs für RAG- Applications können sich Unternehmen darauf konzentrieren, Mehrwert aus KI zu ziehen, anstatt die Komplexität der Infrastruktur zu verwalten.
F5 Distributed Cloud Services sind im Google Cloud Marketplace verfügbar.