BLOG

Desbloqueando la magia de la IA con RAG, F5 y NetApp

Miniatura de Hunter Smit
Cazador Smit
Publicado el 24 de septiembre de 2024

A medida que las empresas exploran formas de aprovechar el poder de la IA, muchas están recurriendo a modelos de lenguaje grandes (LLM) para mejorar su toma de decisiones. Sin embargo, los LLM como ChatGPT se capacitan en grandes cantidades de datos públicos disponibles en Internet, lo que limita su utilidad para las empresas que desean usar IA para capturar información de sus propios datos corporativos. Además, puede requerir meses y muchos gastos entrenar esos modelos, lo que hace virtualmente imposible garantizar que cada respuesta sea verdaderamente significativa y esté actualizada.

La pregunta es ¿cómo pueden las empresas aprovechar el procesamiento del lenguaje natural para obtener información de inteligencia artificial potente y actualizada a partir de sus propios datos específicos de la empresa? Desarrollar su propio LLM es prohibitivamente costoso. También lo es perfeccionar uno existente con datos especializados.

Afortunadamente, la generación aumentada de recuperación (RAG) ha surgido como una forma para que las empresas superen estas limitaciones. Al utilizar esta técnica avanzada de IA, las empresas pueden combinar un LLM previamente entrenado, como ChatGPT, con sus propios datos para obtener respuestas precisas y contextualizadas. Pueden restringir los datos que se utilizan extrayéndolos únicamente de las fuentes más relevantes, como procedimientos aprobados de la empresa, políticas o información de productos. Y como RAG recupera información en tiempo real de la base de datos vectorial de una empresa, pueden asegurarse de obtener siempre la información más reciente a medida que se agregan nuevos datos.

Combinando las ventajas de un Máster en Derecho (LLM) con los datos de la empresa

RAG combina eficazmente la recuperación de datos con la generación de lenguaje. El recuperador actúa como un motor de búsqueda que recupera datos según la consulta del usuario, utilizando algoritmos sofisticados para recopilar solo la información más relevante. El generador suele ser un LLM como ChatGPT que toma esta información y la convierte en una respuesta precisa e informada. Al integrar estos dos componentes, RAG permite a las empresas construir sistemas de IA personalizados que les brindan una ventaja competitiva.

La generación aumentada de recuperación (RAG) incorpora datos privados y patentados para complementar los grandes modelos lingüísticos (LLM), ofreciendo respuestas precisas y contextualizadas.

Las aplicações potenciales son numerosas. Los equipos de ventas y marketing pueden combinar rápidamente información de informes de mercado, comentarios de clientes y feeds de redes sociales para identificar tendencias de compra y preferencias de los clientes. Los equipos de atención al cliente pueden aumentar la fidelización de clientes a través de chatbots impulsados ​​por RAG que utilizan información de productos, perfiles de clientes e historiales de compras para brindar respuestas personalizadas a las consultas de los clientes. Los equipos legales pueden aprovechar fácilmente los aprendizajes de IA de contratos, casos legales y otros documentos al brindar asesoramiento legal. Al ayudar a los empleados a acceder de forma rápida y precisa a datos relevantes y actualizados, estructurados y no estructurados, almacenados en múltiples bases de datos, RAG puede aumentar la productividad empresarial, mejorar la experiencia del cliente y aumentar las ganancias al reducir la mano de obra y mejorar la fidelización de clientes. 

Sin embargo, aunque RAG promete transformar la IA empresarial, aún existen algunos obstáculos. Uno de los principales obstáculos es recuperar e integrar datos en los entornos de TI distribuidos que tienen implementados la mayoría de las empresas. Hoy en día, la mayoría de las empresas operan sus aplicações en un entorno multicloud híbrido y altamente complejo. Y debido a que los datos generalmente se almacenan en diferentes lugares (incluidos centros de datos locales y múltiples nubes como Microsoft Azure, Google Cloud Platform y AWS), integrar todos estos datos aislados con un LLM puede ser difícil. Además, sin las protecciones adecuadas, existe el riesgo de exponer información privada.

Implementación de RAG en entornos híbridos multicloud

F5 ha estado trabajando junto con la empresa de infraestructura de datos NetApp para resolver estos problemas. Al integrar las capacidades de red multicloud seguras y de alto rendimiento de F5 con las sólidas soluciones de gestión de datos de NetApp, hacemos posible recuperar rápidamente datos de la empresa sin importar dónde se encuentren y combinarlos de forma segura con un LLM.

Cloud Volumes ONTAP y Azure NetApp Files de NetApp optimizan los costos y el rendimiento del almacenamiento en la nube al tiempo que mejoran la protección y el cumplimiento de los datos. Cuando se combina con F5 Distributed Cloud Network Connect , los datos se pueden conectar y mover de forma rápida y segura entre zonas y regiones, independientemente de dónde estén almacenados.

A medida que las empresas buscan formas de ofrecer aplicações LLM que hagan avanzar el negocio, nuestra solución conjunta les ofrece una manera perfecta de administrar, proteger y optimizar sus datos, al mismo tiempo que reducen costos. Los datos de la empresa permanecen privados. Y los usuarios pueden obtener la información precisa, oportuna y relevante al contexto que necesitan para prosperar en la era digital.

Como lo expresó Kunal Anand, director de tecnología e inteligencia artificial de F5: «Nuestra solución conjunta ofrece un rendimiento inigualable y una seguridad férrea, lo que permite a las empresas aprovechar con confianza las capacidades de la IA en sus contextos comerciales únicos».

Aprovechando al máximo la IA empresarial

Esta asociación se basa en colaboraciones anteriores entre F5 y NetApp para ayudar a las empresas a conectar sus entornos híbridos y multicloud. Y es importante señalar que esto es sólo el comienzo. En los próximos meses, continuaremos trabajando juntos para ayudar a las empresas a capturar todo el poder de la IA en sus entornos de TI distribuidos.

Para obtener más información, lea nuestro comunicado de prensa . Visite también nuestra página web de F5 y NetApp .