Los rumores sobre inteligencia artificial generativa (GenAI) provienen de todas partes. La pregunta es ¿qué es lo que se está popularizando? ¿Cómo está haciendo del mundo un lugar mejor? ¿Dónde está el valor del negocio? Estas preguntas son igualmente relevantes cuando se consideran los desafíos que enfrentan las organizaciones que están decidiendo si implementar GenAI en sus operaciones (AIOps) y cuándo hacerlo. Basándome en mi último año de experimentos con IA generativa y en mi amplia exposición a las tendencias de la industria durante mi investigación diaria en F5, ofrezco las siguientes cinco conclusiones para ayudar a guiar a las organizaciones que buscan comprender el impacto de GenAI en las prácticas de datos operativos. Como resultado, estas organizaciones estarán mejor posicionadas para alinear los cronogramas de adopción de la tecnología GenAI con sus presupuestos, prácticas y culturas existentes.
Los datos operativos son una mezcolanza de datos semiestructurados (objetos) y conjuntos de datos no estructurados. Los modelos de lenguaje grandes (LLM) son bastante flexibles y efectivos con esta gama de formatos de datos. Esto hace que los LLM sean una tecnología perfecta para analizar conjuntos de datos operativos. Las organizaciones pueden realizar una variedad de experimentos y evaluaciones internamente para verificar la eficacia, la facilidad de uso y el costo de varias soluciones habilitadas para GenAI. El uso de la inferencia LLM para detectar patrones de datos interesantes con menos falsos positivos alinea la velocidad y la escala de las máquinas con los objetivos de los equipos que consumen flujos de datos operativos.
Las organizaciones que se centran en saber qué técnicas utilizan qué modelos para sus tareas específicas no tienen que construir sus propios modelos. Por ejemplo, el reconocimiento de entidades nombradas (NER) es una rama del procesamiento del lenguaje natural (NLP) que está demostrando ser una técnica eficaz para establecer elementos clave dentro de datos semiestructurados. Un ejemplo de NER podría ser una lista que incluya una categoría como los días de la semana o una descripción como números enteros mayores que 1 y menores que 5. El resultado es una mayor precisión durante la inferencia que las técnicas de comparación de patrones basadas en reglas que no son compatibles con GenAI. A medida que la investigación y la práctica del uso de técnicas como NER continúan avanzando, los equipos de operaciones pueden centrar su atención en aprovechar las técnicas que han demostrado ser exitosas, en lugar de construir modelos.
Ejemplo de NER: Entidad nombrada: Días de la semana Lista: Domingo, lunes, martes, miércoles, jueves, viernes, sábado
La gravedad de los datos es una fuerza subyacente que influye en las decisiones sobre si ubicar el procesamiento más cerca de donde se crean los datos o mover los datos más cerca de donde ya está implementado el procesamiento. Cuanto mayor sea el volumen de datos, mayor será la fuerza gravitacional, lo que da como resultado una mayor capacidad de procesamiento cuanto más cerca esté de ellos. Para el entrenamiento (creación y ajuste de modelos), los datos se agregan y se acercan al área de procesamiento. Para inferir (usando modelos), el modelo se acerca al lugar donde se emite la solicitud.
Si se accede a un modelo mediante una copia interna (en lugar de llamar a la API de una instancia alojada por un tercero), tiene sentido acercar el modelo al mensaje y/o a cualquier conjunto de datos privados adicionales vectorizados como parte del mensaje. Por otro lado, si el modelo está alojado por un Si un tercero expone su API a través de Internet, el modelo y las operaciones de inferencia no se mueven en absoluto. En estos casos, los vectores de datos privados y de inferencia se pueden mover a una ubicación “cercana a la red” mediante una interconexión de colocación de centro de datos o intentando hacer coincidir las ubicaciones de alojamiento con el proveedor del modelo, si es posible.
El conocimiento de las fuerzas que unen los datos y los cálculos, así como de aquellas que los separan, ayuda a tomar decisiones informadas en la búsqueda del equilibrio adecuado entre costo y rendimiento.
Con el procesamiento de GenAI, es más importante que nunca romper los silos de datos para simplificar y acelerar el análisis de datos operativos. Sin embargo, en el futuro previsible, parece que los silos de datos seguirán existiendo, o incluso proliferarán.
La pregunta es más bien cómo abordar los silos de datos y qué opciones tecnológicas elegir. En términos de acceder a datos almacenados en múltiples ubicaciones, las opciones son copiar y mover los datos o implementar una capa de datos lógica que utilice consultas federadas sin mover los datos. Independientemente de la elección que se haga, reconocer las fuentes de datos de transmisión que existen y evaluar los casos de uso operativos en busca de restricciones de tiempo y frescura de datos lo ayudará a seleccionar los elementos necesarios de su pila de tecnología de datos, como motores de transmisión, motores de consulta, formatos de datos y catálogos. La elección de tecnología brinda a los equipos de datos el poder de elegir las tecnologías más efectivas y fáciles de usar, equilibrando el rendimiento y el costo. Lo ideal es que la práctica de datos de una organización madure con el tiempo, pero siempre le brinde a la organización la flexibilidad de elegir lo que funciona mejor para ella en una etapa determinada de madurez.
Cuando las soluciones agregan automatización, escalan al convertir el conocimiento tácito de los expertos en privacidad de datos y SecOps en una práctica repetible habilitada por AIOps que puede ser ejecutada por máquinas. Sólo entonces los equipos de datos, seguridad y privacidad tendrán tiempo para agregar inteligencia. La inteligencia mejora la eficacia de las políticas al definir con mayor precisión cómo, por cuánto tiempo y con qué propósito se pueden usar datos específicos, quién los puede usar, todo ello mientras se rastrea dónde se encuentran los datos, qué copias se hacen y con quién se comparten. Esto libera tiempo para la planificación estratégica, la evaluación de nuevas tecnologías y la comunicación con la empresa para perfeccionar las políticas de acceso a datos y aprobar excepciones.
La velocidad, la escala y la automatización son características de una práctica de AIOps madura, que conducen a mejores resultados, decisiones más rápidas y capital humano optimizado. GenAI está abriendo puertas que la tecnología no ha podido abrir… hasta ahora. Los cinco aprendizajes anteriores brindan algunos indicadores que las operaciones de TI, las operaciones de seguridad y las operaciones de privacidad deben tener en cuenta a medida que estos equipos implementan GenAI en sus AIOps. Los modelos de IA, la proximidad del procesamiento a los datos operativos, los datos y la automatización proporcionan piezas clave de la nueva plataforma AIOps. Dentro de este rico entorno de aprendizaje, las organizaciones pueden construir la cultura y las prácticas de las operaciones tecnológicas para la generación actual y las futuras.
Para profundizar en el impacto de la IA generativa en los datos, lea el último informe del Índice de madurez empresarial digital de F5.