BLOG | OFICINA DEL CTO

La IA generativa y los tipos de datos emergentes impactan la arquitectura de las aplicaciones.

Miniatura de Lori MacVittie
Lori MacVittie
Publicado el 2 de abril de 2024

En 2022, noté un cambio sutil en la arquitectura de las aplicaciones que se manifestó en el mercado con discusiones sobre nuevos protocolos y datos. Esto no fue tan sorprendente, ya que, como mencioné en ese entonces, las arquitecturas de aplicaciones históricamente surgen y comienzan a dar forma a los mercados de seguridad y entrega de aplicaciones cada cinco años, y alcanzan el dominio aproximadamente cinco años después de eso.

En 2023 pensé que este cambio se haría evidente alrededor de 2025. Pero no podía prever la llegada de la IA generativa y su efecto explosivo en la evolución de estas arquitecturas.

Todo esto quiere decir que ese cambio se está produciendo más rápidamente y va a tener un efecto dramático en, bueno, todo.

Pero para no quedarnos atrapados en la evolución arquitectónica, deberíamos entender realmente qué es lo que la impulsa: los datos. 

Diferentes tipos de datos

Generalmente, cuando uno dice “datos”, quien lo escucha inmediatamente imagina filas de datos de clientes y productos almacenados en algún lugar de un RDBMS masivo. Bien, quizá no todos los oyentes, pero muchos sí. Esto se debe a que el diseño dominante de almacenamiento de datos se inclina hacia datos tabulares estructurados. Abre una hoja de cálculo y verás a qué me refiero. Se basa en filas y columnas, y un RDBMS no es realmente tan diferente.

Podríamos argumentar que existen almacenes de datos NoSQL y de valores clave, almacenes de objetos y construcciones de datos similares y, por lo tanto, las arquitecturas de aplicaciones no giran en torno a datos tabulares. Pero vamos, que realmente lo hacen. Todos esos otros tipos de almacenamiento de datos se utilizan y se emplean por buenas razones, pero la mayoría de esas razones eran auxiliares a la aplicação y, por lo tanto, no alteraron significativamente los principios arquitectónicos generales que guiaron la construcción de aplicaciones durante décadas.

Pero la creciente distribución de aplicações y modelos híbridos generan muchas necesidades. Al igual que la observabilidad y la seguridad, que exigen la generación de datos de telemetría . La distribución requiere una forma de comprender las relaciones entre los almacenes de datos distribuidos, lo que conduce a los gráficos de conocimiento. Y la IA generativa exige formas de aumentar y entrenar modelos, lo que conduce al uso de incrustaciones almacenadas en bases de datos vectoriales.

Se trata de cuatro tipos de datos muy diferentes y vienen acompañados de nuevas formas de almacenarlos y acceder a ellos. Los cuatro se están convirtiendo rápidamente en “componentes estándar” de una aplicação moderna, particularmente aquellas que están diseñadas para facilitar el uso de IA generativa. 

Cifra: Una vista básica y de alto nivel de una aplicação moderna habilitada para IA
  1. La telemetría está impulsando un cambio significativo en el aspecto operativo del mundo a medida que comprendemos que los formatos de columnas son una mejor manera de transferir y procesar datos de transmisión en tiempo real, que es lo que realmente son los datos de telemetría.
  2. Los gráficos de conocimiento y la tecnología de gráficos están aumentando para federar datos distribuidos y comprender relaciones complejas entre fuentes de datos. Esta tecnología nos trae protocolos como GraphQL que están cambiando drásticamente la forma en que aprovechamos las API para encontrar y administrar datos en toda la empresa distribuida.
  3. La creciente adopción de técnicas de generación aumentada de recuperación (RAG) para la IA generativa está impulsando a las bases de datos vectoriales como parte de la aplicação en sí, en lugar de como un almacén de datos en algún lugar más profundo de la arquitectura.
  4. Y por último, no olvidemos los datos de IA generativa. Un LLM genera nuevos datos cada vez que realizas una solicitud. Esto plantea desafíos importantes para los profesionales de seguridad, que deben descubrir cómo identificar amenazas y problemas potenciales dentro de datos no estructurados generados dinámicamente .

Son los datos, con sus diferentes formatos, protocolos, usos y aplicações, los que impulsan este cambio. El resultado es un enfoque sin cabeza que se basa en API de maneras que muchas personas nunca habían considerado antes. Es decir, las capacidades y funciones del negocio se exponen como API sin tener en cuenta la capa de presentación tradicional, lo que permite desarrollar una mayor variedad de interfaces para un conjunto más sólido de dispositivos de usuario. Las API hacen que los datos y las capacidades sean accesibles , por eso son tan importantes para la transformación digital

Vemos este enfoque en muchas aplicaciones modernas que aprovechan los microservicios. Esta es la razón por la que los marcos de UI son tan frecuentes (y generan debate en Internet). Estos marcos se utilizan para crear aplicaciones individuales que aprovechan las API para acceder a la funcionalidad y los datos. Son entidades separadas de las “aplicações” back-end que utilizan para impulsar flujos de trabajo y ofrecer valor al mercado.

Todo esto está impulsando arquitecturas sin cabeza. El cambio ya estaba en marcha, pero la llegada de la IA generativa puso de relieve la importancia crítica de los datos y lo aceleró.

Esto, a su vez, tendrá un profundo impacto en la entrega y seguridad de las aplicaciones a medida que surjan nuevas amenazas y desafíos que deben abordarse para satisfacer las necesidades de las empresas y los usuarios.