BLOG | ESCRITÓRIO DO DIRETOR DE TECNOLOGIA

Classificação e evolução da entrega de aplicações

Miniatura de Lori MacVittie
Lori MacVittie
Publicado em 18 de agosto de 2025

Se você acompanha o que escrevo há quase 20 anos, já sabe que a arquitetura da aplicação impacta profundamente a entrega da aplicação. Não se trata apenas de como as aplicações são construídas; é como elas funcionam, como escalam, como falham e, principalmente, como circulam pela infraestrutura que criamos para entregá-las. E as arquiteturas baseadas em agentes estão realmente transformando esse cenário. 

Desta vez, a evolução exigirá mais do que apenas suporte a novos protocolos ou novas capacidades de segurança. Será necessária a classificação. 

A indústria já classifica o tráfego há anos, mas focando principalmente em bloqueá-lo. Você já usou essa classificação para bloquear bots, eliminar ameaças e aplicar políticas WAF em cargas mal-intencionadas. Isso é o básico. E é para segurança que, em grande parte, a classificação tem sido reservada. 

Mas a IA está transformando o tráfego e os recursos necessários para processá-lo. E as arquiteturas de agentes? Elas não apenas mudam as regras do jogo; elas mudam o próprio jogo.

Evolução do gerenciamento de tráfego

A adoção da IA avança mais rápido do que a maioria das tecnologias já vista, e agentes já começam a operar nas empresas.

Cada POST pode ser um pedido, uma meta ou um agente de IA tentando pensar em sua pilha. Ele pode iniciar uma orquestração, ativar um fluxo de trabalho recursivo ou sobrecarregar seu backend com um prompt de 200 tokens que se expande para 20.000. E a infraestrutura? Ela ainda trata todos os POSTs da mesma forma.

Esse é o problema.

O tráfego moderno não é só tráfego; é uma tarefa, um trabalho, uma decisão. E sua capacidade de classificá-lo antes de encaminhá-lo define se seu aplicativo continua responsivo, disponível e, acima de tudo, seguro.

1. Roteamento baseado em conexão (legado)

Vamos começar pelo que você já conhece. O modelo legado de gerenciamento de tráfego, baseado no roteamento da Camada 4 (L4), ainda sustenta grande parte da Internet. Esse método usa parâmetros básicos:

  • Roteamento L4: Tomamos decisões com base em informações da camada de transporte, como endereços IP e números de porta.
  • Roteamento baseado em caminho: Inspeção limitada dos caminhos de URL, geralmente na camada de aplicação (Camada 7).
  • Pools homogêneos: Tratamos os servidores backend como idênticos, sem diferenciar pelas capacidades especializadas.
  • Balanceamento de carga: Distribuímos conexões de forma equilibrada entre os servidores para evitar sobrecarga.

Qual o problema? Esse modelo não entende o sentido de uma solicitação. Ele enxerga o tráfego como pacotes uniformes, não como tarefas variadas com necessidades distintas. No cenário atual de IA generativa, grandes modelos de linguagem (LLMs) incorporados e frameworks orientados por agentes, essa falta de percepção representa um risco crescente, pois não todo tráfego é igual.

Considere duas requisições HTTP POST:

  • Uma operação pode ser um simples CRUD (Criar, Ler, Atualizar, Excluir), como atualizar o perfil de um usuário.
  • Outro pode disparar um fluxo de trabalho complexo com vários agentes, como um ciclo de raciocínio movido por IA que realiza cinco chamadas a ferramentas subsequentes, grava dados em um banco e inicia uma tarefa prolongada de sumarização de texto.

Se sua infraestrutura trata essas solicitações da mesma forma e usa as mesmas regras de roteamento, tempos limite ou servidores de back-end, você estará correndo risco. Gargalos, falhas ou desempenho comprometido surgem quando uma tarefa intensiva de IA é tratada como uma consulta leve de banco de dados. O tráfego moderno exige um gerenciamento mais inteligente.

2. Solicitar roteamento baseado em classificação (atual/transitório)

Fazemos roteamento L7 há anos. Analisamos caminhos, inspecionamos cargas, verificamos cabeçalhos para decidir qual grupo vai receber o tráfego. Isso é roteamento baseado em conteúdo. É útil. Mas ele só revela o que o pedido contém, não por que ele existe.

Para avançar, precisamos de uma classificação baseada no contexto.

  • Opera na camada L7+, indo além da simples inspeção da carga mal-intencionada.
  • Classificamos o tráfego considerando a intenção, a complexidade e o custo.
    • Trata-se de uma tarefa de resumo ou de um login de usuário?
    • Ele é recursivo, gerado por IA ou sensível à latência?
  • Pools se diferenciam pela capacidade técnica, não apenas pelo tamanho.
  • Ao solicitar roteamento, consideramos o propósito, não apenas o formato.

É assim que evoluímos de tratar o tráfego como “conteúdo para ser entregue” para “trabalho a ser executado”. Isso permite decisões em tempo real sobre para onde você deve enviar uma solicitação, como dá prioridade a ela e quais políticas aplicam-se com base no objetivo da solicitação. Chame de baseado em intenção. Chame de atento ao contexto. O nome não importa, porque a mudança é concreta: solicitações deixaram de ser apenas transações. Estão se tornando invocações. Gatilhos. Objetivos encapsulados em HTTP.

Tudo isso se relaciona diretamente com o Top 10 de Entrega de Aplicações nº 4 (Controles de Tráfego), nº 5 (Direcionamento de Tráfego) e nº 6 (Gerenciamento de Latência). Você não consegue controlar, direcionar ou otimizar o que não consegue contextualizar.

3. Roteamento por tarefa (emergente)

É para onde estamos caminhando, especialmente com sistemas autônomos e planejadores recursivos integrados à produção. Agora, não entregamos somente conteúdo. Gerenciamos objetivos. E isso transforma tudo.

Nesse modelo, uma única solicitação nem sempre gera uma única resposta. Ela pode iniciar uma sequência de tarefas menores. Algumas dessas tarefas acontecem em paralelo. Outras dependem da conclusão de tarefas anteriores. Você não só gerencia o tráfego; você orquestra o trabalho.

Encare como um fluxo de trabalho, não apenas um pipeline. Você gerencia uma lista de passos que juntos garantem um resultado. Alguns passos podem ocorrer imediatamente; outros precisam esperar sua vez. Mas tudo deve ser coordenado, monitorado e ajustado conforme capacidade, política e carga atual.

Nesse ponto, a lógica tradicional de roteamento começa a falhar. Caminhos estáticos e políticas uniformes não bastam quando cada solicitação pode se transformar em um processo com múltiplas etapas e agentes. Você precisa de um sistema que compreenda a tarefa, o que ela exige e quem ou o que está mais apto para realizá-la, não apenas para onde enviar o pacote.

E o ponto crucial: você não consegue fazer nada disso sem classificação. Se sua infraestrutura não entender o que a solicitação busca realizar, não poderá roteá-la de forma inteligente. Isso não é um futuro distante, é a realidade que está se concretizando agora. A classificação é a ponte que nos conecta do solicitar roteamento à coordenação efetiva.

Por que isso importa

Deixe claro: não buscamos adicionar mais metadados nem criar uma tabela de roteamento mais complexa. Queremos mudar a forma como interpretamos o tráfego que já está sendo observado.

A classificação nos permite evoluir da simples reação às solicitações para compreendê-las antes de rotear, escalar ou interromper algo, tratando um loop de agente recursivo da mesma forma que uma busca por ativo estático. 

Não é mais só pela segurança. Não importa só o que está na solicitação. Importa o que a solicitação significa, o que ela quer fazer, seu impacto e o que ela interfere adiante.

É por isso que classificação não é uma tendência passageira. É uma exigência. Um passo essencial para evoluir o gerenciamento de tráfego e acompanhar o mundo que construímos: onde agentes, tarefas, fluxos de trabalho e orquestração em tempo real não são exceções, mas sim amplamente utilizados.

Você não consegue gerenciar o que não compreende. A classificação é o primeiro passo para entender.