BLOG | ESCRITÓRIO DO DIRETOR DE TECNOLOGIA

Nenhum “Modelo Único para Governar Todos” com IA Generativa

Miniatura de Lori MacVittie
Lori MacVittie
Publicado em 25 de junho de 2024

Com base nas manchetes, o OpenAI é o único jogo de IA generativa do mercado. Ela é mencionada em todas as conversas sobre IA, até mesmo nesta. Mas não é o único serviço disponível, nem é o único modelo disponível. 

Na verdade, a adoção de IA generativa para empresas não é tão homogênea quanto as manchetes podem levar você a pensar.  

Nossa pesquisa mais recente descobriu que as organizações estão, em média, operando com quase três modelos diferentes. A razão por trás dessa escolha parece ser motivada por casos de uso. 

Por exemplo, não é surpresa ver operações de segurança como um caso de uso gravitando em direção a modelos de código aberto, que podem ser treinados de forma privada sem medo de expor processos e dados corporativos confidenciais. O mesmo vale para a criação de conteúdo, que geralmente exige o compartilhamento de dados confidenciais com um modelo. Também não é surpreendente ver casos de uso de automação de fluxo de trabalho buscando serviços hospedados da Microsoft, já que muitas organizações estão fortemente acopladas às soluções da Microsoft, tanto no local quanto no Azure

Nenhum modelo atenderá a todos os requisitos técnicos e comerciais da crescente lista de IA generativa para casos de uso empresarial. 

Isso leva a alguns desafios quando se trata de entrega e segurança de aplicativos e operações gerais, pois diferentes escolhas de modelos implicam diferentes padrões de implantação. 

Padrões emergentes de implantação de IA

Há três padrões básicos de implantação surgindo. A principal diferença gira em torno da responsabilidade operacional para dimensionar serviços de inferência. Em todos os padrões, a organização é responsável pela entrega e segurança do aplicativo.    

  1. SaaS gerenciado . Em um padrão de implantação gerenciada por SaaS, os aplicativos de IA usam APIs para acessar um serviço gerenciado de IA, à la OpenAI ChatGPT. A responsabilidade operacional pela escala é do provedor.  
  2. Gerenciado pela nuvem . Os padrões implantados gerenciados na nuvem aproveitam os serviços de IA hospedados pelo provedor de nuvem. Esses serviços ainda são acessados por meio de uma API, mas podem ser privados para a empresa ou compartilhados. Os próprios aplicativos de IA também podem estar na nuvem pública ou no local. Quando o serviço é privado, a empresa assume a responsabilidade de dimensionar os serviços de inferência, o que pode ser um desafio, pois a maioria das organizações tem pouca experiência em dimensionar grandes modelos de linguagem. Quando o serviço é compartilhado, as organizações transferem a responsabilidade para o provedor de nuvem, mas devem considerar fatores como cotas e custos baseados em tokens como parte de suas operações. 
  3. Autogerenciado . Os modelos de código aberto têm maior probabilidade de serem implantados em um padrão autogerenciado, tanto na nuvem pública quanto no local. Os modelos podem ser acessados via API ou diretamente por meio de um aplicativo. Nesse padrão, as organizações assumem total responsabilidade por dimensionar, proteger e monitorar os serviços de inferência. 

(Para um mergulho mais profundo nesses padrões, você pode conferir este blog de Chris Hain)

Existem vários provedores que hospedam modelos de código aberto para dar suporte a um padrão gerenciado de SaaS e muitos provedores de nuvem que também oferecem código aberto como serviço.

Os modelos OpenAI não estão disponíveis apenas em um padrão gerenciado por SaaS via OpenAI, mas como um padrão gerenciado em nuvem via Microsoft. Mistral, um modelo popular de código aberto, pode ser implantado em todos os três padrões. É por isso que vemos o caso de uso como o principal motivador da escolha do modelo, já que as empresas podem escolher misturar e combinar, por assim dizer, modelos e padrões de implantação.

As organizações já estão sentindo a pressão com relação às habilidades necessárias não apenas para treinar modelos, mas também para operá-los e protegê-los. Portanto, combinar modelos por caso de uso faz mais sentido para muitas organizações com conhecimento operacional limitado. Concentrar recursos nos casos de uso que não podem, por razões de segurança ou privacidade, ser implantados em padrões compartilhados resultará, em última análise, nos melhores resultados.   

Cuidado com a miopia operacional

Mas cuidado com o perigo da miopia operacional, que pode levar à formação de silos dentro da organização. Já vimos isso acontecer com a computação em nuvem e sem dúvida veremos isso novamente com a IA generativa para empresas. Mas, estando cientes do perigo de isolar as operações e a segurança por modelo, espera-se que as organizações evitem a complexidade e o risco que isso acarreta e escolham estrategicamente modelos e padrões de implantação que aproveitem ao máximo os recursos operacionais, capacidades e orçamentos. 

Estamos no começo e, quando você ler isto, sem dúvida haverá novos provedores e novos modelos com novos recursos. Mas os padrões de implantação permanecerão basicamente os mesmos, o que permite um planejamento mais estratégico com relação às operações — desde orçamentos até pessoal e serviços de aplicativos que você precisará para proteger e dimensionar quaisquer modelos que escolher.