Com base nas manchetes, o OpenAI é o único jogo de IA generativa do mercado. Ela é mencionada em todas as conversas sobre IA, até mesmo nesta. Mas não é o único serviço disponível, nem é o único modelo disponível.
Na verdade, a adoção de IA generativa para empresas não é tão homogênea quanto as manchetes podem levar você a pensar.
Nossa pesquisa mais recente descobriu que as organizações estão, em média, operando com quase três modelos diferentes. A razão por trás dessa escolha parece ser motivada por casos de uso.
Por exemplo, não é surpresa ver operações de segurança como um caso de uso gravitando em direção a modelos de código aberto, que podem ser treinados de forma privada sem medo de expor processos e dados corporativos confidenciais. O mesmo vale para a criação de conteúdo, que geralmente exige o compartilhamento de dados confidenciais com um modelo. Também não é surpreendente ver casos de uso de automação de fluxo de trabalho buscando serviços hospedados da Microsoft, já que muitas organizações estão fortemente acopladas às soluções da Microsoft, tanto no local quanto no Azure .
Nenhum modelo atenderá a todos os requisitos técnicos e comerciais da crescente lista de IA generativa para casos de uso empresarial.
Isso leva a alguns desafios quando se trata de entrega e segurança de aplicativos e operações gerais, pois diferentes escolhas de modelos implicam diferentes padrões de implantação.
(Para um mergulho mais profundo nesses padrões, você pode conferir este blog de Chris Hain)
Existem vários provedores que hospedam modelos de código aberto para dar suporte a um padrão gerenciado de SaaS e muitos provedores de nuvem que também oferecem código aberto como serviço.
Os modelos OpenAI não estão disponíveis apenas em um padrão gerenciado por SaaS via OpenAI, mas como um padrão gerenciado em nuvem via Microsoft. Mistral, um modelo popular de código aberto, pode ser implantado em todos os três padrões. É por isso que vemos o caso de uso como o principal motivador da escolha do modelo, já que as empresas podem escolher misturar e combinar, por assim dizer, modelos e padrões de implantação.
As organizações já estão sentindo a pressão com relação às habilidades necessárias não apenas para treinar modelos, mas também para operá-los e protegê-los. Portanto, combinar modelos por caso de uso faz mais sentido para muitas organizações com conhecimento operacional limitado. Concentrar recursos nos casos de uso que não podem, por razões de segurança ou privacidade, ser implantados em padrões compartilhados resultará, em última análise, nos melhores resultados.
Mas cuidado com o perigo da miopia operacional, que pode levar à formação de silos dentro da organização. Já vimos isso acontecer com a computação em nuvem e sem dúvida veremos isso novamente com a IA generativa para empresas. Mas, estando cientes do perigo de isolar as operações e a segurança por modelo, espera-se que as organizações evitem a complexidade e o risco que isso acarreta e escolham estrategicamente modelos e padrões de implantação que aproveitem ao máximo os recursos operacionais, capacidades e orçamentos.
Estamos no começo e, quando você ler isto, sem dúvida haverá novos provedores e novos modelos com novos recursos. Mas os padrões de implantação permanecerão basicamente os mesmos, o que permite um planejamento mais estratégico com relação às operações — desde orçamentos até pessoal e serviços de aplicativos que você precisará para proteger e dimensionar quaisquer modelos que escolher.