O que é um LLM em linguagem simples?

Um LLM (large language model, ou modelo de linguagem de grande porte) é o tipo de inteligência artificial por trás do ChatGPT. Ele foi treinado lendo bilhões de textos da internet e aprendeu a prever qual palavra vem em seguida. Não é um banco de empresas que ele consulta: é um motor de previsão de texto que recompõe padrões de linguagem que viu no treino.

Como um modelo de linguagem decide qual marca citar?

Ele não escolhe a melhor marca, escolhe a continuação de texto mais provável. Se nos materiais que o modelo leu uma categoria aparece quase sempre ligada a alguns nomes, esses nomes têm probabilidade alta de surgir quando a categoria é mencionada. A marca citada é a que ficou mais fortemente associada àquele tipo de pergunta no texto de treino, não a que tem o melhor produto.

Por que o ChatGPT lembra de umas empresas e esquece de outras?

Porque a associação entre uma categoria e um nome depende de quanto, e de como, aquele nome apareceu no texto que o modelo leu. Marcas muito citadas em conteúdo claro e consistente ficam com uma ligação forte e surgem com facilidade. Marcas novas, pouco mencionadas ou descritas de forma confusa têm uma ligação fraca, então o modelo simplesmente não as traz para a resposta.

O que é um LLM e o que faz pela sua marca

Um LLM (large language model, ou modelo de linguagem de grande porte) é o tipo de inteligência artificial por trás do ChatGPT. A coisa mais útil que um dono de negócio pode entender sobre ele é o que ele realmente faz por baixo: prever a próxima palavra. Ele leu uma quantidade enorme de texto da internet e, a partir disso, aprendeu a continuar qualquer frase com a palavra mais provável, uma de cada vez, até montar uma resposta inteira.

Isso parece um detalhe técnico, mas é a explicação inteira de por que a sua marca aparece ou some. O modelo não tem uma lista de empresas que ele consulta para responder "qual a melhor clínica de estética em Curitiba". Ele tem padrões de linguagem aprendidos de bilhões de textos, e devolve os nomes que, naqueles textos, mais frequentemente apareciam ao lado desse tipo de pergunta. A forma como o modelo foi treinado já decidiu, em boa parte, quais marcas ele lembra. O resto deste texto é sobre o que isso significa para você.

O que é um LLM, sem o jargão de programador?

Um LLM é um programa que aprendeu a prever texto. Você dá um começo de frase, ele calcula qual palavra tem mais chance de vir depois, escreve essa palavra, e repete o processo usando o que já escreveu como novo começo. Faça isso milhares de vezes e sai um parágrafo que parece escrito por uma pessoa.

A palavra "grande" no nome (o large de large language model) não é exagero de marketing. Ela se refere a duas coisas. Primeiro, à quantidade absurda de texto que o modelo leu para aprender. Segundo, ao número de ajustes internos que ele faz para guardar o que aprendeu, na casa dos bilhões. Esses ajustes são chamados de parâmetros, e dá para pensar neles como o resumo comprimido de tudo que o modelo viu. O modelo por trás do ChatGPT é um exemplo desse tipo de sistema, o que se chama de modelo de fundação.

Vale fixar a definição, porque o resto depende dela:

Um LLM é uma inteligência artificial treinada em enormes volumes de texto para prever e gerar linguagem. Em vez de buscar uma resposta pronta, ele compõe a resposta prevendo a sequência de palavras mais provável.

A consequência prática dessa definição é o ponto que quase ninguém conta para quem toca um negócio. Como o modelo prevê a continuação mais provável, ele tende a devolver o que era comum no texto que leu. Marca comum no texto, marca provável na resposta. Marca rara no texto, marca improvável. Não há um juiz lá dentro decidendo qual empresa merece. Há um motor de probabilidade.

O que significa um modelo ser "treinado em texto da web"?

Treinar um LLM é mostrar a ele uma quantidade gigantesca de texto coletado da internet (artigos, sites, fóruns, notícias, páginas de empresa, avaliações) e deixar que ele ajuste seus parâmetros para acertar cada vez melhor qual palavra vem depois. Ninguém escreve regras à mão dizendo "quando perguntarem de café especial, cite estas marcas". O modelo extrai isso sozinho do material, observando quais nomes andam juntos com quais assuntos.

É daí que vem a vantagem das marcas muito citadas. Se um nome aparece em centenas de páginas falando de um assunto, sempre no mesmo contexto, o modelo aprende uma ligação forte entre aquele assunto e aquele nome. Quando o assunto reaparece numa pergunta, o nome tem probabilidade alta de ser a continuação. Uma marca mencionada uma vez, num texto solto, deixa uma ligação fraca, que dificilmente sobrevive à pergunta.

Esse processo tem um limite de tempo, e ele importa muito para a sua marca. O texto de treino vai até uma certa data, chamada de data de corte. O que aconteceu na web depois disso não fez parte do que o modelo aprendeu. Marca nova, mudança de nome ou de posicionamento depois dessa data podem simplesmente não existir para o conhecimento de base do modelo. Esse é metade do caminho pelo qual a IA conhece a sua empresa; o outro é a busca na web em tempo real, e a diferença entre os dois muda o que você consegue corrigir e em quanto tempo. O artigo sobre dados de treino x busca na web destrincha essa divisão.

O modelo tem um banco de dados de empresas?

Não. Essa é a confusão que está na raiz de quase todo mal-entendido sobre visibilidade em IA. Um banco de dados guarda registros que você consulta, edita e remove. O LLM não guarda os textos que leu, e não tem uma tabela de empresas com colunas de nota e preço. O que ele tem são padrões de linguagem: associações estatísticas entre palavras, conceitos e nomes, distribuídas pelos seus bilhões de parâmetros.

Pensar nele como banco de dados leva a expectativas que não se realizam. Quem trata o modelo como um cadastro acha que pode "atualizar o registro da empresa" editando o site, ou "apagar a informação errada" tirando uma página do ar. Nenhum dos dois funciona como esperado, porque não há registro para editar nem linha para apagar. O modelo aprendeu uma associação, e associação não se deleta com um clique.

A diferença na prática:

Banco de dados	LLM
Guarda registros exatos	Guarda padrões e associações
Você consulta, edita, apaga	Você só influencia o que ele lê
Resposta é o registro armazenado	Resposta é a continuação mais provável
Mudança vale na hora	Mudança vale devagar, sem garantia

Entender isso muda a estratégia inteira. Você não vai "cadastrar" a sua marca no ChatGPT. Você vai fazer com que, no texto que circula sobre você, a associação entre a sua categoria e o seu nome fique forte o bastante para ter alta probabilidade de aparecer. É um trabalho de presença e consistência, não de cadastro.

O que a minha marca controla, e o que não controla?

Vale separar nitidamente, porque a frustração quase sempre nasce de tentar mexer no lado errado.

Você não controla o passado de treino. O que a web dizia sobre você até a data de corte já entrou (ou não) no modelo, e isso está fechado para aquela versão. Se o conhecimento de base te ignora ou te descreve de forma antiga, não há edição de site que reescreva o que ele memorizou. Esse passado só se dilui quando ciclos futuros de treino aprendem uma web já corrigida, o que leva meses e não vem com promessa de data.

Você controla o que publica e o que circula sobre você a partir de agora. Isso age por dois caminhos. No modo busca, em que o modelo consulta a web na hora da pergunta, uma página clara e rastreável pode ser lida e citada em poucos dias. No modo treino, o mesmo material claro e consistente é o que vai alimentar a associação na próxima vez que um modelo for treinado. O mesmo trabalho de fundo serve aos dois ritmos.

Uma forma honesta de resumir o controle que você tem:

Sob seu controle: o que o seu site diz, com que clareza diz, se é rastreável, e que informação consistente sobre você existe em diretórios, perfis e conteúdo de terceiros.
Fora do seu controle: o que o modelo já aprendeu no treino, qual versão de modelo o usuário está usando, e a decisão final de qual nome entra na resposta.

Reconhecer o segundo grupo não é desânimo, é foco. Você não vai vencer comandando o modelo. Vai vencer melhorando o material que ele lê, que é a única alavanca real. Quando uma marca some ou aparece errada, costuma ser mais útil entender por que isso acontece no ChatGPT antes de tentar consertar no lugar que não tem conserto.

Por que o mesmo modelo responde diferente em dias diferentes?

Porque um LLM não é determinístico. Para a mesma pergunta, ele pode dar respostas diferentes em momentos diferentes, e isso é parte de como ele funciona, não um defeito. Ao prever a próxima palavra, o modelo trabalha com probabilidades e, em vez de escolher sempre a opção número um, ele sorteia entre as mais prováveis. Esse sorteio é o que dá variedade e naturalidade ao texto, e é também o que faz a resposta variar. O nome dessa propriedade é não determinismo.

Para a sua marca, isso tem uma consequência direta na hora de medir. Perguntar uma vez ao ChatGPT "quais as melhores opções de X" e tirar conclusão da resposta única é frágil: na pergunta seguinte, a lista pode mudar, sua marca pode entrar ou sair, a ordem pode girar. O sinal confiável não é uma resposta, é o padrão ao longo de várias. Uma marca que aparece em oito de dez perguntas tem presença real; uma que apareceu numa sorte de uma só não tem.

É exatamente esse padrão que a Promptis mede. Em vez de você perguntar uma vez e torcer, a plataforma repete as perguntas que importam para o seu negócio, várias vezes, e mostra com que frequência o ChatGPT cita a sua marca e em que tom. A primeira análise é grátis e não pede cartão, o que dá para ver onde você está antes de decidir o que mudar.

Entender o LLM por baixo não é curiosidade técnica. É o que separa quem briga com o modelo de quem trabalha o material que ele lê. O modelo prevê texto a partir do que circula sobre você. Mude o que circula, com clareza e consistência, e você muda, devagar mas de verdade, a probabilidade de ser a próxima palavra que ele escreve.

O que é um LLM e por que ele decide se a sua marca aparece

O que é um LLM, sem o jargão de programador?

O que significa um modelo ser "treinado em texto da web"?

O modelo tem um banco de dados de empresas?

O que a minha marca controla, e o que não controla?

Por que o mesmo modelo responde diferente em dias diferentes?

Perguntas frequentes

Leia também

O que é GEO? Generative Engine Optimization explicado

Dados de treino x busca na web: como a IA conhece sua marca