Quais otimizações técnicas aumentam a chance de ser citado por IAs?

As principais são: implementar JSON-LD com os schemas Article, Organization e FAQPage; estruturar headings como perguntas reais sem pular níveis; escrever definições standalone que fazem sentido fora de contexto; e incluir dados com fonte e data no corpo do texto. Juntas, essas práticas tornam o conteúdo mais extraível por modelos de linguagem.

llms.txt é uma proposta de arquivo de texto simples, colocado na raiz do site (como /llms.txt), que descreve o propósito do site e indica quais páginas são mais relevantes para consulta por LLMs. Não é um padrão oficial adotado pelos principais modelos, mas pode ser implementado hoje como sinal de intenção para crawlers de IA que o reconheçam.

Dados estruturados (JSON-LD) realmente fazem diferença para ser citado por IAs?

Sim. O JSON-LD é o formato preferido pelo Google para dados estruturados e é lido por crawlers de IA como sinal de credibilidade e tipo de conteúdo. Schemas como Article, FAQPage e Organization ajudam o modelo a entender quem é a fonte, o que o conteúdo representa e quais perguntas ele responde.

Quanto tempo leva para as otimizações técnicas de GEO surtirem efeito?

Não há prazo garantido. Dados estruturados e ajustes de hierarquia costumam ser indexados em dias ou semanas, mas o impacto na citação por IAs depende dos ciclos de treinamento e atualização de cada modelo, que podem levar meses. O que se pode afirmar é que um site sem essas otimizações tem desvantagem estrutural em relação a um que as aplica.

GEO técnico & conteúdo

GEO técnico (Generative Engine Optimization técnico) reúne as otimizações de site que aumentam a probabilidade de uma IA generativa citar sua marca. O checklist cobre quatro frentes: dados estruturados (JSON-LD), hierarquia de conteúdo, sinais de citabilidade no texto e um conceito emergente chamado llms.txt.

Se o seu site não tiver esses elementos, as IAs podem até conhecer seu negócio, mas vão preferir citar fontes que comunicam melhor o que fazem.

O que é GEO técnico e por que ele difere do SEO convencional?

GEO técnico é o conjunto de práticas de estrutura e marcação que tornam um site legível e citável por modelos de linguagem generativos. Ele é diferente do SEO convencional em um ponto central: o SEO resolve a exibição de links para humanos que buscam; o GEO técnico resolve a extração de informação por sistemas que sintetizam respostas.

Como os LLMs "leem" um site

Um modelo de linguagem que usa busca web (como o ChatGPT com Busca, o Perplexity ou o Google com AI Overview) não lê o HTML do jeito que um humano lê. Ele extrai blocos: o título, a descrição, os headings, as definições no início dos parágrafos, as listas e os dados estruturados no JSON-LD. Tudo que não cabe nessa extração tende a ser ignorado.

O que isso significa na prática: se sua página tem a resposta certa mas enterrada no quinto parágrafo de uma introdução genérica, a probabilidade de extração cai. Se a resposta está nas primeiras frases, com a entidade bem nomeada e o contexto explícito, a extração é direta.

A relação entre rastreabilidade técnica e citação

Um site que o crawler de IA não consegue rastrear não existe para o modelo. O básico do SEO técnico (velocidade, ausência de bloqueios no robots.txt para bots legítimos, links funcionais) é pré-requisito do GEO técnico. A diferença é que o GEO vai além: depois de rastreável, o site precisa ser extraível.

Dados estruturados (JSON-LD): por que são a base do GEO técnico?

JSON-LD (JavaScript Object Notation for Linked Data) é um formato de marcação que declara ao crawler o que o conteúdo representa. O Google o usa para rich results; modelos de IA o usam como sinal de credibilidade e tipo de conteúdo. É o atalho mais direto para comunicar "este texto é um artigo sobre X, escrito por Y, publicado em Z" sem depender de inferência.

Saiba mais sobre como implementar JSON-LD com o artigo Dados estruturados ainda são a vitória mais barata.

Quais schemas têm maior impacto

Para a maioria dos sites de conteúdo, três schemas respondem pela parcela maior do ganho em GEO:

Schema	Para que serve	Impacto para GEO
`Article`	Declara que a página é um artigo com autor, data e publisher	Alto: o modelo sabe que é uma fonte editorial com data verificável
`FAQPage`	Lista pares pergunta/resposta em formato extraível	Alto: IAs extraem FAQs diretamente para responder perguntas curtas
`Organization`	Declara nome, URL, logo e descrição da empresa	Médio: ancora a entidade da marca para o modelo

Para e-commerce, adicione Product com Review e AggregateRating. Para negócios locais, LocalBusiness com endereço e telefone. O artigo Schema.org para GEO: quais tipos usar detalha o critério de seleção por tipo de site, para você não implementar tudo sem necessidade.

Como implementar Article, FAQPage e Organization

O ponto de partida é colocar os blocos JSON-LD no <head> da página, dentro de uma tag <script type="application/ld+json">. Plataformas como WordPress têm plugins (Yoast SEO, Rank Math) que geram parte disso automaticamente; para sites custom ou Next.js, o código vai na camada de renderização do <head>.

Exemplo de Article mínimo:

{
  "@context": "https://schema.org",
  "@type": "Article",
  "headline": "Título do artigo",
  "datePublished": "2026-06-01",
  "dateModified": "2026-06-01",
  "author": {
    "@type": "Organization",
    "name": "Promptis"
  },
  "publisher": {
    "@type": "Organization",
    "name": "Promptis",
    "url": "https://promptis.com.br"
  }
}

O FAQPage é declarado em conjunto quando a página tem uma seção de perguntas e respostas:

{
  "@context": "https://schema.org",
  "@type": "FAQPage",
  "mainEntity": [
    {
      "@type": "Question",
      "name": "O que é GEO técnico?",
      "acceptedAnswer": {
        "@type": "Answer",
        "text": "GEO técnico reúne as otimizações de site que aumentam a probabilidade de uma IA generativa citar sua marca."
      }
    }
  ]
}

Exemplo prático de JSON-LD para um negócio brasileiro

Uma consultoria de marketing em São Paulo que quer aparecer nas respostas do ChatGPT quando alguém pergunta "quais as melhores consultorias de marketing em SP" precisa, no mínimo, de um LocalBusiness com addressLocality: "São Paulo" e areaServed declarado. Sem isso, o modelo não tem como associar geograficamente a empresa à query local.

Como a hierarquia de headings afeta a citação por IAs?

Headings são, para um modelo de linguagem, o mapa do conteúdo. Cada H2 funciona como um sinal de "aqui começa uma resposta para esta pergunta". Se o heading é vago ("Saiba mais", "Conclusão", "Introdução"), o modelo não consegue usá-lo como âncora de resposta.

A regra do H1 único e da hierarquia sem furos

Num documento HTML bem formado para GEO:

Existe um único H1, que é o título principal da página.
Os H2 introduzem seções independentes.
H3 só aparece dentro de um H2 pai. Nunca existe H3 sem H2.
Não há saltos (H1 direto para H3, por exemplo).

Essa hierarquia tem impacto duplo: o SEO convencional já a premiava como sinal de estrutura; os modelos de IA dependem dela para atribuir relevância ao trecho.

Headings como perguntas reais

"O que é GEO técnico e por que ele difere do SEO convencional?" funciona melhor do que "GEO técnico vs SEO" porque é exatamente como uma pessoa formularia a pergunta a um chatbot. Quando o heading replica a query, a extração pelo modelo é direta.

A regra prática: escreva o heading como você digitaria a pergunta no ChatGPT. Se soar artificial, reformule.

O que é llms.txt e para que serve?

llms.txt é uma proposta de arquivo de texto simples colocado na raiz de um site (em /llms.txt), no mesmo espírito do robots.txt. O objetivo é fornecer às IAs um contexto compacto sobre o propósito do site e uma lista das páginas mais relevantes para consulta.

A proposta foi apresentada por Jeremy Howard (fast.ai) em 2024 e documentada em llmstxt.org. Não é um padrão adotado pelos principais modelos (nem o ChatGPT nem o Gemini publicaram suporte oficial até junho de 2026). Ainda assim, alguns crawlers de IA já o reconhecem, e a implementação leva menos de 30 minutos.

Conceito e proposta

Um arquivo llms.txt típico tem esta estrutura:

# Nome do Site

> Descrição em uma ou duas frases do que o site faz.

## Páginas relevantes

- [Página principal](https://seusite.com.br/)
- [Sobre](https://seusite.com.br/sobre)
- [Serviços](https://seusite.com.br/servicos)

O raciocínio por trás da proposta: crawlers de IA têm janela de contexto limitada. Um arquivo que já resume o site e indica as páginas mais importantes reduz o esforço de extração.

O que você pode fazer hoje sem esperar padronização

Criar o arquivo não tem custo e não prejudica em nada. A versão mínima:

Crie o arquivo /llms.txt na raiz do seu domínio.
Inclua nome, descrição de uma frase e a lista das páginas mais úteis para quem pergunta sobre o seu negócio.
Não coloque links para páginas de login, carrinho ou termos de uso. Essas páginas não respondem perguntas.

O ganho imediato é a disciplina: escrever o llms.txt obriga você a articular em uma frase o que o seu site faz, o que muitas vezes revela gaps de clareza no próprio conteúdo. O tutorial de como criar o llms.txt passo a passo traz o formato completo, um exemplo pronto e o estado de adoção atualizado.

Conteúdo citável: o que as IAs procuram no texto?

Além da marcação técnica, o conteúdo em si precisa ter propriedades que facilitam a extração. Dados estruturados ajudam o modelo a encontrar a página; o conteúdo citável determina se o modelo vai usar aquela página como fonte.

Definições standalone

Uma definição standalone é uma frase que responde a pergunta "o que é X?" de forma completa e autossuficiente, sem depender do parágrafo anterior para fazer sentido.

Ruim (depende de contexto):

"Como vimos acima, esse processo..."

Bom (autossuficiente):

"GEO técnico é o conjunto de otimizações de estrutura e marcação que tornam um site extraível por modelos de linguagem generativos."

Modelos de IA extraem definições literalmente. Se a definição precisar de contexto anterior para fazer sentido, ela não será citada corretamente.

Dados com fonte e data

Uma afirmação factual sem fonte e data é, para o modelo, de confiabilidade desconhecida. O padrão que aumenta a probabilidade de citação:

"Segundo a documentação do Google Search Central (2024), JSON-LD é o formato recomendado para dados estruturados, preferido pelo Googlebot em relação a Microdata e RDFa."

A data importa porque modelos de linguagem avaliam atualidade antes de citar. Um dado de 2020 sem data explícita compete em desvantagem com um dado de 2024 datado.

Estrutura que as IAs conseguem extrair

Listas com marcadores e tabelas são os formatos mais extraíveis. Quando você tem quatro ou mais itens comparáveis, uma tabela comunica a estrutura de uma vez. Uma lista com bullet points comunica sequência ou conjunto.

O que não extrai bem: parágrafos densos de mais de seis linhas sem quebra; informação importante em rodapé ou nota entre parênteses no meio de uma frase; conclusões que dependem do artigo inteiro para fazer sentido.

Como auditar o GEO técnico do seu site?

O checklist abaixo cobre os itens mais impactantes. Use como base de auditoria. Antes de rodar, garanta o pré-requisito: se o robots.txt bloqueia os crawlers de IA (como o GPTBot), nada do resto importa, porque o modelo não cita o que não consegue ler. O artigo como deixar seu site rastreável pelos crawlers de IA cobre esse portão de entrada.

Dados estruturados

JSON-LD com Article (ou LocalBusiness/Product conforme o caso) presente em todas as páginas de conteúdo
FAQPage em todas as páginas que têm seção de perguntas e respostas
Organization no homepage com nome, URL e logo
Nenhum erro no Rich Results Test do Google

Hierarquia e headings

Um único H1 por página
Hierarquia H2/H3 sem pulos
Pelo menos metade dos H2 formulados como perguntas reais
Nenhum heading genérico ("Introdução", "Conclusão", "Saiba mais")

Conteúdo citável

Resposta direta à pergunta principal nas primeiras duas frases do artigo
Definições standalone para os conceitos centrais
Dados com fonte e data no corpo do texto
Listas e tabelas para conjuntos de três ou mais itens comparáveis

Sinais auxiliares

Arquivo /llms.txt criado com descrição e lista de páginas relevantes
robots.txt não bloqueia bots de IA que seguem o arquivo (GPTBot, Googlebot, ClaudeBot)
Velocidade de carregamento dentro dos Core Web Vitals (LCP abaixo de 2,5 segundos)

Para uma auditoria completa de GEO do seu site, a Promptis (plataforma de GEO para empresas brasileiras) gera um relatório com pontuação por fator e priorização de melhorias.

Para entender como o AI Overview do Google usa essas otimizações nas respostas, veja O que é AI Overview do Google e o que muda na busca.