Três regras de estrutura impactam mais a leitura da sua página por crawlers de IA do que qualquer outra: um único H1 por página, H2 formulados como perguntas reais e hierarquia sem pulos, com H3 aparecendo só dentro de uma seção H2. Essas regras não são sobre estética nem sobre colocar palavra-chave no título. Elas existem porque a IA usa a árvore de headings como o mapa do documento, e um mapa confuso faz o conteúdo certo passar despercebido.
Este artigo trata da arquitetura do documento, do esqueleto, não do estilo das frases. Se o seu interesse é a prosa em si (resposta direta no topo, voz ativa, ausência de enrolação), o lugar certo é como escrever conteúdo que as IAs escolhem citar. Aqui o foco é como os títulos organizam o que você escreveu para uma máquina conseguir ler.
Como a IA usa os headings de uma página?
A IA não lê a sua página como uma pessoa lê, do começo ao fim. Antes de processar ou guardar o conteúdo, ela quebra o texto em pedaços menores. Esse processo de divisão se chama fragmentação, ou chunking: a página inteira vira uma coleção de blocos, e cada bloco é tratado quase como um documento independente.
Os headings são as linhas de corte naturais desse processo. Um H2 sinaliza o início de um novo assunto, e o parser usa essa marca para separar uma passagem da seguinte. Quando a estrutura é limpa, cada fragmento sai coerente: um título de seção seguido do conteúdo que pertence a ele. Quando a estrutura é bagunçada, os cortes caem no lugar errado e você acaba com pedaços que misturam dois assuntos ou que perdem o contexto de qual seção pertencem.
Por que a IA precisa fragmentar o conteúdo?
Modelos de linguagem trabalham melhor com trechos focados do que com a página inteira de uma vez. Na hora de responder uma pergunta, a IA não quer reprocessar dez mil palavras, ela quer encontrar o pedaço específico que resolve aquela dúvida. Por isso o conteúdo é quebrado e indexado em blocos: na hora da consulta, a busca acontece bloco a bloco, não página por página.
A consequência prática é direta. Um bloco que só faz sentido se você leu o parágrafo anterior vira um fragmento órfão depois do corte. Se a sua definição mais importante depende da frase de cima para fazer sentido, ela pode ser fragmentada longe daquela frase e perder o significado. Conteúdo com blocos autossuficientes, uma definição completa por parágrafo, uma resposta inteira por seção, sobrevive melhor à fragmentação.
Como a IA escolhe qual fragmento usar na resposta?
Aqui entra a segunda metade da história, e é a parte que explica por que o texto do heading importa tanto. A IA não compara a pergunta do usuário com os seus fragmentos procurando as mesmas palavras. Ela compara por significado.
Para isso, cada fragmento é convertido em uma representação numérica do seu sentido, chamada de embedding. A pergunta do usuário também vira um embedding. Recuperar o conteúdo certo é, no fundo, achar os fragmentos cujo significado fica mais perto do significado da pergunta nesse espaço numérico. É por isso que uma página pode ser citada para uma pergunta que não usa nenhuma das suas palavras exatas: o que conta é a proximidade de sentido, não a coincidência de termos.
Um heading que expressa com clareza do que a seção trata produz um embedding nítido, fácil de aproximar da pergunta certa. Um heading vago como "Mais detalhes" produz um sinal embaçado, que não chega perto de nada em particular. O título da seção é uma das pistas mais fortes que a IA tem sobre o assunto daquele bloco, e essa pista vira parte do cálculo de relevância.
Por que ter um único H1 por página?
O H1 é o título do documento inteiro, a declaração de qual é o assunto principal da página. Ter mais de um H1 manda dois sinais concorrentes sobre o tema central, e o crawler precisa adivinhar qual deles vale. Essa ambiguidade enfraquece a leitura de qual é, afinal, o tópico da página.
A regra é simples: um H1, sempre, e ele descreve o conteúdo da página inteira. Todo o resto desce a partir dele. No blog da Promptis, o H1 sai do título do artigo no frontmatter, então a página já nasce com exatamente um. Em sites montados à mão, o erro comum é usar H1 para estilizar texto grande em mais de um lugar. O tamanho da fonte é trabalho do CSS, não do nível do heading.
Como transformar um heading genérico em pergunta real?
Um heading como "Benefícios do produto" descreve um tópico. Um heading como "Quais são os benefícios do produto?" descreve uma pergunta, e pergunta é exatamente o formato em que as pessoas falam com chatbots. Quando alguém digita "quais são os benefícios de X" no ChatGPT, um heading escrito nessa mesma forma tem o significado muito mais próximo da consulta, e a seção inteira vira candidata direta a virar resposta.
O exercício é mecânico: para cada H2 do seu texto, pergunte que palavras alguém digitaria no chatbot para querer saber aquilo. Essa frase é o seu heading.
| Heading genérico | Heading como pergunta real |
|---|---|
| Estrutura de preços | Quanto custa e como funciona a cobrança? |
| Integrações disponíveis | Com quais ferramentas o produto se integra? |
| Sobre a entrega | Em quanto tempo o pedido chega? |
| Política de troca | Como faço para trocar um produto? |
Não é preciso forçar todo heading para o formato de pergunta. Alguns títulos descritivos funcionam bem, e uma página só com pergunta atrás de pergunta cansa. A meta é que a maior parte dos H2 reflita a forma como o usuário realmente pergunta, porque isso aproxima o significado da seção das consultas que você quer atender. Esse alinhamento com a intenção de busca é o que faz a seção ser recuperada.
Por que pular níveis de heading quebra a estrutura?
A hierarquia de headings forma uma árvore. O H1 é a raiz, os H2 são os galhos principais, e os H3 são os ramos que saem de um galho. O parser usa essa árvore para atribuir cada bloco de texto ao seu contexto: este parágrafo pertence a este H3, que pertence a este H2, que pertence ao H1 da página.
Pular de um H2 direto para um H4 arranca um nível da árvore. O parser fica sem o galho intermediário e tem que adivinhar onde aquele H4 se encaixa. O efeito é o mesmo de um sumário com um item recuado no lugar errado: a relação de "pertence a" fica ambígua, e o bloco pode ser ligado ao contexto errado na hora da fragmentação. A regra que evita isso: desça os níveis um de cada vez (H2 depois de H1, H3 depois de H2) e nunca suba para um nível que não foi aberto antes.
Quando usar H3 e quando não é preciso?
O H3 serve para subtópicos dentro de uma seção H2, quando aquela seção é grande o bastante para ter partes distintas que valem um título próprio. Se uma seção H2 responde sua pergunta em três parágrafos diretos, não force um H3 ali. Hierarquia profunda demais fragmenta a leitura sem necessidade e cria seções curtas demais para responder qualquer coisa sozinhas.
A profundidade certa acompanha a complexidade do assunto, não uma fórmula. Uma página simples pode viver inteira com H1 e H2. Um guia denso justifica H3, e raramente um H4. Passou disso, vale revisar se a página não está tentando cobrir coisas demais de uma vez. Em quase todo caso, parar no H3 é suficiente.
Como a estrutura de headings se encaixa no GEO técnico?
A árvore de headings é uma das dimensões da auditoria técnica de uma página para IA, ao lado de coisas como rastreabilidade e marcação no código. Ela age sobre o "como o conteúdo é organizado", enquanto os dados estruturados agem sobre o "como o conteúdo é descrito para a máquina". As duas frentes se somam: headings limpos ajudam a IA a fragmentar e recuperar; o schema ajuda a IA a entender o que cada coisa é. Para o quadro completo das peças técnicas que compõem uma página citável, o guia de GEO técnico reúne tudo num lugar só.
Estrutura ajuda a sua página a ser lida e recuperada, mas não substitui ter conteúdo que mereça ser citado. A autoridade no tema continua sendo construída pela qualidade e profundidade do que você diz. Headings bem feitos garantem que esse conteúdo bom não se perca por um problema de arquitetura, o que é a parte mais controlável e barata de resolver.
A Promptis ajuda nesse diagnóstico: a auditoria de site verifica a estrutura das suas páginas, incluindo a hierarquia de headings, e aponta onde a organização atrapalha a leitura por IA. A primeira análise é gratuita, e serve para enxergar onde o esqueleto do seu conteúdo está claro e onde está embaçado para um crawler.


