Confira alguns motivos pelos quais o Google pode não indexar um conteúdo e o que você pode fazer para reverter esse quadro.
Este post é uma tradução do material Why doesn’t Google index my content properly?, publicado originalmente no blog da Yoast. Tradução e publicação autorizadas pela empresa.
Antes que o Google possa classificar seu conteúdo, ele precisa descobri-lo, ter permissão e capacidade para avaliá-lo e indexá-lo. Se algum desses processos falhar, suas páginas podem não aparecer nos resultados de pesquisa.
Na maioria das vezes, você pode contar com o Google para indexar seu conteúdo corretamente, de forma automática. Afinal, esse processo é uma das partes fundamentais do que o Google é e faz. No entanto, simplesmente colocar seu conteúdo online nem sempre é suficiente.
Se você tiver problemas técnicos, conteúdo de baixa qualidade ou controles de indexação incorretos, você pode se deparar com problemas durante esses processos de descoberta, avaliação e indexação.
Descoberta
Para indexar uma página, o Google precisa encontrá-la. Isso significa que ela deve estar vinculada em algum lugar — seja a partir de outras páginas indexadas no mesmo site ou de outros sites.
Dependendo da relevância e qualidade dos lugares de onde ela está vinculada, pode levar algum tempo para que o Google programe o seguimento desses links e encontre suas páginas. Isso também significa que a página não pode estar “oculta” — o que, por exemplo, pode significar conteúdo protegido por senha, bloqueado via robots.txt ou disponível apenas para usuários de certos países.
Avaliação
Quando o Google descobre a página, ele analisa o conteúdo (incluindo o código HTML e recursos relacionados) para avaliar a qualidade e relevância.
Durante esse processo, existem várias razões pelas quais o Google pode optar por não indexar uma página. Elas incluem:
- Quando o Google determina que o conteúdo da página é de “baixa qualidade”. Por exemplo, se há uma contagem de palavras muito baixa, ou se o conteúdo é uma duplicata próxima/direta de outra página. Páginas particularmente “superotimizadas” ou “spam” também podem ser ignoradas.
- Quando ele descobre instruções específicas de indexação na página (como uma meta tag de robots ou uma tag de URL canônica apontando para outra página). O Google fará uma avaliação nesses casos para decidir se deve ou não seguir as instruções, mas as chances são de que ele escolha não incluir a página.
- Quando ele não consegue ver/acessar o conteúdo. Para sites que dependem muito de JavaScript ou que incluem conteúdo de maneiras complexas ou não padrão, o Google pode não conseguir consumir o conteúdo da página. Pode ser que, para eles, seja uma página vazia (ou de baixa qualidade).
- Quando há processamento pesado de JavaScript, o Google pode agendar uma “crawling de acompanhamento” para analisar mais profundamente antes de decidir se deve ou não indexar. O tempo que isso leva pode variar consideravelmente, com base nos recursos do Google e na priorização de suas páginas.
Indexação
Se você passou por todos esses testes, então seu conteúdo deve ser indexado com sucesso e deve aparecer quando você o pesquisar.
DICA: Tente fazer uma pesquisa de “site” no Google (por exemplo, site:https://www.exemplo.com/exemplo-pagina/) para ver se uma URL específica foi incluída no índice.
Lembre-se de que, uma vez que uma página está no índice, isso não significa que ela permanecerá lá para sempre! O Google rastreia e reavalia o conteúdo repetidamente. Então, se a qualidade do seu conteúdo cair ou se você acidentalmente impedir o Google de avaliar o conteúdo, sua página pode ser removida do índice.