TinyBee

Ferramentas de SEO

Testador de Robots.txt

Cole o conteúdo do robots.txt para inspecionar diretivas comuns e detetar bloqueios de rastreio arriscados.

Como usar

  1. 1

    Cole o conteúdo do robots.txt.

  2. 2

    Execute o testador.

  3. 3

    Reveja as diretivas e os avisos.

Resposta rápida

O Robots.txt Tester analisa o seu ficheiro robots.txt para destacar regras ativas, alvos de User-agent, hiperligações de sitemaps e bloqueios de rastreio. É ideal para auditar configurações de rastreio antes que o Google, o Bing ou agentes de IA indexem o seu site.

Funcionalidades principais

  • Verifica a validade das diretivas (Allow, Disallow, Sitemap, Crawl-delay).
  • Agrupa regras por blocos de User-agent para uma auditoria clara de múltiplos rastreadores.
  • Destaca diretivas vazias ou problemas de formatação em tempo real.
  • Identifica URLs absolutos de sitemaps e verifica a conformidade com o layout padrão.
  • Processa o texto totalmente no navegador, evitando a fuga de configurações de rastreio do site.
  • Não requer qualquer ligação a DNS de produção, domínios ou à Search Console.

Sobre esta ferramenta

O ficheiro robots.txt de um site é o guardião inicial para motores de busca e scrapers de IA, instruindo-os sobre onde podem navegar e que diretórios devem permanecer privados. Uma única barra mal colocada, um asterisco de wildcard incorreto ou um caminho Disallow malformado podem bloquear completamente secções inteiras do seu domínio da indexação de pesquisa — ou expor acidentalmente diretórios de teste secretos a indexadores públicos. Este testador traduz diretivas brutas do robots em tabelas claras e estruturadas, destacando quais os agentes que têm autorização de rastreio e avisando-o de bloqueios de rastreio perigosos. Como a validação é executada na janela do seu navegador local, pode testar e ajustar as suas regras offline com segurança antes de as implementar em tempo real.

Cenários comuns

Verificar bloqueios de teste (staging)

Garanta que os diretórios de teste (staging), administração e testes estão bloqueados corretamente para evitar que os indexadores de pesquisa indexem cópias duplicadas do site.

Auditar regras de scrapers de IA

Configure regras personalizadas para permitir rastreadores de pesquisa convencionais, bloqueando ou limitando especificamente scrapers agressivos de conteúdo de modelos de IA.

Validar caminhos de sitemaps

Verifique se a hiperligação do seu sitemap está totalmente declarada como um URL absoluto e colocada corretamente fora dos blocos de diretivas de user-agent.

Perguntas frequentes

Isto substitui o teste da Google Search Console?

Não. É uma verificação local rápida para erros comuns antes de uma validação mais profunda.

Pode obter um ficheiro robots.txt online?

A obtenção em tempo real pode ser adicionada mais tarde como uma funcionalidade assistida por servidor.

Qual é a colocação padrão para uma regra de sitemap?

Uma diretiva Sitemap é independente dos blocos de User-agent. Deve ser declarada como um URL absoluto (ex: Sitemap: https://seudominio.com/sitemap.xml) e normalmente encontra-se no topo ou no fundo do ficheiro.

As regras de crawl-delay são suportadas pelo Google?

Não. O Googlebot ignora totalmente as diretivas Crawl-delay. No entanto, outros bots de pesquisa (como o Bingbot) e pequenos scrapers de sites ainda suportam e respeitam as definições de Crawl-delay.

Posso testar wildcards?

Sim. Os wildcards padrão (como * e $) são suportados pelos motores de busca modernos e podem ser analisados para auditar correspondências.

O meu ficheiro de rastreio é privado?

Sim. Toda a análise do robots.txt é tratada estritamente dentro da janela do seu navegador utilizando JavaScript do lado do cliente. Nenhum dos seus diretórios ou diretivas é registado.

Ferramentas relacionadas