Verificarea blocurilor de testare
Asigurați-vă că directoarele de testare, de administrare și de testare sunt blocate corect pentru a preveni indexatorii de căutare să indexeze copii duplicate ale site-ului.
Instrumente SEO
Lipiți conținutul robots.txt pentru a inspecta directivele comune și a detecta blocurile de accesare cu crawlere riscante.
Lipește conținutul robots.txt.
Rulează testerul.
Revizuiește directivele și avertismentele.
Testerul Robots.txt analizează fișierul dvs. robots.txt pentru a evidenția regulile active, țintele User-agent, linkurile sitemap și blocurile de acces. Este cel mai bun pentru auditarea configurațiilor de acces înainte ca Google, Bing sau agenții AI să vă indexeze site-ul.
Fișierul robots.txt al unui site este primul portar pentru motoarele de căutare și scraperii AI, instruindu-i unde au voie să meargă și ce directoare trebuie să rămână private. O singură bară oblică greșită, o stea wildcard incorectă sau o cale Disallow malformată poate bloca complet secțiuni întregi ale domeniului dvs. de la indexarea căutării - sau poate expune accidental directoare secrete de testare indexatorilor publici. Acest tester traduce directivele brute robots în tabele clare, structurate, evidențiind ce agenți au permisiunea de acces și avertizându-vă de blocurile de acces periculoase. Deoarece validarea rulează în fereastra browserului dvs. local, puteți testa și ajusta în siguranță regulile offline înainte de a le implementa live.
Asigurați-vă că directoarele de testare, de administrare și de testare sunt blocate corect pentru a preveni indexatorii de căutare să indexeze copii duplicate ale site-ului.
Configurați reguli personalizate pentru a permite crawlerelor de căutare principale, blocând sau limitând în mod specific scraperii agresivi de conținut ai modelelor AI.
Verificați dacă linkul sitemap-ului dvs. este declarat complet ca un URL absolut și plasat corect în afara blocurilor de directive user-agent.
Nu. Este o verificare locală rapidă pentru greșeli comune înainte de o validare mai profundă.
Preluarea live poate fi adăugată mai târziu ca o funcție asistată de server.
O directivă Sitemap este independentă de blocurile User-agent. Ar trebui declarată ca un URL absolut (de ex. Sitemap: https://yourdomain.com/sitemap.xml) și de obicei se află chiar în partea de sus sau de jos a fișierului.
Nu. Googlebot ignoră complet directivele Crawl-delay. Cu toate acestea, alți roboți de căutare (cum ar fi Bingbot) și scraperii minori de site-uri încă acceptă și respectă setările Crawl-delay.
Da. Wildcard-urile standard (cum ar fi * și $) sunt acceptate de motoarele de căutare moderne și pot fi analizate pentru a audita potrivirile.
Da. Toată parsarea robots.txt este gestionată strict în fereastra browserului dvs. folosind JavaScript pe partea clientului. Niciunul dintre directoarele sau directivele dvs. nu este înregistrat.