Iestudēšanas bloku pārbaude
Pārliecinieties, ka iestudēšanas, administratora un testa direktoriji ir pareizi bloķēti, lai novērstu meklēšanas indeksētāju dublētu vietņu kopiju indeksēšanu.
SEO rīki
Ielīmējiet robots.txt saturu, lai pārbaudītu biežākās direktīvas un pamanītu riskantus pārmeklēšanas blokus.
Ielīmējiet robots.txt saturu.
Palaidiet testētāju.
Pārskatiet direktīvas un brīdinājumus.
Robots.txt Tester parsē jūsu robots.txt failu, lai izceltu aktīvos noteikumus, User-agent mērķus, vietnes kartes saites un rāpošanas blokus. Tas ir vislabāk piemērots rāpošanas konfigurāciju auditēšanai pirms Google, Bing vai AI aģenti indeksē jūsu vietni.
Vietnes robots.txt fails ir sākotnējais vārtsargs meklētājprogrammām un AI skrāpjiem, norādot tiem, kur viņiem ir atļauts klīst un kuriem direktorijiem jāpaliek privātiem. Viena nepareizi novietota slīpsvītra, nepareiza aizstājējzīmes zvaigznīte vai nepareizi formatēts Disallow ceļš var pilnībā bloķēt veselas jūsu domēna sadaļas no meklēšanas indeksēšanas — vai nejauši atklāt slepenus iestudēšanas direktorijus publiskiem indeksētājiem. Šis testētājs pārvērš neapstrādātas robots direktīvas skaidrās, strukturētās tabulās, izceļot, kuriem aģentiem ir rāpošanas atļauja, un brīdinot jūs par bīstamiem rāpošanas blokiem. Tā kā validācija darbojas jūsu lokālajā pārlūkprogrammas logā, varat droši pārbaudīt un pielāgot savus noteikumus bezsaistē pirms to izvietošanas tiešraidē.
Pārliecinieties, ka iestudēšanas, administratora un testa direktoriji ir pareizi bloķēti, lai novērstu meklēšanas indeksētāju dublētu vietņu kopiju indeksēšanu.
Konfigurējiet pielāgotus noteikumus, lai atļautu galvenos meklēšanas rāpuļprogrammas, vienlaikus īpaši bloķējot vai ierobežojot agresīvus AI modeļu satura skrāpjus.
Pārbaudiet, vai jūsu vietnes kartes saite ir pilnībā deklarēta kā absolūts URL un pareizi novietota ārpus user-agent direktīvu blokiem.
Nē. Tā ir ātra lokāla pārbaude biežāk pieļautajām kļūdām pirms dziļākas validācijas.
Tiešsaistes iegūšanu var pievienot vēlāk kā servera atbalstītu funkciju.
Sitemap direktīva ir neatkarīga no User-agent blokiem. Tā jādeklarē kā absolūts URL (piemēram, Sitemap: https://yourdomain.com/sitemap.xml) un parasti atrodas faila pašā augšā vai apakšā.
Nē. Googlebot pilnībā ignorē Crawl-delay direktīvas. Tomēr citi meklēšanas roboti (piemēram, Bingbot) un nelieli vietņu skrāpji joprojām atbalsta un ievēro Crawl-delay iestatījumus.
Jā. Standarta aizstājējzīmes (piemēram, * un $) atbalsta mūsdienu meklētājprogrammas, un tās var parsēt, lai pārbaudītu atbilstības.
Jā. Visa robots.txt parsēšana tiek apstrādāta stingri jūsu pārlūkprogrammas logā, izmantojot klienta puses JavaScript. Neviens no jūsu direktorijiem vai direktīvām netiek reģistrēts.