การตรวจสอบการบล็อกการจัดเตรียม
ตรวจสอบให้แน่ใจว่าไดเรกทอรีการจัดเตรียม ผู้ดูแลระบบ และการทดสอบถูกบล็อกอย่างถูกต้องเพื่อป้องกันไม่ให้ผู้จัดทำดัชนีการค้นหาจัดทำดัชนีสำเนาเว็บไซต์ที่ซ้ำกัน
เครื่องมือ SEO
วางเนื้อหา robots.txt เพื่อตรวจสอบคำสั่งทั่วไปและค้นหาการบล็อกการรวบรวมข้อมูลที่มีความเสี่ยง
วางเนื้อหา robots.txt
เรียกใช้เครื่องมือทดสอบ
ตรวจสอบคำสั่งและคำเตือน
Robots.txt Tester จะแยกวิเคราะห์ไฟล์ robots.txt ของคุณเพื่อเน้นกฎที่ใช้งานอยู่ เป้าหมาย User-agent ลิงก์ sitemap และการบล็อกการรวบรวมข้อมูล เหมาะที่สุดสำหรับการตรวจสอบการกำหนดค่าการรวบรวมข้อมูลก่อนที่ Google, Bing หรือตัวแทน AI จะจัดทำดัชนีเว็บไซต์ของคุณ
ไฟล์ robots.txt ของเว็บไซต์เป็นผู้รักษาประตูด่านแรกสำหรับเครื่องมือค้นหาและโปรแกรมดึงข้อมูล AI โดยสั่งให้พวกเขาทราบว่าอนุญาตให้ไปที่ใดและไดเรกทอรีใดต้องเป็นส่วนตัว เครื่องหมายทับที่วางผิดที่เพียงอันเดียว เครื่องหมายดอกจันไวลด์การ์ดที่ไม่ถูกต้อง หรือเส้นทาง Disallow ที่ผิดรูปแบบสามารถบล็อกส่วนทั้งหมดของโดเมนของคุณจากการจัดทำดัชนีการค้นหา หรือเปิดเผยไดเรกทอรีการจัดเตรียมที่เป็นความลับต่อผู้จัดทำดัชนีสาธารณะโดยไม่ได้ตั้งใจ เครื่องมือทดสอบนี้จะแปลคำสั่ง robots ดิบเป็นตารางที่มีโครงสร้างชัดเจน เน้นว่าตัวแทนใดมีสิทธิ์ในการรวบรวมข้อมูลและเตือนคุณถึงการบล็อกการรวบรวมข้อมูลที่เป็นอันตราย เนื่องจากการตรวจสอบความถูกต้องทำงานภายในหน้าต่างเบราว์เซอร์ในเครื่องของคุณ คุณจึงสามารถทดสอบและปรับแต่งกฎของคุณแบบออฟไลน์ได้อย่างปลอดภัยก่อนที่จะนำไปใช้งานจริง
ตรวจสอบให้แน่ใจว่าไดเรกทอรีการจัดเตรียม ผู้ดูแลระบบ และการทดสอบถูกบล็อกอย่างถูกต้องเพื่อป้องกันไม่ให้ผู้จัดทำดัชนีการค้นหาจัดทำดัชนีสำเนาเว็บไซต์ที่ซ้ำกัน
กำหนดค่ากฎแบบกำหนดเองเพื่ออนุญาตโปรแกรมรวบรวมข้อมูลการค้นหากระแสหลักในขณะที่บล็อกหรือจำกัดโปรแกรมดึงข้อมูลเนื้อหาโมเดล AI ที่ก้าวร้าวโดยเฉพาะ
ตรวจสอบว่าลิงก์ sitemap ของคุณได้รับการประกาศอย่างสมบูรณ์เป็น URL แบบสัมบูรณ์และวางไว้อย่างถูกต้องนอกบล็อกคำสั่ง user-agent
ไม่ได้ นี่เป็นเพียงการตรวจสอบเบื้องต้นในเครื่องสำหรับข้อผิดพลาดทั่วไปก่อนการตรวจสอบเชิงลึก
การดึงข้อมูลจริงสามารถเพิ่มได้ในภายหลังในฐานะฟีเจอร์ที่ทำงานร่วมกับเซิร์ฟเวอร์
คำสั่ง Sitemap เป็นอิสระจากบล็อก User-agent ควรประกาศเป็น URL แบบสัมบูรณ์ (เช่น Sitemap: https://yourdomain.com/sitemap.xml) และมักจะอยู่ที่ด้านบนสุดหรือด้านล่างสุดของไฟล์
ไม่ Googlebot ละเว้นคำสั่ง Crawl-delay โดยสิ้นเชิง อย่างไรก็ตาม บอทค้นหาอื่นๆ (เช่น Bingbot) และโปรแกรมดึงข้อมูลเว็บไซต์ย่อยยังคงรองรับและเคารพการตั้งค่า Crawl-delay
ได้ ไวลด์การ์ดมาตรฐาน (เช่น * และ $) ได้รับการรองรับโดยเครื่องมือค้นหาสมัยใหม่และสามารถแยกวิเคราะห์เพื่อตรวจสอบการจับคู่ได้
ใช่ การแยกวิเคราะห์ robots.txt ทั้งหมดได้รับการจัดการอย่างเคร่งครัดภายในหน้าต่างเบราว์เซอร์ของคุณโดยใช้ JavaScript ฝั่งไคลเอ็นต์ ไม่มีไดเรกทอรีหรือคำสั่งใดของคุณถูกบันทึก