Перевірка блокувань проміжних середовищ
Переконайтеся, що проміжні, адміністративні та тестові каталоги заблоковані правильно, щоб запобігти індексуванню пошуковими системами дублікатів копій сайту.
SEO-інструменти
Вставте вміст robots.txt, щоб перевірити загальні директиви та виявити ризиковані блокування сканування.
Вставте вміст robots.txt.
Запустіть тестер.
Перегляньте директиви та попередження.
Тестувальник Robots.txt аналізує ваш файл robots.txt, щоб виділити активні правила, цілі User-agent, посилання на карти сайту та блокування сканування. Він найкраще підходить для аудиту конфігурацій сканування перед тим, як Google, Bing або агенти ШІ проіндексують ваш сайт.
Файл robots.txt сайту є початковим контролером для пошукових систем і скрейперів ШІ, вказуючи їм, де їм дозволено переміщатися, а які каталоги повинні залишатися приватними. Один неправильно розміщений слеш, неправильна зірочка підстановки або неправильно сформований шлях Disallow може повністю заблокувати цілі розділи вашого домену від пошукового індексування — або випадково відкрити секретні проміжні каталоги для публічних індексаторів. Цей тестувальник перетворює необроблені директиви robots у чіткі структуровані таблиці, виділяючи, які агенти мають дозвіл на сканування, і попереджаючи вас про небезпечні блокування сканування. Оскільки перевірка виконується у вікні вашого локального браузера, ви можете безпечно тестувати та налаштовувати свої правила в автономному режимі перед їх розгортанням.
Переконайтеся, що проміжні, адміністративні та тестові каталоги заблоковані правильно, щоб запобігти індексуванню пошуковими системами дублікатів копій сайту.
Налаштуйте користувацькі правила, щоб дозволити основним пошуковим роботам сканувати сайт, одночасно блокуючи або обмежуючи агресивні скрейпери контенту моделей ШІ.
Переконайтеся, що посилання на вашу карту сайту повністю оголошено як абсолютну URL-адресу та правильно розміщено поза блоками директив user-agent.
Ні. Це швидка локальна перевірка на типові помилки перед глибшою перевіркою.
Отримання в реальному часі може бути додано пізніше як функція за допомогою сервера.
Директива Sitemap не залежить від блоків User-agent. Вона повинна бути оголошена як абсолютна URL-адреса (наприклад, Sitemap: https://yourdomain.com/sitemap.xml) і зазвичай розміщується в самому верху або внизу файлу.
Ні. Googlebot повністю ігнорує директиви Crawl-delay. Однак інші пошукові боти (наприклад, Bingbot) і дрібні скрейпери сайтів все ще підтримують і поважають налаштування Crawl-delay.
Так. Стандартні символи підстановки (такі як * і $) підтримуються сучасними пошуковими системами і можуть бути проаналізовані для аудиту збігів.
Так. Весь парсинг robots.txt обробляється виключно у вікні вашого браузера за допомогою клієнтського JavaScript. Жоден із ваших каталогів або директив не реєструється.