स्टेजिंग ब्लॉक का सत्यापन
सुनिश्चित करें कि खोज अनुक्रमणिकाओं को डुप्लिकेट साइट प्रतियों को अनुक्रमित करने से रोकने के लिए स्टेजिंग, व्यवस्थापक और परीक्षण निर्देशिकाएँ सही ढंग से अवरुद्ध हैं।
SEO टूल्स
सामान्य निर्देशों का निरीक्षण करने और जोखिम भरे क्रॉल ब्लॉक का पता लगाने के लिए robots.txt सामग्री पेस्ट करें।
robots.txt सामग्री पेस्ट करें।
टेस्टर चलाएं।
निर्देशों और चेतावनियों की समीक्षा करें।
Robots.txt Tester सक्रिय नियमों, User-agent लक्ष्यों, साइटमैप लिंक और क्रॉल ब्लॉक को हाइलाइट करने के लिए आपकी robots.txt फ़ाइल को पार्स करता है। Google, Bing, या AI एजेंटों द्वारा आपकी साइट को इंडेक्स करने से पहले क्रॉल कॉन्फ़िगरेशन का ऑडिट करने के लिए यह सबसे अच्छा है।
किसी साइट की robots.txt फ़ाइल खोज इंजनों और AI स्क्रैपर्स के लिए प्रारंभिक द्वारपाल है, जो उन्हें निर्देश देती है कि उन्हें कहाँ घूमने की अनुमति है और किन निर्देशिकाओं को निजी रहना चाहिए। एक गलत स्लैश, गलत वाइल्डकार्ड स्टार, या विकृत Disallow पथ आपके डोमेन के पूरे अनुभागों को खोज अनुक्रमण से पूरी तरह से अवरुद्ध कर सकता है—या गलती से गुप्त स्टेजिंग निर्देशिकाओं को सार्वजनिक अनुक्रमणिकाओं के सामने उजागर कर सकता है। यह परीक्षक कच्चे रोबोट निर्देशों को स्पष्ट, संरचित तालिकाओं में अनुवादित करता है, यह उजागर करता है कि किन एजेंटों के पास क्रॉल क्लीयरेंस है और आपको खतरनाक क्रॉल-ब्लॉक की चेतावनी देता है। चूँकि सत्यापन आपके स्थानीय ब्राउज़र विंडो के अंदर चलता है, आप अपने नियमों को लाइव तैनात करने से पहले सुरक्षित रूप से ऑफ़लाइन परीक्षण और बदलाव कर सकते हैं।
सुनिश्चित करें कि खोज अनुक्रमणिकाओं को डुप्लिकेट साइट प्रतियों को अनुक्रमित करने से रोकने के लिए स्टेजिंग, व्यवस्थापक और परीक्षण निर्देशिकाएँ सही ढंग से अवरुद्ध हैं।
आक्रामक AI मॉडल सामग्री स्क्रैपर्स को विशेष रूप से अवरुद्ध या थ्रॉटल करते हुए मुख्यधारा के खोज क्रॉलर को अनुमति देने के लिए कस्टम नियम कॉन्फ़िगर करें।
सत्यापित करें कि आपका साइटमैप लिंक पूरी तरह से एक पूर्ण URL के रूप में घोषित किया गया है और उपयोगकर्ता-एजेंट निर्देश ब्लॉक के बाहर सही ढंग से रखा गया है।
नहीं। यह गहरी जांच से पहले सामान्य गलतियों के लिए एक त्वरित स्थानीय जांच है।
लाइव फ़ेचिंग को बाद में सर्वर-सहायता प्राप्त सुविधा के रूप में जोड़ा जा सकता है।
एक Sitemap निर्देश User-agent ब्लॉक से स्वतंत्र है। इसे एक पूर्ण URL (उदा. Sitemap: https://yourdomain.com/sitemap.xml) के रूप में घोषित किया जाना चाहिए और आमतौर पर फ़ाइल के बिल्कुल ऊपर या नीचे बैठता है।
नहीं। Googlebot Crawl-delay निर्देशों को पूरी तरह से अनदेखा करता है। हालाँकि, अन्य खोज बॉट (जैसे Bingbot) और छोटे साइट स्क्रैपर अभी भी Crawl-delay सेटिंग्स का समर्थन और सम्मान करते हैं।
हाँ। मानक वाइल्डकार्ड (जैसे * और $) आधुनिक खोज इंजनों द्वारा समर्थित हैं और मिलानों का ऑडिट करने के लिए पार्स किए जा सकते हैं।
हाँ। सभी robots.txt पार्सिंग को क्लाइंट-साइड JavaScript का उपयोग करके आपकी ब्राउज़र विंडो के भीतर सख्ती से नियंत्रित किया जाता है। आपकी कोई भी निर्देशिका या निर्देश लॉग नहीं किए गए हैं।