স্টেজিং ব্লক যাচাই করা
সার্চ ইনডেক্সারদের ডুপ্লিকেট সাইট কপি ইনডেক্স করা থেকে বিরত রাখতে স্টেজিং, অ্যাডমিন এবং টেস্ট ডিরেক্টরিগুলি সঠিকভাবে ব্লক করা হয়েছে তা নিশ্চিত করুন।
SEO সরঞ্জাম
সাধারণ নির্দেশিকাগুলি পরিদর্শন করতে এবং ঝুঁকিপূর্ণ ক্রল ব্লকগুলি চিহ্নিত করতে robots.txt কন্টেন্ট পেস্ট করুন।
robots.txt কন্টেন্ট পেস্ট করুন।
টেস্টার চালান।
নির্দেশিকা এবং সতর্কতাগুলি পর্যালোচনা করুন।
Robots.txt Tester আপনার robots.txt ফাইল পার্স করে সক্রিয় নিয়ম, User-agent লক্ষ্য, সাইটম্যাপ লিঙ্ক এবং ক্রল ব্লকগুলি হাইলাইট করে। Google, Bing বা AI এজেন্টরা আপনার সাইট ইনডেক্স করার আগে ক্রল কনফিগারেশন অডিট করার জন্য এটি সেরা।
একটি সাইটের robots.txt ফাইল হলো সার্চ ইঞ্জিন এবং AI স্ক্র্যাপারদের জন্য প্রাথমিক দারোয়ান, যা তাদের নির্দেশ দেয় কোথায় তাদের ঘোরার অনুমতি আছে এবং কোন ডিরেক্টরিগুলি ব্যক্তিগত থাকতে হবে। একটি ভুল স্ল্যাশ, ভুল ওয়াইল্ডকার্ড স্টার বা ত্রুটিপূর্ণ Disallow পাথ আপনার ডোমেনের সম্পূর্ণ বিভাগগুলিকে সার্চ ইনডেক্সিং থেকে সম্পূর্ণভাবে ব্লক করতে পারে—বা দুর্ঘটনাবশত গোপন স্টেজিং ডিরেক্টরিগুলি পাবলিক ইনডেক্সারদের কাছে প্রকাশ করতে পারে। এই টেস্টার কাঁচা রোবট নির্দেশিকাগুলিকে স্পষ্ট, কাঠামোগত টেবিলে অনুবাদ করে, হাইলাইট করে কোন এজেন্টদের ক্রল করার ছাড়পত্র আছে এবং আপনাকে বিপজ্জনক ক্রল-ব্লক সম্পর্কে সতর্ক করে। যেহেতু বৈধতা আপনার স্থানীয় ব্রাউজার উইন্ডোর ভিতরে চলে, আপনি লাইভ মোতায়েন করার আগে নিরাপদে আপনার নিয়মগুলি অফলাইনে পরীক্ষা এবং পরিবর্তন করতে পারেন।
সার্চ ইনডেক্সারদের ডুপ্লিকেট সাইট কপি ইনডেক্স করা থেকে বিরত রাখতে স্টেজিং, অ্যাডমিন এবং টেস্ট ডিরেক্টরিগুলি সঠিকভাবে ব্লক করা হয়েছে তা নিশ্চিত করুন।
আক্রমনাত্মক AI মডেল কন্টেন্ট স্ক্র্যাপারদের বিশেষভাবে ব্লক বা থ্রোটল করার সময় মূলধারার সার্চ ক্রলারদের অনুমতি দেওয়ার জন্য কাস্টম নিয়ম কনফিগার করুন।
যাচাই করুন যে আপনার সাইটম্যাপ লিঙ্কটি একটি পরম URL হিসাবে সম্পূর্ণরূপে ঘোষণা করা হয়েছে এবং ইউজার-এজেন্ট নির্দেশিকা ব্লকের বাইরে সঠিকভাবে স্থাপন করা হয়েছে।
না। এটি গভীরভাবে যাচাই করার আগে সাধারণ ভুলগুলির জন্য একটি দ্রুত লোকাল চেক।
লাইভ ফেচিং পরে একটি সার্ভার-সহায়তা বৈশিষ্ট্য হিসাবে যোগ করা যেতে পারে।
একটি Sitemap নির্দেশিকা User-agent ব্লক থেকে স্বাধীন। এটি একটি পরম URL হিসাবে ঘোষণা করা উচিত (যেমন Sitemap: https://yourdomain.com/sitemap.xml) এবং সাধারণত ফাইলের একেবারে উপরে বা নীচে থাকে।
না। Googlebot Crawl-delay নির্দেশিকাগুলি সম্পূর্ণভাবে উপেক্ষা করে। তবে, অন্যান্য সার্চ বট (যেমন Bingbot) এবং ছোট সাইট স্ক্র্যাপাররা এখনও Crawl-delay সেটিংস সমর্থন করে এবং সম্মান করে।
হ্যাঁ। স্ট্যান্ডার্ড ওয়াইল্ডকার্ড (যেমন * এবং $) আধুনিক সার্চ ইঞ্জিন দ্বারা সমর্থিত এবং ম্যাচগুলি অডিট করার জন্য পার্স করা যেতে পারে।
হ্যাঁ। সমস্ত robots.txt পার্সিং ক্লায়েন্ট-সাইড JavaScript ব্যবহার করে কঠোরভাবে আপনার ব্রাউজার উইন্ডোর মধ্যে পরিচালিত হয়। আপনার কোনো ডিরেক্টরি বা নির্দেশিকা লগ করা হয় না।