این دستور مشخص میکند که دستورهای موجود در فایل، تنها برای یک ربات خاص (در اینجا Googlebot) قابلیت اجرا دارد. این محتوا را ایندکس میکنند تا در اختیار کاربرانی که به دنبال اطلاعات هستند قرار بگیرد. دقت کنید که دستور disallow باید در خط بعد از user-agent قرار بگیرد.
- واقعاازاین برنامه بازخوردخیلی خوبی گرفتم.چندتامشکل داشتم وپشتیبانی قوی وعالی سایت کاربرمجازی درکمترین زمان ممکن …
- بنابراین بار دیگر سراغ فایل روبوتس سایت رفته و با کمک کدهایی که درون آن مینویسیم، این صفحات را هم از دید ربات موتور جستجو پنهان میکنیم.
- این کار به ایندکس شدن این صفحات در گوگل کمک میکند و افراد میتوانند آن صفحات را ببینند.
- دریافت آپدیت های ربات افزایش ورودی گوگل ما در سال اول رایگان بوده و در سالهای بعدی، تمدید سالانه، فقط با پرداخت 20% قیمت (به روز) پکیج انجام خواهد شد.
- گوگل اعلام کرد که برای حذف صفحهها از نتایج جستجو، بهتر است از راههای دیگری به جز فایل Robots.txt استفاده کنید.
درصورتی که از افزونه یواست برای سئو سایت وردپرسی خود استفاده میکنید، این افزونه برای مدیریت و ویرایش فایل ربات سایتتان یک بخش ویژه را در نظر گرفته است. علاوه بر این، چون رباتهای گوگل اجازه کش کردن محتوای داخل این صفحات را هم ندارند، این URLها به صورت زیر در صفحه نتایج گوگل ظاهر میشوند. به این ترتیب علارقم اینکه شما صراحتا در فایل ربات خود از گوگل خواستهاید که این صفحات را بررسی و ایندکس نکند، اما باز هم مشاهده میکنید که این صفحات در نتایج گوگل ظاهر میشوند. چرا که ممکن است بتوانیم از طریق دیگری به خواستهای که به دنبال آن هستیم برسیم و از روشهای دیگری برای پنهان کردن صفحات سایتمان در نتایج موتورهای جستجو استفاده کنیم.
چرا باید فایل Robots.txt داشته باشیم؟
خیلی ممنونم ازپیگیری هایی که انجام دادید،مشخصه تیم حرفه ای وکارکشته ای پشت روداریدوخیلی پیگیر هستید،واقعاازخریدم راضیم.. باسلام نرم افزاربسیارعالی هست (ربات تلگرام)وتیم پشتیبانی بسیارعالی باسپاس فراوان … خیلی کم پیش اومده که از سایت های ایرانی خرید کنم و راضی باشم.شما جز اون کسایی بودید که واقعا از کار باهاتون لذت بردم. بنابر نیازماکاربردی وازقیمت مناسبی برخورداربودکه توانستیم تبلیغات خودراگسترده تر،درکوتاهترین زمان وبالاترین راندمان انجام دهیم.. به همکارتون هم گفتم،واقعاربات عالی دارین.چون من باهمه رباتهاکارکردم، کارشماعالیه،بعید میدونم حالا حالاها بتونه اینستاگرام جلوشوبگیره.
برخی سیستمهای مدیریت محتوای قدیمی و برخی از توسعه دهندگان سایت در گذشته، برای افزایش ضریب امنیت، دسترسی موتورهای جستجو را به تمامی شاخههای فرعی سایت مسدود میکردند. این کار سبب میشود تا موتورهای جستجو امکان دریافت تصاویر، فایلهای چندرسانهای، فایلهای CSS و جاوااسکریپت سایت را نداشته باشند. با پیشرفتهایی که گوگل به تازگی داشته است، عدم دسترسی به محتواهای جانبی سبب میشود، تا سایت از نظر موتور جستجو ناقص و با کارایی ناقص مشاهده شود. به این صورت که لیستی از کلمات کلیدی مورد نظرتان را به این ربات ارتقاء سئو میسپارید تا جایگاه (صفحه) سایت شما را در نتایج جستجوی گوگل (برای تک تک آن عبارات کلیدی) به شما گزارش دهد. و با انجام همه روزه این کار فرایند رشد یا افت سایت تان در عبارت کلیدی مختلف را جلوی چشم خواهید داشت.
نحوه ویرایش فایل robots.txt در وردپرس
در مثال بالا همه رباتهای خزنده از دسترسی به تمامی آدرسهایی که دارای کاراکتر ؟ هستند منع شدهاند. تصویر زیر فایل robots.txt سایت یوتیوب به عنوان نمونه نمایش داده شدهاست. معمولا موتورهای جستجو محتویات فایل robotx.txt را ذخیره میکنند تا به دانلود مجدد آن نیاز نداشته باشند، با این حال روزانه چندبار نسخه جدید فایل را بارگذاری میکنند.
سپس می توانید این فایل را در public_html سایت خود پیدا کنید. این فایل حجم سنگینی ندارد و در اکثر مواقع نهایتاً چند صد بایت خواهد بود. ذخیره نام، ایمیل و وبسایت من در مرورگر برای زمانی که دوباره دیدگاهی مینویسم. بعد از کلی گشتن تو نت دنبال پیدا کردن مشکلم، شما واقعا یه محتوای کاربردی نوشتید، بقیه یه چیز تکراری رو کپی زدن از هم. اگر هنوز سوالی در مورد این مقاله دارید، آن را در بخش نظرات مطرح کنید.
استفاده از شبکه توزیع محتوا CDN یک راه مقابله با رباتهای بد و مدیریت مصرف منابع سرور است. اگر فایل مذکور با فرمت استاندارد و صحیح ایجاد نشده باشد و یا اطلاعات و دستورات داخل آن قادر به شناسایی نباشند، رباتهای موتورهای جستجو همچنان به دسترسی به اطلاعات سایت شما ادامه داده و میتوانند آنها را ایندکس کنند. به عبارت دیگر، رباتها فقط زمانی تغییر رفتار میدهند که دستور دقیق و منطبق با آن رفتار را از طریق متون داخل این فایل دریافت کرده باشند. در غیر این صورت آنها به رفتار طبیعی خود یعنی بررسی و ایندکس کردن تمام بخشهای سایت ادامه خواهند داد.
همین زمان طولانی، روی رتبه سایتتان در نتایج جستجو، تاثیر منفی خواهد گذاشت. این که رباتهای خزنده هر چند وقت یک بار به سایت شما سر میزنند به چند فاکتور بستگی دارد. هر چه در طول روز تعداد بیشتری محتوا در وبسایتتان قرار بگیرد و تغییرات سایت اهمیت زیادی داشته باشد، رباتهای جستجوگر دفعات بیشتری به سایت شما مراجعه میکنند. برای مثال، در وبسایتهای خبری که همیشه در حال انتشار خبر و بهروزرسانی اخبارشان هستند رباتها با سرعت بیشتری صفحات را بررسی و ایندکس میکنند. اگر صفحاتی را میخواهید مشخص کنید که موتورهای جستجو به آنها وارد نشده و از دیدن آنها پنهان بمانند، میتوانید در Robots.txt دسترسی به آنها را محدود کنید. به این نکته توجه داشته باشید که این صفحات توسط گوگل و دیگر موتورهای جستجو بررسی نمیشوند.