صفحه اصلی
محصولات
حسابداری
حقوق و مزایا
باشگاه ورزشی
ثبت سفارش
انبارداری
حضور و غیاب
باشگاه بدنسازی
مدیریت بورس
حسابداری با انبارداری
حقوق و مزایا با حضور و غیاب
باشگاه بازی
ارز دیجیتال
فاکتور
دیسکت بیمه و مالیات
آموزشگاه
مدیریت پسورد
مدیریت چک
صندوق وام
سهم الارث
حساب و کتاب
نوبت دهی
شارژ مجتمع (طلایی)
فرمول یاب
حسابداری شرکتی
کنترل تردد
شارژ آپارتمان (نقره ای)
انتقال داده
مودیان
مدیریت شیفت
شارژ ساختمان (برنزی)
بازی ها ...
مقایسه محصولات ...
مقایسه محصولات ...
مقایسه محصولات ...
نرم افزارهای سرور:
حسابداری (سرور)
انبارداری (سرور)
حسابداری با انبارداری (سرور)
حسابداری شرکتی (سرور)
کنترل تردد (سرور)
پروژه ها
وبسایت ها
اندروید
مدیریت چک
کتابخانه شخصی
سهم الارث
جاناوارلار
سخت افزار
سفارش
ثبت سفارش
پیگیری سفارش
پرداخت آنلاین
خدمات
تبدیل آنلاین اعداد
تبدیل آنلاین حروف
ساخت فایل robots.txt
ساخت فایل humans.txt
اسکریپت اوقات شرعی
وضعیت آنلاین آب و هوا
اسکریپت فال حافظ
اسکریپت فال انبیا
اسکریپت فال روزانه
حذف سطرهای خالی
سایر خدمات...
زیرمجموعه ها
سایت محصولات (سرور یک)
سایت محصولات (سرور دو)
سایت محصولات (سرور سه)
وبلاگ شرکت آسان سیستم مبنا
خبریاب (کاملترین مرجع خبرگزاری ها)
دانلود برنامه و سورس کد
درباره ما
درباره شرکت
جوایز و افتخارات
استخدام برنامه نویس
قوانین و مقررات
تماس با ما
ساخت آنلاین فایل robots.txt
All Robots are:
Allowed
Refused
Crawl-Delay:
No Delay
5 Seconds
10 Seconds
20 Seconds
60 seconds
120 Seconds
Sitemap:
Specific Search Robots:
Google
Default
Allowed
Refused
googlebot
MSN Search
Default
Allowed
Refused
msnbot
Yahoo
Default
Allowed
Refused
yahoo-slurp
Ask/Teoma
Default
Allowed
Refused
teoma
Cuil
Default
Allowed
Refused
twiceler
GigaBlast
Default
Allowed
Refused
gigabot
Scrub The Web
Default
Allowed
Refused
scrubby
DMOZ Checker
Default
Allowed
Refused
robozilla
Nutch
Default
Allowed
Refused
nutch
Alexa/Wayback
Default
Allowed
Refused
ia_archiver
Baidu
Default
Allowed
Refused
baiduspider
Naver
Default
Allowed
Refused
naverbot, yeti
Specific Special Bots:
Google Image
Default
Allowed
Refused
googlebot-image
Google Mobile
Default
Allowed
Refused
googlebot-mobile
Yahoo MM
Default
Allowed
Refused
yahoo-mmcrawler
MSN PicSearch
Default
Allowed
Refused
psbot
SingingFish
Default
Allowed
Refused
asterias
Yahoo Blogs
Default
Allowed
Refused
yahoo-blogs/v3.9
Restricted Directories:
The path is relative to root and must contain a trailing "/"
معرفی فایل robots.txt
امروزه، تعداد بازدید و ترافیک دریافتی هر وب سایت تا مقدار زیادی محتاج موتور های جستجو می باشد. بنابراین برای جذب مشتریان جدید و کسب درامد از طریق وب سایت خود، باید تنظیمات لازمی را جهت معرفی سایت به موتورهای جستجو انجام دهید. این تنظیمات در صورتیکه به درستی انجام نپذیرند نیز می توانند در برخی از مواقع، برای سایت شما مشکل ساز شده و حتی باعث متحمل شدن ضرر مالی برای شما گردند. بنابراین تسلط به راهکار های کنترلی و اعمال محدودیت های لازم در این زمینه یکی از عوامل ضروری برای نگهداری وب سایت می باشد.
به غیر از تنظیمات هر موتور جستجو که با معرفی وب سایت به آن و معمولا از طریق ابزارهای Webmaster همان موتور خاص انجام می پذیرد، پاره ای دیگر از تنظیمات کلی را نیز می تواند به صورت مرکزی در وب سایت خود اعمال نمود، تا با استفاده از آن، مواردی همچون ایندکس شدن وب سایت در یک موتور خاص، ایندکس شدن پوشه هایی خاص و ... را تنظیم نمود.
تمامی موارد فوق الذکر را می توان از طریق قرار دادن فایل متنی ساده ای به نام robots.txt در فضای وب سایت اعمال نمود. مدیران وب سایت با استفاده از این فایل توضیحات لازمی را برای روبات های موتورهای جستجو آماده می کنند که به این توضیخات Robots Exclusion Protocol گفته می شود.
برای مثال فرض کنید که روبات سایت گوگل قصد چک نمودن آدرس وب سایت شما را به آدرس (http://www.easysoft.ir) دارد. در صورتیکه شما از قبل فایل robots.txt لازم را در فضای میزبانی خود قرار داده باشید، بنابراین روبات گوگل قبل از رفتن به URL اصلی وب سایت شما به URL فایل مذکور یعنی http://www.easysoft.ir/robots.txt رجوع نموده و با عبارت زیر مواجه می گردد:
User-agent: *
Disallow: /
عبارت User-agent: * مشخص می کند که تنظیمات پیش رو در خط های بعدی باید بر روی تمامی روبات ها (از جمله روبات های گوگل، یاهو و بینگ) اعمال شوند. و عبارت Disallow: / اجازه دسترسی هیچ روباتی را به هیچ یک از پوشه ها یا فایلهای مربوطه نمی دهد. بنابراین زمانیکه روبات گوگل نیز با این عبارات مواجه می شود، دیگر آدرس دیگری از سایت را مشاهده و ایندکس نمی کند.
دو نکته قابل ملاحظه در زمان کار با فایل robots.txt وجود دارد:
* برخی از روبات ها، مخصوصا روبات های مخرب (Malware) می توانند فایل robots.txt شما را نادیده بگیرند. برخی از روبات های مخرب از اینکار استفاده کرده تا قادر باشند وب سرور را برای مشاهده ضعف های امنیتی اسکن نمایند و یا آدرس ایمیل های مفید را برای افراد اسپمر جمع آوری کنند.
* فایل robots.txt برای نمایش به عموم آزاد می باشد. بنابراین همه میتوانندتنظیمات اعمال شده توسط شما را در این فایل مشاهده نمایند.
بنابراین بهتر است از این فایل برای مخفی نمودن اطلاعات خود استفاده نکنید.
چگونگی ساخت فایل robots.txt
به سادگی می توانید فایلی با فرمت txt در داخل پوشه روت فضای وب سایت خود ساخته و کدهای مربوطه را داخل آن تایپ نمایید. در ساخت این فایل دقت نمایید که نام آن را تماما با حروف کوچک یعنی robots.txt بنویسید.
فایل robots یک فایل متنی بوده که شامل یک تا چند رکورد می باشد. نمونه کد زیر مثالی از محتویات فایل robots.txt می باشد:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
در نمونه کد فوق، دایرکتوری های cgi-bin، tmp و همچنین ~joe از لیست فولدرهای قابل ایندکس شدن حذف گردیده و روبات موتور جستجو از پوشه های مذکور صرف نظر می کند.
دقت نمایید که برای خارج نمودن چند فولدر از لیست ایندکسینگ باید هریک را همانند مثال فوق در سطری جداگانه تعریف نمایید و امکان درج آن ها به صورت یکجا یعنی "Disallow: /cgi-bin/ /tmp/" وجود ندارد.
علامت ستاره "*" به معنای تمامی روبات های جستجو گر می باشد.
خارج کردن فولدرهای خاص از لیست ایندکسینگ وب سایت بسته به نوع سرور و وب سایت شما متفاوت می باشد و باید با درنظر گرفتن نکات مختلفی انجام پذیرد. در هر حال در دسترس خارج کردن تمامی پوشه ها از تمامی روبات ها چندان توصیه نمی شود، زیرا با این کار سایت شما دیگر توسط روبات ها ایندکس نشده و در نتایج موتورهای جستجو نیز نمایش داده نمی شود. در ادامه برخی از نمونه کدهای مورد استفاده در فایل robots.txt شرح داده می شود.
ممنوع نمودن تمامی روبات ها از کل وب سایت (یا سرور):
User-agent: *
Disallow: /
دسترسی تمامی روبات ها به تمامی پوشه های وب سایت:
User-agent: *
Disallow:
ممنوع کردن یک روبات خاص از دسترسی به سایت:
User-agent: BadBot
Disallow: /
اعطای دسترسی به یک روبات خاص:
User-agent: Google
Disallow:
بازگشت