post آخرین کدهای ارسالی در بانک کد

کد جاوااسکریپت انتقال ابزار موبایل به آدرس مخصوص ‏‏‏‏‏1042 کد جاوا اسکریپت در هم ریزی (shuffle) آرایه ها ‏‏‏‏‏1232 کد وردپرس : فعالسازی مدیریت پیوندها و لینک ها در ورژن 3.5 و بالاتر ‏‏‏‏‏3440 کد وردپرس : غیرفعال سازی پاراگراف بندی خودکار وردپرس ‏‏‏‏‏2035 کد PHP ساختن جدول تاریخ و تقویم ‏‏‏‏‏9186 کد و تابع PHP برای دریافت سایز فایل ها ‏‏‏‏‏6124 کد html قرار دادن فایل فلش (swf) در صفحه وب ‏‏‏‏‏23246 کد جاوا اسکریپت تغیر رنگ پس زمینه با کلیک بر روی یک دکمه/لینک ‏‏‏‏‏15298

post فایل robot.txt چیست و چرا باید از آن استفاده کرد ؟

:: موتورهای جستجو همانند گوگل ، یاهو و بینگ مایکروسافت برای برای یافتن و ایندکس کردن صفحات مختلف وب و سایت های موجود از روبات های جستجو که به spider , robot و یا crawler معروف هستنداستفاده می کننید . این روبوت ها با پیمایش خودکار در صفحات وب اطلاعات مربوط به صفحات رو بدست میارند و اونها رو به موتور جستجوی مربوطه ارسال میکنند . معمولا بر اساس اینکه یک سایت چند مدت به چند مدت آپدیت میشه تعداد دفعاتی که این روبات های جستجوگر در روز به سایت مراجعه می کنند متفاوته .
صفحات موجود در سایتهای مختلف از لحاظ امنیتی و درجه حساسیت متفاوت هستند و شاید شما دوست نداشته باشید بعضی از صفحات (مثل صفحات مدیریتی و ادمین سایت) در موتورهای جستجو ایندکس بشه و آدرسش در این موتورها در اختیار عموم باشه . برای اینکه به موتورهای جستجو بگید چه صفحات یا فولدرهایی در سایت رو پیمایش و ایندکس کنه و اینکه چه صفحاتی رو ایندکس نکنه می تونید از یک فایل با نام robot.txt در ایندکس هاستینگ سایتتون و یا در پوشه ای خاص استفاده کنید تا به موتورهای جستجو بگید جا مجازید پیمایش کنید و کجا مجاز نیستید :
Robot txt 300x169 فایل robot.txt چیست و چرا باید از آن استفاده کرد ؟
serobots فایل robot.txt چیست و چرا باید از آن استفاده کرد ؟
همونطور که در عکس بالا میبینید ، در سایتی که از فایل robot.txt استفاده نشده باشه روبات های موتورهای جستجو همه ی صفحات رو ایندکس می کنند در صورتی که با استفاده از این فایل میشه این ایندکس شدنها رو برای پوشه های مختلف کنترل کرد ! از این فایل همچنین برای جلوگیری از ایندکس شدن تکراری صفحات با url های مختلف استفاده میشه .
:: خوب حالا که فهمیدید دلیل استفاده از فایل مهم robot.txt چی هست ، نحوه استفاده از اون رو براتون توضیح میدیم :
فایل robot.txt یک فایل متنی ساده (دقیقا با همین نام و پسوند txt) است . در زیر چند تا از مهمترین دستوراتی که توی این فایل می تونید بیارید آوردم .
User-agent
در خط اول این فایل معمولا نوع روباتی که قراره محدودیت ایندکسینگ رو براش اعمال کنیم با دستور *:User-agent میاریم . به شکل زیر :

User-agent: *

علامت * میگه که همه ی ربات های پیمایشگر ، این دستورات براشون اعمال بشه .
مثلا اگه بخواید بگید فقط روبات های گوگل این محدودیت ها رو داشته باشند ، این دستور رو به این شکل داریم :

User-agent: googlebot

در اینجا میتونید لیست همه ی روبوت های موجود و معروف رو ببینید .
اگر فایل فقط حاوی این خط باشه همچنان پیمایشگران محترم موتورهای جستجو بدون محدودیت به ایندکس کردن همه صفحات ادامه می دن .
Disallow
برای جلوگیری از ایندکس شدن ادرس خاصی از سایت از دستور Disallow استفاده میشه . بزارید چندتا مثال بزنیم :

User-agent: googlebot
Disallow: /

این دوخط فوق باعث میشه که جلوی ایندکس شدن همه ی صفحات توسط روبوت های گوگل گرفته بشه .

User-agent: *
Disallow: /admin.php

در مثال فوق همه ی روبوت ها رو محدود میکنید که اجازه ایندکس کردن صفحه admin.php رو نداشته باشند .

User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Disallow: /private.html

در این مثال هم همه ی روبوت ها رو محدود میکنید که اجازه ایندکس کردن صفحه private.html و پوشه های cgi-bin و images رو نداشته باشند .

البته میتونید برای روبوت های مختلف محدودیت های مختلف تعیین کنید :

User-agent: *
Disallow: /cgi-bin/
Disallow: /admin/
Disallow: /private.html

User-agent: googlebot
Disallow: /images/

User-agent: BadBot
Disallow: /

Allow
از دستور Allow هم معمولا برای اجازه دادن ایندکسینگ به زیرپوشه ای که درون یک پوشه Dissallow شده قرار داده استفاده میشه . مثال زیر رو ببینید :

User-agent: *
Disallow: /files/
Allow: /files/public/

در اینجا ما می گیم که روبات ها اجازه ایندکس کردن محتویات درون پوشه files رو ندارند به جز پوشه public که در پوشه files قرار داره !

robot.txt برای سایت های وردپرسی !
در زیر یک فایل مناسب برای استفاده وب سایت هایی که با وردپرس ساخته شدند آوردم . می تونید ازش استفاده کنید . میبینید که به پوشه های مدیریتی و حاوی فایل ها قالب و پلاگین ها و ... اجازه دسترسی داده نشده .

User-agent: *

Disallow: /feed/
Disallow: /trackback/
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /xmlrpc.php
Disallow: /wp-
Sitemap: http://www.7Learn.com/Sitemap.xml

همونطور که در مثال بالا می بینید می تونید به این طریق Sitemap سایت خودتون رو هم در این فایل قرار بدید تا در معرض دید روبات ها باشه . انشاءالله در آینده در مورد فایل sitemap و دلایل استفاده از اون هم صحبت خواهیم کرد .

robot.txt برای سایت های پیاده سازی شده با جوملا !

User-agent: *
Disallow: /component

:: در آخر هم بد نیست یه نگاهی به فایل robot.txt خود سایت گوگل بکنید !

:: امیدوارم که مفید واقع شده باشه ! حمایت از ما (+1 در گوگل) فراموش نشه ... خوش باشید !

پک طراحی وب پکیج طلایی طراحی وب
:: آموزش ویدیویی کامل html, css, php, asp.net, ajax, javascript ,flash, jQuery و ...
هزاران سورس کد از زبان های مختلف
مجموعه کامل نرم افزارهای طراحی وب
35 گیگ فیلم آموزشی طراحی وب
پک آموزش سی شارپ پکیج طلایی آموزش #C
:: آموزش ویدیویی کامل به زبان فارسی
بیش از 2000 سورس برنامه کاربردی
بیش از 100 کتاب آموزشی کاربردی
150 هزار آیکون برای استفاده در برنامه های شما
پک آموزش جاوااسکریپت کاملترین پکیج آموزش جاوااسکریپت   ( مقدماتی تا پیشرفته )
پک آموزش سئو پکیج آموزش عملی افزایش رتبه سایت و وبلاگ و بهبود سئو

:: مطلب بعدی را از طریق ایمیل دریافت کنید :

21
0
0
0
0
  نویسنده مطلب :  

:: دانشجوی ارشد نرم افزار دانشگاه شیراز ، برنامه نویس و مدیر سایت سون لرن ، هشت سال سابقه وبلاگنویسی و طراحی وب دارم و شدیدا به این کار علاقمندم !


نظر دهيد ...

24 ديدگاه مطرح شده است

  1. سایت مپ گوگل رو چک کردم دیدم یک عالمه پروفایل گوگل پلاس رو اونجا وارد کرده (غیر مستقیم-یعنی شما وارد سایت مپ بشید یکی از txt ها رو باز کنید میبینید )

  2. با سپاس از شما برای این آموزش ! :oops:

  3. درود بر شما
    عالیه این سایت

  4. ممنون از زحمات فراوانتون و توجه کردن به نظرات بیننده ها و پاسخ به سوالات
    ممنون

  5. robot.txt رو برای وبلاگ ها نمیشه بهینه سازی کرد
    چون یه سایتی که داشتم وبلاگمو از طریق اون تو موتورای جستجو ثبت میگردم گفت روبات وبلاگت مشکل داره

  6. آموزش خوبی بود
    تشکر

  7. خیلی عالی بود. دیروز مقاله‌ای راجع به سئو خوندم که داخلش به این فایل اشاره شده بود می‌خواستم بعدا دنبالش برم که وقتی اومدم داخل این سایت دیدم شما توضیح دادین و همین الان خوندم. تو وقتم صرفه جویی شد ممنون. :oops:

  8. فقط باقی می‌مونه یه سوال که این فایل رو کجای سایت بریزیم؟ هرجا باشه ایراد نداره؟ مثلا برای سایت‌های وردپرس باید داخل پوشه‌ی قالب باشه؟

  9. برای وبلاگ میشه روبات رو بهینه کرد؟
    راهی هست؟

  10. درود بر شما بسیار عالی بود
    :razz:

  11. ماژولی مثل نویسنده توی این سایت برای جوملا میخوام

    هستش

  12. با سلام و تشکر از مطالب آمزشی دقیق شما
    ببخشید این مسئله رو می شه برای صفحاتی که گوگل ارور داده یعنی صفحات از سایت پاک شده بکار برد

  13. مثل اینکه سایت گوگل از سایتهایی که روبتس تکست داشته باشن بدش میاد. چون من داشتم تو گوگل سرچ میکردم ، تو نتایج سرچ بر ای چندتا سایت نوشته بود اینها دارای فایل روبتس تکست هستند و نتایج آنها قابل مشاهده نیست. مثل اینکه گوگیل اونها رو تحریم بکنه. درسته چنین مطلبی؟ توضیح بدید و لطفا جواب رو به آدرس ایمیلم نیز بفرستید خواهشا.

  14. آموزش سئو – SEO بخش پنجم – 7 اردیبهشت ۱۳۹۲ | بازاریابی اینترنتی - بازتاب در ۶ اردیبهشت ۱۳۹۲ ساعت ۱۱:۱۷ ب.ظ

:: ديدگاه خود را مطرح کنيد ...

:: سوالات غیرمرتبط با این مطلب را در انجمن های سایت مطرح کنید . در بخش نظرات فقط سوالات مرتبط با مطلب پاسخ داده خواهد شد .
افزودن کد

:: به رایگان مشترک شوید ، تا مطالب جدید برایتان ایمیل شود :

پس از اشتراک به ایمیل خود رفته و بر روی لینک تاییدیه کلیک کنید .

از ایمیل شما هیچگونه استفاده تبلیغاتی نخواهد شد و هر زمان که بخواهید می توانید اشتراک ایمیلی خود را لغو کنید .

به 7Learn امتياز دهيد

به اين صفحه امتياز دهيد

با تشکر از حمايت شما