robots.tex怎么写,robots的使用和写法详细诠释

来源:饭桶公主深圳SEO 责任编辑:栏目编辑 发表时间:2013-07-01 10:21 点击:

饭桶公主博客之前并没有robots文本,后面考虑到不要分流权重,所以决定启动robots.tex,我想对于很多站长或者SEO工作者,robots是优化的一个重要步骤,目前虽然它的功能并未显现,不过确实也不能忽视。

robots的作用主要是减轻搜索引擎爬虫抓取你网站的的时候的负担,尽量不去抓取一些没用的东西,或者你不想被抓取的东西,可以减少重复收录,另外如果不同的链接指向相同的内容的时候,搜索引擎会误认为你的网站质量不高。

robots.tex怎么写

哪些地址不该被搜索引擎抓取呢,后台程序、FEED地址等。我们以zblog为例子

User-agent: *
Disallow: /ADMIN/
Disallow: /CSS/
Disallow: /CACHE/
Disallow: /DATA/
Disallow: /FUNCTION/
Disallow: /SCRIPT/
Disallow: /LANGUAGE/
Disallow: /PLUGIN/
Disallow: /THEMES/
Disallow: /INCLUDE/
Disallow: /IMAGE/
Disallow: /UPLOAD/
Disallow: /jytjpg/
Disallow: /WAP/
Disallow: /c_option.asp
Disallow: /c_custom.asp
Disallow: /login.asp
Disallow: /cmd.asp
Disallow: /search.asp
Disallow: /guestbook.asp
Disallow: /ARCHIVER/index.html
Sitemap: http://www.163wen.com/sitemap.xml

如果允许所有的搜索引擎并且访问网站全部,robots.tex可以为空

禁止访问某个目录写法如下:

     User-agent: *

  Disallow: /目录名1/

  Disallow: /目录名2/

  Disallow: /目录名3/

禁止访问某个图片,写法如下(网站图片被百度“盗链”,那你的流量消耗会特别快,google还好一些,点击图片的时候会进入你的网站,给你导入一些IP,百度则是赤裸裸的盗链。)使用"*"限制访问url。

User-agent: *
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

如果禁止访问某个文件夹下(A文件夹)的所有已.html结尾的页面,写法如下:

User-agent: *
Disallow: /A/*.htm

注意事项:

  1. robots.txt应用小写的,它的文件要放在网站根目录下。
  2. Disallow:该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robots访问到。例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访问/help/index.html。
    发表评论
    请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
    用户名: 验证码:点击我更换图片
    最新评论 更多>>

    推荐热点

    • 12个影响SEO价格的常见因素
    • 从市场的角度思考网站建设
    • 网站优化之黑帽SEO
    • 行业站站长必备:如何提升行业网站影响力
    • 星际争霸运营与网站运营的思考
    • 乐讯刷机网全新改版 在线刷机更方便更放心
    • 网站优化:如何模拟不同带宽测试网页打开速度
    • 全站301重定性 避免带与不带www域名权重分散的几种方法
    • webkaka新增了几个网页优化工具:图片/CSS/JS压缩
    网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
    Copyright © 2008-2015 计算机技术学习交流网. 版权所有

    豫ICP备11007008号-1