SEO基础之如何分析网站日志?
来源:阿瑶SEO顾问博客 责任编辑:admin 发表时间:2013-07-01 08:54 点击:次
如何分析网站日志?
我们先看下什么是网站日志,网站日志就是各大搜索引擎爬取你的网站时留下的一个记录文件,一般是以.log结尾的,下面是一个百度蜘蛛留下的日志文件:
123.125.71.111 - - [14/Jun/2011:02:15:58 +0800] "GET /blogs/2011/05 HTTP/1.1" 200 45917 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" seo.chinaw3.com text/html "/usr/home/seo/htdocs/blogs/index.php"
123.125.71.111:这个是百度蜘蛛的ip地址;
14/Jun/2011:02:15:58 +0800:爬取的时间,+0800是你网站程序存放的那个地方的时区;
GET /blogs/2011/05:爬取博客201105这个目录;
HTTP/1.1:这个是协议及协议的版本
200 45917:这个很关键,一般网站日志的分析就是看这个,200是状态码,代表抓取成功,一共抓取了45917字节,这里顺便罗列一下常用的状态码及他们的含义:
2xx:成功
消息: | 描述: |
200 OK | 请求成功(其后是对GET和POST请求的应答文档。) |
201 Created | 请求被创建完成,同时新的资源被创建。 |
202 Accepted | 供处理的请求已被接受,但是处理未完成。 |
203 Non-authoritative Information | 文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝。 |
204 No Content | 没有新文档。浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而Servlet可以确定用户文档足够新,这个状态代码是很有用的。 |
205 Reset Content | 没有新文档。但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容。 |
206 Partial Content | 客户发送了一个带有Range头的GET请求,服务器完成了它。 |
3xx:重定向
消息: | 描述: |
300 Multiple Choices | 多重选择。链接列表。用户可以选择某链接到达目的地。最多允许五个地址。 |
301 Moved Permanently | 所请求的页面已经转移至新的url。 |
302 Found | 所请求的页面已经临时转移至新的url。 |
303 See Other | 所请求的页面可在别的url下被找到。 |
304 Not Modified | 未按预期修改文档。客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。 |
305 Use Proxy | 客户请求的文档应该通过Location头所指明的代理服务器提取。 |
306 Unused | 此代码被用于前一版本。目前已不再使用,但是代码依然被保留。 |
307 Temporary Redirect | 被请求的页面已经临时移至新的url。 |
4xx:客户端错误
消息: | 描述: |
400 Bad Request | 服务器未能理解请求。 |
401 Unauthorized | 被请求的页面需要用户名和密码。 |
401.1 | 登录失败。 |
401.2 | 服务器配置导致登录失败。 |
401.3 | 由于 ACL 对资源的限制而未获得授权。 |
401.4 | 筛选器授权失败。 |
401.5 | ISAPI/CGI 应用程序授权失败。 |
401.7 | 访问被 Web 服务器上的 URL 授权策略拒绝。这个错误代码为 IIS 6.0 所专用。 |
402 Payment Required | 此代码尚无法使用。 |
403 Forbidden | 对被请求页面的访问被禁止。 |
403.1 | 执行访问被禁止。 |
403.
相关新闻>>最新推荐更多>>>
|