浅析搜索引擎的工作原理

来源:小峰的博客 责任编辑:栏目编辑 发表时间:2013-07-01 04:13 点击:

    武汉SEO小峰今天为大家讲讲搜索引擎的工作原理,它分为以下几点:

一、从互联网上抓取网页。

  利用能够从互联网上自动收集网页的爬虫系统程序(或者称为机器人程序),自动访问互联网,沿着任何网页中的所有URL爬到其它网页,重复这一过程,并把爬过的所有网页收集回来。

二、建立索引数据库。

  由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL,编码类型,页面内容包含的所有关键词,关键词位置,生成时间,大小,与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

三、在索引数据库中搜索排序。

  当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对于该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页而内容摘要等内容组织起来返回给用户。

  由于Web信息会频繁更新,例如,新闻网页通常每天就要更新,有的网页更新周期可能是一周或几个月,这种频繁更新,会导致数据库内信息的过时。因此,需要更新网页索引数据库,以反映出网页文字的更新情况,增加新的网页信息,去除死链接,并根据网页文字和链接关系的变化重新排序。这样,网页的具体文字变化情况就会反映到用户查询的结果中。

 

本文作者:武汉SEO

本文地址:http://www.580seo.net/post/212.html

版权所有 © 转载时必须以链接形式注明作者和原始出处

    发表评论
    请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
    用户名: 验证码:点击我更换图片
    最新评论 更多>>

    推荐热点

    • 12个影响SEO价格的常见因素
    • 从市场的角度思考网站建设
    • 网站优化之黑帽SEO
    • 行业站站长必备:如何提升行业网站影响力
    • 星际争霸运营与网站运营的思考
    • 乐讯刷机网全新改版 在线刷机更方便更放心
    • 网站优化:如何模拟不同带宽测试网页打开速度
    • 全站301重定性 避免带与不带www域名权重分散的几种方法
    • webkaka新增了几个网页优化工具:图片/CSS/JS压缩
    网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
    Copyright © 2008-2015 计算机技术学习交流网. 版权所有

    豫ICP备11007008号-1