您现在的位置:计算机技术学习网 > 技术中心 > WEB编程 > PHP >

PHP获取百度相关搜索和原创程度

来源:网络 责任编辑:栏目编辑 发表时间:2013-07-01 09:10 点击:

 PHP获取百度相关搜索和原创程度 
获取原创程度是get_em_times,数值越高文本长度越长越不原创。 
用于采集项目的搜索引擎优化

class baidu {

        public static function build_request_uri($words){

                $words = urlencode(Text::convert_encoding($words,GBK,UTF-8));

                return /s?wd=.$words;

        }

        public static function get_relate_search($words){

                $content = self::get_content($words);

                if(preg_match(/<div id="rs">(((?!</div>).)*)</div>/, $content,$result)){

                        if(preg_match_all(/<a((?!>).)*>(.*?)</a>/, $result[1], $result)) return $result[2];

                }

                return FALSE;

        }

        /**

         * 根据空格分词,获取百度关键词完全匹配<em></em>的次数

         * @param string $words

         * @return int 

         */

        public static function get_em_times($words){

                $word = explode( , $words);

                $content = self::get_content($words);

                preg_match_all(/<em>(((?!</em>).)*)</em>/, $content,$result);

                if(!isset($result[1]) || count($result[1])==0)

                        return 0;

                $word_table = array_count_values($result[1]);

                $times = 0;

                foreach ($word as $pice){

                        if(array_key_exists($pice, $word_table)) $times+=$word_table[$pice];

                }

                return $times;

        }

        public static function get_content($words){

                static $loaded_contents = array();

                if(!isset($loaded_contents[$words])){

                        $content = file_get_contents("http://www.baidu.com".self::build_request_uri($words));

                        $content = Text::convert_encoding($content,UTF-8,GBK);

                        $loade

    相关新闻>>

      发表评论
      请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
      用户名: 验证码:点击我更换图片
      最新评论 更多>>

      推荐热点

      • PHP测试
      • 十天学会php之第六天
      • 几种显示数据的方法的比较
      • 使用xmlhttp为网站增加域名查询功能
      • PHP+MYSQL+Javascript数据库查询结果的动态显示
      • 查找数组中指定键名的值
      • 用redis实现跨服务器session
      • 用新浪微博接口发送图片微博失败的原因
      • smarty局部缓存技术[源码分析]
      网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
      Copyright © 2008-2015 计算机技术学习交流网. 版权所有

      豫ICP备11007008号-1