帝国cms采集图文教程(上)

来源:网络 责任编辑:栏目编辑 发表时间:2013-07-01 08:59 点击:
帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采集功能来完成信息的录入。为了深入了解帝国cms采集功能,下面我们以“新浪各地新闻”栏目为例来进行实战采集。

  一、增加采集节点

  1、添加节点:

  

1.jpg

 

  2、选择要增加采集的栏目:

  

2.jpg

 

  3、进入增加节点表单:

  

3.jpg

 

  4、在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:

  

4.jpg

 

  

4-1.jpg

 

  5、下来发现好多选项,如“采集页面地址方式二,内容页地址前缀...”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:

  

5.jpg

 

  6、这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:

  

6.jpg

 

  7、把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:

  

7.jpg

 

  8、切换到Dreamweaver代码方式,

    就是信息链接区域:

     

      

    8.jpg

     

      9、得到信息链接区域正则:

      

    9.jpg

     

      10、得到信息页链接正则:

      

    10.jpg

     

      11、注意:如果信息页链接是相对地址,例如< a href="/c/2012-03-05/205924063527.shtml" target="_blank" >,那么“内容页地址前缀”要加域名:

      

    11.jpg

     

      12、现在要采集内容页的标题和内容:

      

    12.jpg

     

      13、查看新闻页“源文件”,找title标签:

      

    13.jpg

     

      14、取得标题正则:

      

    14.jpg

     

      15、这里是要采集的内容区域:

      

    15.jpg

     

      16、取得新闻内容正则:

      

    16.jpg

      相关新闻>>

        发表评论
        请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
        用户名: 验证码:点击我更换图片
        最新评论 更多>>

        推荐热点

        • WordPress添加百度喜欢按钮小技巧
        • Wordpress 博客如何实现自定义Gravatar头像
        • 网站设计分析:建立良好的视觉层级
        • 网站设计分析:“中国式设计”的三个方向
        • 案例分析:奥巴马筹款网站的制作过程
        • 创建不平衡的平衡:在网页设计中使用不对称设计
        • 7大主流B2C首页导航栏设计对比分析
        • Wordpress页面模板制作方法及使用
        • css控制文字前的小图标
        网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
        Copyright © 2008-2015 计算机技术学习交流网. 版权所有

        豫ICP备11007008号-1