动易系统防止采集的方法总结

来源:网络 责任编辑:栏目编辑 发表时间:2013-07-02 02:35 点击:

1,先打开Include/PowerEasy.Article.asp文件

找到

If InStr(strHtml, "{$NextArticle}") > 0 Then strHtml = Replace(strHtml, "{$NextArticle}", GetNextArticle(200))

并将其替换成

If InStr(strHtml, "{$NextArticle}") > 0 Then strHtml = Replace(strHtml, "{$NextArticle}", GetNextArticle(200))

If InStr(strHtml, "{$ArticleAction_FY_FCJ}") > 0 Then strHtml = Replace(strHtml, "{$ArticleAction_FY_FCJ}", GetPrevArticle_FCJ())

再找到

'=================================================
'函数名:GetPrevArticle
'作 用:显示上一篇文章
'参 数:TitleLen ----标题最多字符数,一个汉字=两个英文字符

并在其上方加上

'=================================================
'函数名:GetPrevArticle_FCJ
'作 用:反采集函数部分 td tr table 修改
'=================================================
Private Function GetPrevArticle_FCJ()
Dim strAction_FCJ

if rsArticle("ArticleID") mod 8=1 then
strAction_FCJ="</td> </tr></table>"
elseif rsArticle("ArticleID") mod 8=2 then
strAction_FCJ="</td> </tr > </table>"
elseif rsArticle("ArticleID") mod 8=3 then
strAction_FCJ="</td > </tr> </table>"
elseif rsArticle("ArticleID") mod 8=4 then
strAction_FCJ="</td > </tr></table>"
elseif rsArticle("ArticleID") mod 8=5 then
strAction_FCJ="</td> </tr> </table>"
elseif rsArticle("ArticleID") mod 8=6 then
strAction_FCJ="</td> </tr></table >"
elseif rsArticle("ArticleID") mod 8=7 then
strAction_FCJ="</td> </tr ></table>"
else
strAction_FCJ="</td></tr></table>"
end if
GetPrevArticle_FCJ = strAction_FCJ

End Function

然后保存,上传到对应的WEB目录

第二步!!

将在文章内容模板里边的{$GetSubTitleHtml(0,1)}{$ArticleContent},注意此部 可视个人的模板情况而定!{$GetSubTitleHtml(0,1)}{$ArticleContent}之前是</td></tr> </table>,可将 </td></tr> </table> 替换成{$ArticleAction_FY_FCJ} ,然后直接生成模板就可以了!!如果不是的朋友,请看下文!!

特殊替换1:

将上面红色部分的判断代码,更换成适合你模板的代码!!如果{$GetSubTitleHtml(0,1)}{$ArticleContent}之前是

<td id=fontzoom style="WORD-BREAK: break-all" vAlign=top colSpan=2>那么您可以将上方红色部分的strAction_FCJ="</td> </tr></table>"
换成strAction_FCJ="<td id=fontzoom style=WORD-BREAK: break-all vAlign=top colSpan=2>"

并且每个strAction_FCJ等值的内容都不一样!如在里边加多个别空格或者将个别修改成大写或小写的字母等!可视个人情况来定!

注意:特殊替换1,如果您的代码中含有"的话,可以将其去掉,或者将"换成""

说下原理:

就是通过对采集固定码的干扰,来破坏采集者设定的规则!等于说,让我们每个内容页的内容都是无规则化!!


动易官方站上的方法:

解决方法:在模板中多个关键位置加上类似这样的代码,如:
<td zzz="{$ArticleID}">文章内容</td>
注意zzz="{$ArticleID}"使用无效的HTML标签,这样浏览器就不显示,但采集时因为无法设置开始代码或结束代码,无法保存规则。

采集原理:很多采集程序都是逐步捉取而拿到想要的内容的,通常情况下是截取头部和尾部来获取中间一部分,当你的文章列表或者内容没有规则,采集程序找不到您的通用头部和尾部的时候,自然就采集不了,这样别人就很难截取头部和尾部,这个防采集方法正是利用了这一点来实现防采集的。

例子:这里举例防止内容页采集,下面为内容页片段代码,大家留意一下,里面多了代码“zzz="{$ArticleID}"”,这代码就是防止采集的代码。

源代码:

<table class=tablebig cellSpacing=0 cellPadding=0 width=770 align=center border=0>
<tr>
<td class=tdleft>
<table class=pv110tablefull cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td vAlign=top>
<table cellSpacing=0 cellPadding=0 width="100%" border=0>
<tr>
<td class=pv110title colSpan=2 zzz="{$ArticleID}">{$ArticleTitle}</td>
</tr>
<tr>
<td class=pv110info colSpan=2 >{$Article

    发表评论
    请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
    用户名: 验证码:点击我更换图片
    最新评论 更多>>

    推荐热点

    • 火车头采集器dedecms织梦5.7图集发布模块的制作方法
    • PJBLOG页面广告投放终极攻略教程(威客365版)
    • 手动修改实现日志标题左侧小日历效果

    新闻关注排行榜

    热门推荐 最新推荐
    网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
    Copyright © 2008-2015 计算机技术学习交流网. 版权所有

    豫ICP备11007008号-1