您现在的位置:计算机技术学习网 > 技术中心 > WEB编程 > ASP >

实例讲解asp抓取网上房产信息(1)

来源:网络整理 责任编辑:栏目编辑 发表时间:2013-07-01 13:00 点击:

    附:抓取信息的详细页面事例
  
  <%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
  <!-- #include file="conn.ASP" -->
  <!-- #include file="inc/function.asp" -->
  <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
  "http://www.w3.org/TR/html4/loose.dtd">
  <html>
  <head>
  <title>Untitled Document</title>
  <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
  <meta http-equiv="refresh" content="300;URL=steal_house.asp">
  </head>
  <body>
  <%
  on error resume next
  '
  Server.ScriptTimeout = 999999
  '========================================================
  '字符编码函数
  '====================================================
  Function BytesToBstr(body,code)
  dim objstream
  set objstream = Server.CreateObject("adodb.stream")
  objstream.Type = 1
  objstream.Mode =3
  objstream.Open
  objstream.Write body
  objstream.Position = 0
  objstream.Type = 2
  objstream.Charset =code
  BytesToBstr = objstream.ReadText
  objstream.Close
  set objstream = nothing
  End Function
  '取行字符串在另一字符串中的出现位置
  Function Newstring(wstr,strng)
  Newstring=Instr(lcase(wstr),lcase(strng))
  if Newstring<=0 then Newstring=Len(wstr)
  End Function
  '替换字符串函数
  function ReplaceStr(ori,str1,str2)
  ReplaceStr=replace(ori,str1,str2)
  end function
  '====================================================
  function ReadXML(url,code,start,ends)
  set oSend=createobject("Microsoft.XMLHTTP")
  SourceCode = oSend.open ("GET",url,false)
  oSend.send()
  ReadXml=BytesToBstr(oSend.responseBody,code )
  start=Instr(ReadXml,start)
  ReadXml=mid(ReadXml,start)
  ends=Instr(ReadXml,ends)
  ReadXml=left(ReadXml,ends-1)
  end function
  function SubStr(body,start,ends)
  start=Instr(body,start)
  SubStr=mid(body,start+len(start)+1)
  ends=Instr(SubStr,ends)
  SubStr=left(SubStr,ends-1)
  end function
  dim getcont,NewsContent
  dim url,title
  url="http://www.***.com"'新闻网址
  getcont=ReadXml(url,"gb2312","<table class=k2 border=""0""","</table>")
  getcont=RegexHtml(getcont)
  dim KeyId,NewsClass,City,Position,HouseType,Level,Area,Price,Demostra
  dim ContactMan,Contact
  for i=2 to ubound(getcont)
  response.Write(getcont(i)&"__<br>")
  
  tempLink=mid(getcont(i),instr(getcont(i),"href=""")+6,instr(getcont(i),"""
  onClick")-10)
  tempLink=replace(tempLink,"../","")
  
  response.Write(i&":"&tempLink&"<br>")
  NewsContent=ReadXml(tempLink,"gb2312","<td valign=""bottom""
  width=""400"">","<hr width=""760""
  noshade size=""1"" color=""#808080"">
  ")
  NewsContent=RemoveHtml(NewsContent)
  NewsContent=replace(NewsContent,VbCrLf,"")
  NewsContent=replace(NewsContent,vbNewLine,"")
  NewsContent=replace(NewsContent," ","")
  NewsContent=replace(NewsCont

    发表评论
    请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
    用户名: 验证码:点击我更换图片
    最新评论 更多>>

    推荐热点

    • WAP常见问题问答大全(四)
    • ASP开发必备:WEB打印代码大全
    • ASP调用系统ping命令
    • asp缓存技术
    • ASP教程:第三篇 ASP基础
    • 用ASP+XML打造留言本(4)
    • 关于ASP Recordset 分页出现负数解决方法及建议
    • 用asp怎样编写文档搜索页面(5)
    • ASP处理多关键词查询实例代码
    网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
    Copyright © 2008-2015 计算机技术学习交流网. 版权所有

    豫ICP备11007008号-1