浅谈SQL Server中统计对于查询的影响

来源:未知 责任编辑:责任编辑 发表时间:2015-03-01 01:38 点击:
浅谈SQL Server中统计对于查询的影响
 
简介
    SQL Server查询分析器是基于开销的。通常来讲,查询分析器会根据谓词来确定
该如何选择高效的查询路线,比如该选择哪个索引。而每次查询分析器寻找路径时,
并不会每一次都去统计索引中包含的行数,值的范围等,而是根据一定条件创建和更新
这些信息后保存到数据库中,这也就是所谓的统计信息。  www.2cto.com  
 
如何查看统计信息
    查看SQL Server的统计信息非常简单,使用如下指令:
    DBCC SHOW_STATISTICS('表名','索引名')
 
    所得到的结果如图1所示。
    
1
 
    图1.统计信息
 
统计信息如何影响查询
    下面我们通过一个简单的例子来看统计信息是如何影响查询分析器。
我建立一个测试表,有两个INT值的列,其中id为自增,ref上建立非聚集索引,
插入100条数据,从1到100,再插入9900条等于100的数据。图1中的统计信息就是示例数据的统计信息。
    此时,我where后使用ref值作为查询条件,但是给定不同的值,我们可以看出根据统计信息,
查询分析器做出了不同的选择,如图2所示。  www.2cto.com  
    
3
 
     图2.根据不同的谓词,查询优化器做了不同的选择
 
     其实,对于查询分析器来说,柱状图对于运行时可以确定的谓词非常管用,这些谓词比如:
    where date = getdate() 
    where id= 12345 
    where monthly_sales < 10000 / 12 
    where name like “Careyson” + “%”
 
    但是对于比如
    where price = @vari 
    where total_sales > (select sum(qty) from sales) 
    where a.id =b.ref_id
    where col1 =1 and col2=2
 
    这类在运行时才能知道值的查询,采样步长就明显不是那么好用了。
另外,上面第四行如果谓词是两个查询条件,使用采样步长也并不好用。
因为无论索引有多少列,采样步长仅仅存储索引的第一列。当柱状图不再好用时,
SQL Server使用密度来确定最佳的查询路线。
    密度的公式是:1/表中唯一值的 个数。当密度越小时,索引越容易被选中。
比如图1中的第二个表,我们可以通过如下公式来计算一下密度:
    
4
 
    图3.某一列的密度
 
    根据公式可以推断,当表中的数据量逐渐增大时,密度会越来越小。  www.2cto.com  
    对于那些不能根据采样步长做出选择的查询,查询分析器使用密度来估计行数,
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码:点击我更换图片
最新评论 更多>>

推荐热点

  • sql常见面试题
  • SQL SERVER 2005性能之跟踪
  • sql server 列转行
  • SQL SERVER2008日常自动化备份
  • SQL Server 2005 镜像构建手册
  • LINUX上RMAN自动备份脚本
  • 如何将多个SQL查询统计结果一次显示出来
  • SQL编程(一)
  • 浅谈SQL Server中的事务日志(三)----在简单恢复模式下日志的角色
网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索 - 移动版 - 返回顶部
Copyright © 2008-2013 计算机技术学习交流网. 版权所有

豫ICP备11007008号-1