编程开发
c# | C | java | .net | 移动开发 | GO语言 | Perl | Python |
操作系统
Linux | Windows | 虚拟机 |
WEB
ASP | PHP | JSP | JavaScript | 网页设计 | DIVCSS | Ajax技术 | HTML5 |
英语
英语文摘 | 英语口语 | 英语小说 | 英语考试 |
短文学
唯美句子 | 短信摘抄 | 对联谜语 | 励志好语 | 格言物语 | 幽默风趣 | 经典语录 |
范文
实践报告 | 党团范文 | 求职简历 | 竞赛演讲 | 汇报总结 | 自我介绍 | 人事合同 | 其他范文 |
论文
计算机论文 | 英语论文 | 法律论文 | 数学论文 | 会计论文 | 经济论文 | 医学论文 | 历史论文 |
文章
英语学习 | 考研备战 | 范文大全 | 论文大全 | 基础学科 |
学习
英语学习 | 考研备战 | 范文大全 | 论文大全 | 基础学科 |
下载
应用软件 | 网站源码 | 学习资料 | 教程书籍 | 应用素材 | 影视音乐 |

您现在的位置：主页 > 技术中心 > 数据库技术 > Sqlserver

从性能的角度谈SQL Server聚集索引键的选择

来源：未知责任编辑：智问网络发表时间:2013-11-10 20:24　点击:次

Sqlserver Mysql Oracle DB2数据库数据库综合

简介

在SQL Server中，数据是按页进行存放的。而为表加上聚集索引后，SQL Server对于数据的查找就是按照聚集索引的列作为关键字进行了。因此对于聚集索引的选择对性能的影响就变得十分重要了。本文从旨在从性能的角度来谈聚集索引的选择，但这仅仅是从性能方面考虑。对于有特殊业务要求的表，则需要按实际情况进行选择。

g-聚集索引所在的列或列的组合最好是唯一的

这个原因需要从数据的存放原理来谈。在SQL Server中，数据的存放方式并不是以行(Row)为单位，而是以页为单位。因此，在查找数据时，SQL Server查找的最小单位实际上是页。也就是说即使你只查找一行很小的数据，SQL Server也会将整个页查找出来，放到缓冲池中。

每一个页的大小是8K。每个页都会有一个对于SQL Server来说的物理地址。这个地址的写法是文件号：页号(理解文件号需要你对文件和文件组有所了解).比如第一个文件的第50页。则页号为1：50。当表没有聚集索引时，表中的数据页是以堆(Heap)进行存放的,在页的基础上，SQL Server通过一个额外的行号来唯一确定每一行，这也就是传说中的RID。RID是文件号:页号：行号来进行表示的，假设这一行在前面所说的页中的第5行，则RID表示为1:50:5，如图1所示。

图1.RID的示例

从RID的概念来看，RID不仅仅是SQL Server唯一确定每一行的依据，也是存放行的存放位置。当页通过堆（Heap）进行组织时，页很少进行移动。

而当表上建立聚集索引时，表中的页按照B树进行组织。此时，SQL Server寻找行不再是按RID进行查找，转而使用了关键字,也就是聚集索引的列作为关键字进行查找。假设图1的表中，我们设置DepartmentID列作为聚集索引列。则B树的非叶子节点的行中只包含了DepartmentID和指向下一层节点的书签(BookMark)。

而当我们创建的聚集索引的值不唯一时，SQL Server则无法仅仅通过聚集索引列（也就是关键字）唯一确定一行。此时，为了实现对每一行的唯一区分，则需要SQL Server为相同值的聚集索引列生成一个额外的标识信息进行区分，这也就是所谓的uniquifiers。而使用了uniquifier后，对性能产生的影响分为如下两部分：

下面我们进行测试，创建一个测试表，创建聚集索引。插入10万条测试数据，其中每2条一重复，如图2所示。

图2.插入数据的测试代码

此时，我们来查看这个表所占的页数,如图3所示。

图3.插入重复键后10万数据占了359页

我们再次插入10万不重复的数据，如图4所示。

图4.插入10万不重复的建的代码

此时，所占页数缩减为335页,如图5所示。

图5.插入不重复键后缩减为335页

因此，推荐聚集索引所在列使用唯一键。

最好使用窄列或窄列组合作为聚集索引列

这个道理和上面减少页的原理一样,窄列使得键的大小变小。使得聚集索引的非叶子节点减少，而非聚集索引的书签变小，从而叶子节点页变得更少。最终提高了性能。

在前面我们知道。当为表创建聚集索引后。SQL Server按照键查找行。因为在B数中，数据是有序的，所以当聚集索引键发生改变时，不仅仅需要改变值本身，还需要改变这个键所在行的位置（RID），因此有可能使得行从一页移动到另一页。从而达到有序。因此会带来如下问题：

行从一页移动到另一页，这个操作是需要开销的,不仅如此，这个操作还可能影响到其他行，使得其他行也需要移动位置，有可能产生分页行在页之间的移动会产生索引碎片 bsp; 键的改变会影响到非聚集索引，使得非聚集索引的书签也需要改变，这又是一笔额外的开销

这也就是为什么很多表创建一列与数据本身无关的列作为主键比如AdventureWorks数据库中的Person.Address表，使用AddressID这个和数据本身无关的列作为聚集索引列,如图6所示。而使用AddressLine1作为主键的话，员工地址的变动则可能造成上面列表的问题。

图6.创建和数据本身无关的一列作为聚集索引列

最好使用自增列作为聚集索引列

这个建议也同样推荐创建一个和数据本身无关的自增列作为聚集索引列。我们知道，如果新添加进来的数据如果聚集索引列需要插入当前有序的B树中，则需要移动其它的行来给新插入的行腾出位置。因此可能会造成分页和索引碎片。同样的，还会造成修改非聚集索引的额外负担。而使用自增列，新行的插入则会大大的减少分页和碎片。

最近我碰到过一个情况。一个表每隔几个月性能就奇慢无比，初步查看是由于有大量的索引碎片。可是每隔几个月重建一次索引让我无比厌烦。最终我发现，问题是由于当时设计数据库的人员将聚集索引建在了GUID上，而GUID是随机生成的，则可能插入到表的任何位置，从而大大增加了碎片的数量。因此造成上面这种情况。

总结

本文简单介绍了SQL Server存储的原理和应该规避的几种聚集索引建立情况，但这仅仅是从性能的角度来谈聚集索引的选择。对于聚集索引的选择，还是需要全面的考虑进行决定。

相关新闻>>

最新推荐更多>>>

: SQL Server 2008 U

热门新闻进入频道>>

Sqlserver: SQL Server 2008怎样编辑200行以上的数据

Sqlserver: 关于SQL\SQL Server的三值逻辑简析

Sqlserver: SQL server复制分发(发布与订阅)疑难杂症Replication(Publicatio

Sqlserver: ms sql server缓存清除与内存释放

Sqlserver: 查询及删除重复记录的SQL语句

Sqlserver: T-SQL分页存储过程

发表评论

最新评论 进入详细评论页>>

今日头条

更多>>

利用SQL SERVER2005发送邮件

利用SQL SERVER2005发送邮件

查找表包含的页和页所在的表

数据库日志处理

如何将多个SQL查询统计结果一次显示出来

对造成数据库压力翻倍的bad sql的解决方案

SQL SERVER 2005性能之跟踪

SQL小技巧系列 --- 行转列合并

SQL连接，Oracle关联加号(+)等相关知识

sql常见面试题

sql server面试题

推荐热点

您可能感兴趣的文章

快速直达

新闻点评智问网络

新闻关注排行榜

热门推荐最新推荐

sql常见面试题

sql常见面试题

SQL SERVER 2005性能之跟踪

SQL编程（一）

LINUX上RMAN自动备份脚本

sql server面试题

浅谈SQL Server中的事务日志(三)----在简单恢复模式

SQL小技巧系列 --- 行转列合并

如何将多个SQL查询统计结果一次显示出来

sql server 列转行

SQL SERVER2008日常自动化备份

SQL Server 2008 Using the MERGE statement

SQL Server 2008 Using the MERGE statement

MERGE statement is a new feature in SQL Server 2008. It can be used to perform in[详细]

浅谈SQL Server中的事务日志(三)----在简单恢复模式

SQL Server中生成测试数据

记一次死锁问题的排查

sql中外连接条件位置不同导致的查询结果不过

浅谈SQL Server中的事务日志(四)----在完整恢复模式

SQL Server中灾难时备份结尾日志(Tail of log)的两种方

SQL 2000存储过程调试中的日期类型参数

简介如何查看执行计划以及执行计划的准确性

SQL Azure(四) 创建一个SQL Azure数据库

导航

Sqlserver Mysql Oracle DB2数据库数据库综合

?? - ?? - ÝřŝžľŘÝź - TAGąęÇŠ - RSSśŠÔÄ - ??
Copyright © 2004-2024 上海卓卓网络科技有限公司