sql-server – 集群索引对数据库性能的影响

我最近参与了一个使用SQL Server 2000进行数据存储的新软件项目.

在审查项目时,我发现其中一个主表在其主键上使用聚集索引,其中包含四列:

Sequence  numeric(18,0)
Date      datetime
Client    varchar(9)
Hash      tinyint

该表在正常运行过程中经历了大量插入.

现在,我是C开发人员,而不是DB管理员,但是我对该表设计的第一印象是将这些字段作为集群索引将是非常不利于插入性能,因为数据必须在物理上重新排序每个插入.

另外,我不能真正看到任何好处,因为人们必须频繁地查询所有这些字段来证明聚集索引是正确的?

所以基本上我需要一些弹药,当我去说服他们的权力,表格的设计应该改变.

解决方法

聚集索引应包含最多查询的列,以最大的寻找机会或使非聚簇索引覆盖查询中的所有列.

主键和聚集索引不一定相同.它们都是候选键,表通常有不止一个这样的键.

你说

In addition,I can’t really see any benefit to this since one would have to be querying all of these fields frequently to justify the clustered index,right?

这不是真的.只需使用第一列或两个聚集索引即可.它可能是一个范围寻求,但它仍然是一个寻求.您不必指定它的所有列,以获得这个好处.但列的顺序很重要.如果您主要在客户端查询,则“序列”列是聚集索引中的第一个选择.第二列的选择应该是与第一列(而不是它自己)最多查询的项目.如果发现第二列本身几乎和第一列一样被查询,则非聚簇索引将会有所帮助.

正如其他人所说,尽可能多地减少聚集索引中的列/字节数.

这太糟糕了,序列是一个随机值而不是递增,但可能无法帮助.答案不是抛出一个标识列,除非您的应用程序可以开始将其用作该表上的主要查询条件(不太可能).现在,由于你遇到这个随机的Sequence列(假设它是最常被查询的),我们来看另外一个语句:

having these fields as a clustered index would be very detrimental to insert performance,since the data would have to be physically reordered on each insert.

这不是完全正确的.

磁盘上的物理位置并不是我们在这里所说的,而是在碎片化方面发挥作用,这是一种表现意义.

每个8k页面内的行都没有订购.只是每个页面中的所有行都比下一页更多,而不是上一行.当插入行并且页面已满时,会出现此问题:您将获得页面拆分.引擎必须将插入的行后的所有行复制到新页面,这可能是昂贵的.使用随机密钥,您将得到很多页面分割.您可以通过在重建索引时使用较低的fillfactor来改善问题.你必须使用它来获得正确的数字,但是70%或60%可能比90%更好.

我相信将datetime作为第二个CI列可能是有益的,因为您仍然需要处理需要在两个不同序列值之间分割的页面,但并不像CI中的第二列也是随机的那样糟糕,因为您将保证在每个插入页面上分页,如果该值为升值,则可以将该行添加到页面中获得幸运,因为下一个序列号将从下一页开始.

缩短表中所有列的数据类型和数量以及其非聚簇索引可以提高性能,因为每页更多的行=每个请求的页面读取更少.特别是如果引擎被迫做桌面扫描.将一堆很少查询的列移动到单独的1-1表可能会对您的一些查询产生奇迹.

最后,有一些设计调整也可以帮助(在我看来):

>将Sequence列更改为bigint,以便为每行保留一个字节(8个字节而不是9个数字).
>使用4字节int标识列而不是varchar(9)的客户端查找表.这可以节省每行5个字节.如果可能,请使用2字节的smallint(-32768至32767),每行7个字节的节省更多.

摘要:CI应从最多查询的列开始.从CI中删除任何列.尽可能多地缩短列(字节).使用较低的fillfactor来减轻随机Sequence列引起的页面拆分(如果必须首先被查询最多).

哦,让你的在线碎片整理.如果表不能更改,至少可以经常重组,以保持最佳状态.也不要忽视统计,所以引擎可以选择适当的执行计划.

UPDATE

要考虑的另一个策略是如果表中使用的组合键可以转换为int,并且创建值的查找表.我们假设在超过100行中重复少于所有4列的某些组合,例如,Sequence Client Hash,但只有变化的Date值.然后插入到具有标识列的单独的SequenceClientHash表可能是有意义的,因为您可以查找人造键一次并重复使用它.这也可以让您的CI仅在最后一页(yay)添加新行,并大大减少所有非聚集索引(yippee)中重复的CI大小.但是,这在某些狭窄的使用模式中只会有意义.

现在,marc_s建议仅添加一个附加的int identity列作为聚簇索引.这可能有助于使所有非聚簇索引在每页上获得更多行,但这一切都完全取决于您希望执行性能的位置,因为这将保证表上的每一个查询都必须使用书签查找,你永远不会得到一个表寻求.

关于“吨的页面分割和错误的索引碎片”:正如我已经说过的,可以稍微改善一些较低的填充因子.另外,频繁的在线索引重组(与重建不一样)可以帮助减少这种影响.

最终,这一切都归结于确切的系统及其独特的数据访问模式以及您想要优化哪些部件的决策.对于某些系统来说,只要选择总是快速,插入速度较慢就不会坏.对于其他人来说,选择时间一致但稍慢的选择时间比选择时间稍长,但不一致更为重要.对于其他人来说,数据直到被推送到数据仓库才能真正读取,因此插入需要尽可能快.而混合增加的事实是,性能不仅仅是用户等待时间,甚至是查询响应时间,而且关于服务器资源,特别是在大规模并行性的情况下,因此总吞吐量(例如,在每个时间单位的客户端响应中)比任何其他因素更重要.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


本篇内容主要讲解“sqlalchemy的常用数据类型怎么使用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“sqlalche...
今天小编给大家分享一下sqlServer实现分页查询的方式有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家
这篇文章主要介绍“sqlmap之osshell怎么使用”,在日常操作中,相信很多人在sqlmap之osshell怎么使用问题上存在疑惑,小编查阅了各式资料,整理出
本篇内容介绍了“SQL注入的知识点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧...
1. mssql权限sa权限:数据库操作,文件管理,命令执行,注册表读取等system。是mssql的最高权限db权限:文件管理,数据库操作等 users-administratorspublic权限:数据库操作 guest-users2、sql server注入执行命令查
sql执行计划如何查看?在SPL庞大的数据中我们不知道如何查看实际数据库中发生了什么事情,有必要定期进行查询优化和索引否则会影响我们后期的SQL的查询速度。那么针对这样的问题我们必须要知道SQL执行的计划,在本文中winwin7小编给大家分享下SQL执
SQL Server 是Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点应用非常广泛。不过在使用中,我们会遇到非常多的错误,面对这么庞大的数据库环境,当然会有精确的错误代码的对照季,下面小编分享的
SQL Server本地账户无法登陆出现错误提示:error:40-Could not open a connenction to SQL Server的问题很常见,对于初学者来说可能不知道如何解决,一起来看看下面的解决方案。解决步骤如下:1、这种情况需要开启 SQL Server service
微软推出的SQL2008是一款非常好用的数据库软件,它稳定、功能强大,为众多企业提供了最佳的数据库解决方案,那么我们如何在Windows中安装它呢,一些朋友对SQL Server 2008的安装过程还不是很熟悉,下面就一起来看看SQL Server 2008详细安装图解...
本页概要如果您使用的是 SQL Server 2005备份和还原Sp_detach_db 和 Sp_attach_db 存储过程关于排序规则的说明导入和导出数据(在 SQL Server 数据库之间复
DBCC CHECKIDENT 检查指定表的当前标识值,如有必要,还对标识值进行更正。 语法 DBCC CHECKIDENT ( 'table_name' [ , { NORESEED
这里对 SQL Server 字符串函数进行分门别类地列出,便于查阅和记忆,相信大家都在其它方面有高深的编程基础,从字面上来说大家都知道这些函数的意义,就不对这些函数作过多的解释了,主要谈些经验,具体
查询及删除重复记录的方法 1、查找表(people)中多余的重复记录,重复记录是根据单个字段(peopleId)来判断select*frompeoplewherepeopleIdin(selectpe
微软发SQL Server 2008第二个CTP预览版from: http://news.csdn.net/n/20070807/107158.html8月7日消息,微软公司本周发布了SQL Serv
症状当您将数据库备份恢复到另一台服务器时,可能会遇到孤立用户的问题。SQL Server 联机丛书中的孤立用户疑难解答主题中没有讲述解决此问题的具体步骤。本文介绍了如何解决孤立用户问题。更多信息虽然术
当登录SQL Server 2005时可能碰到错误: 'No Process is on the Other End of the Pipe'。解决方法:(1)Open up SQL
概要本文描述如何映射标准登录和集成登录来解决在运行 SQL Server 的服务器之间移动数据库时的权限问题。更多信息当您将数据库从一个运行 SQL Server 的服务器移到另一个运行 SQL Se
----------------------------------------问题:该用户与可信的SQL SERVER 连接无关联使用sa用户或自建用户使用“SQL SERVER 身份认证”连接数据
更新日期: 2007 年 5 月 20 日 使用下表可以确定各种版本的 Microsoft SQL Server 2005 支持哪些功能。有关 SQL Server 2005 Enterprise E
当从Excel导入数据到Sql Sever中,可能会出现以下问题:
对于指定的缓冲区大小而言,源列的数据太大