sql-server – PK索引中列的顺序是否重要?

我有一些非常大的表具有相同的基本结构.每个都有一个RowNumber(bigint)和DataDate(日期)列.每晚使用sqlBulkImport加载数据,并且不会加载任何“新”数据 – 它是历史记录(sql标准,而不是Enterprise,因此没有分区).

因为每个数据位都需要绑定到其他系统,并且每个RowNumber / DataDate组合都是唯一的,这就是我的主键.

我注意到由于我在SSMS表设计器中定义PK的方式,首先列出RowNumber,然后列出DataDate.

我也注意到我的碎片总是非常高~99%.

现在,因为每个DataDate只出现一次,我希望索引器每天只添加页面,但我想知道它是否实际上是基于RowNumber首先进行索引,因此必须转移其他所有内容

Rownumber不是标识列,它是由外部系统生成的int(遗憾的是).它在每个DataDate的开头重置.

示例数据

RowNumber | DataDate | a | b | c..... 
   1      |2013-08-01| x | y | z 
   2      |2013-08-01| x | y | z 
...
   1      |2013-08-02| x | y | z 
   2      |2013-08-02| x | y | z 
...

数据以RowNumber顺序加载,每个加载一个DataDate.

导入过程是bcp – 我已经尝试加载到临时表,然后从那里按顺序选择(ORDER BY RowNumber,DataDate)但仍然出现高碎片.

解决方法

Does the order of columns in a PK index matter?

是的,它确实.

认情况下,主键约束在sql Server中由唯一的聚簇索引强制实施.聚集索引定义表中行的逻辑顺序.可能会添加许多额外的索引页来表示b树索引的上层,但聚簇索引的最低(叶)级只是数据本身的逻辑顺序.

要明确它,页面上的行不一定以物理方式存储在聚簇索引键顺序中.页面中有一个单独的间接结构,用于存储指向每一行的指针.此结构按聚簇索引键排序.此外,每个页面都有一个指向聚簇索引键顺序中同一级别的上一页下一页的指针.

使用(RowNumber,DataDate)的聚簇主键,行首先按行编号进行逻辑排序,然后按DataDate进行逻辑排序 – 因此RowNumber = 1的所有行在逻辑上组合在一起,然后行RowNumber = 2,依此类推.

当您添加新数据(RowNumbers从1到n)时,新行逻辑上属于现有页面,因此sql Server可能需要进行大量工作来拆分页面以腾出空间.所有这些活动都会产生许多额外的工作(包括记录更改),但没有任何收获.

分页面也开始约50%为空,因此过多的拆分会导致页面密度较低(行数少于每页最佳行数).这不仅是从磁盘读取的坏消息(密度越低=读取的页面越多),低密度页面在缓存时也占用更多的内存空间.

将聚簇索引更改为(DataDate,RowNumber)意味着新数据(可能是比当前存储的更高的DataDates)附加到新页面上的聚簇索引的逻辑端.这将消除分割页面的不必要开销,并导致更快的加载时间.较少碎片化的数据还意味着预读活动(在正在进行查询需要之前从磁盘读取页面)可以更有效.

如果不出意外,您的查询更有可能搜索DataDate而不是RowNumber. (DataDate,RowNumber)上的聚簇索引支持DataDate(然后是RowNumber)上的索引搜索.现有的安排仅支持对RowNumber的搜索(并且可能只支持在DataDate上).更改主键后,您可能能够在DataDate上删除现有的非聚簇索引.聚簇索引将比它替换的非聚簇索引更宽,因此您应该进行测试以确保性能保持可接受.

使用bcp导入新数据时,如果导入文件中的数据按聚簇索引键(理想情况下(DataDate,RowNumber))排序并指定bcp选项,则可能会获得更高的性能

-h "ORDER(DataDate,RowNumber),TABLOCK"

为获得最佳数据加载性能,您可以尝试实现最少日志记录的插入.有关更多信息,请参阅:

SQL Server Index Basics
Effective Clustered Indexes
Bulk Inserts Via TSQL
Minimally Logged Inserts

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


SELECT a.*,b.dp_name,c.pa_name,fm_name=(CASE WHEN a.fm_no='LJCG001H' THEN dbo.ELTPNAME(a.fw_nu) ELSE d.fm_name END),e.fw_state_nm,f.fw_rmk_nm
if not exists(select name from syscolumns where name='tod_no' and id=object_id('iebo09d12')) alter table iebo09d12 add tod_no varchar(
select a.*,pano=a.pa_no,b.pa_name,f.dp_name,e.fw_state_nm,g.fa_name from LJSS007H a (nolock) Left join LJPA002H b (nolock) On a.pa_no =b.pa_no Left jo
要在 SQL Server 2019 中设置定时自动重启,可以使用 Windows 任务计划程序。下面是详细的步骤: 步骤一:创建批处理文件 打开记事本。 输入以下内容: net stop "SQL Server (MSSQLSERVER)" net start "SQ
您收到的错误消息表明数据库 'EastRiver' 的事务日志已满,导致数据库操作失败。要解决这个问题,可以按照以下步骤操作: 1. 备份事务日志首先,备份事务日志以释放空间: BACKUP LOG [EastRiver] TO DISK = N'C:\Backup\East
首先我需要查询出需要使用SQL Server Profiler跟踪的数据库标识ID,若不知道怎么查询数据库的标识ID, 打开SQL Server management studio,点击工具。选择SQL Server Profiler。 登录,登录成功后,如果有个默认弹窗,先取消 新建追踪 命名
--最新的解决方法 --先创建用户帐户,不进行授权,然后通过下面的SQL语句将该用户帐户关联至对应的数据库用户。优点是避免了重新授权的操作。 USE tempdbEXEC sp_change_users_login 'Update_One', 'iemis', &#3
命令: ALTER TABLE 表名 add 列名 数据类型 default 默认值 not null 例如: ALTER TABLE LJEL005H add el_req int default 15 not null
declare @i int set @i=340 while @i<415 begin set @i=@iʱ insert into LJWK007H select '2024','28','9110','3PTSD621000000
alter table LJSU002H add default (0) for su_totalamt with values
命令: 有默认值时用:alter table 表名 DROP 约束 alter table 表名 DROP COLUMN 列名 例如: alter table LJEL005H DROP COLUMN el_req 注意: 如果有默认值先删除约束,否则报错: --消息 5074,级别 16,状态 1
mysql报错Unknown collation: utf8mb4_0900_ai_ci 解决方案: 将文件内的所有 utf8mb4_0900_ai_ci 换成 utf8_general_ci utf8mb4 换成 utf8
SQL SERVER根据数据表的某个栏位查询另一个数据表符合条件的某个栏位的值,如果多行则合并为一张字符串形式 要在 SQL Server 中根据一个数据表的某个列查询另一个数据表符合条件的某个列的值,并将多行结果合并为一个字符串,可以使用 FOR XML PATH 子句来执行此操作。以下是一个示例
ALTER TABLE LJPA001H DROP CONSTRAINT DF_LJPA001H_pa_sex_1 ALTER TABLE LJPA001H ALTER COLUMN pa_sex VARCHAR(1)
DATEDIFF和DATEADD函数。DATEDIFF函数计算两个日期之间的小时、天、周、月、年等时间间隔总数。DATEADD函数计算一个日期通过给时间间隔加减来获得一个新的日期。要了解更多的DATEDIFF和DATEADD函数以及时间间隔可以阅读微软联机帮助。使用DATEDIFF和DATEADD函
select top 100 substring(qr_code,8,8) ,* from [LiuJun_PKh_lcfc_hf] --where right(ri,8) or substring(qr_code,8,8)=. select top 10 left(right(one_code,1
1、发现事务日志备份突然停止了 2、查看维护计划中的事务日志设置 3、发现备份任务中,事务日志需要指向的数据库不在 4、进入数据库属性 5、在选项中将恢复模式改为“完整”
select DB_ID('SBTERPDB')
您收到的错误消息表明数据库 'EastRiver' 的事务日志已满,导致数据库操作失败。要解决这个问题,可以按照以下步骤操作: 1. 备份事务日志首先,备份事务日志以释放空间: BACKUP LOG [EastRiver] TO DISK = N'C:\Backup\East