如何解决替代SQL Server链接服务器 选项1 选项2
我正在尝试构建一个程序,该程序比较具有确切表但在某些表中具有附加列的2个数据库服务器。我正在使用链接服务器连接这2个数据库服务器。
但是我发现一个问题,当我尝试比较一些数据时,连接大部分超时。而且,当我检查“活动监视器和执行计划”时,超过90%的信息在远程查询中-这使得比较1条具有5个子条目的记录运行5-7分钟。
这是我尝试运行的示例查询。
Select
pol.PO_TXN_ID,pol.Pol_Num
From
ServerA.InstanceA.dbo.POLine pol
Where
not exist (Select 1
From ServerB.InstanceA.dbo.POLine pol2
where pol.PO_TXN_ID = pol2.PO_TXN_ID
and pol.Pol_Num = pol2.Pol_Num)
我尝试使用OPENROWSET
,但是我们的管理员不允许将其安装在生产服务器上。
解决方法
选项:
- OpenQuery()/用临时表命名的4部分。
- ETL(例如:SQL Server集成服务)
链接服务器的问题,尤其是像您的示例中那样用4部分命名的问题:
- 查询引擎不知道如何优化它。他无法访问链接服务器上的统计信息
- 进行全表扫描,将所有数据拉至源SQL Server,然后进行处理。 (网络IO高,执行计划不正确,导致查询运行时间长)
选项1
- 创建一个临时表(最好带有索引)
- 使用OPENQUERY(最好是过滤条件)查询链接的服务器。例如:
CREATE TABLE #MyTempTable(Id INT NOT NULL PRIMARY KEY,/*Other columns*/)
INSERT INTO #MyTempTable(Id,/*Other columns*/)
SELECT *
FROM OPENQUERY(ServerA,'SELECT Id,/*Other columns*/ FROM Table WHERE /*Condition*/')
- 使用临时表进行计算。
仍然需要至少1个链接服务器
当您的数据库不是SQL Server(例如Postgres,MySql,Oracle等)时,由于查询是在链接服务器上执行而不是将所有数据拉到源服务器上,因此OPENQUERY的性能更好。
选项2
您可以使用SQL Server Integration Services(SSIS)之类的ETL工具
- 从2台服务器加载数据
- 使用Slowly changing dimension或lookup组件确定差异。
- 插入/更新您想要/需要的东西
不需要链接服务器,SSIS可以直接连接到数据库
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。