Csdn Blog在2007年,由于访问量和数据量的大幅度增长,使得我们原有的在.text 0.96版本上修改的代码基本不堪重负。
在数据库方面主要表现为,单单文章表,2007年1年的数据已经达到了30G的量(最后的解决方案是对把文章表分为两个表,分别存放文章相关信息和专门存放文章内容的表,然后对两个表作分区)。熟悉.Text得朋友可能知道,有一个专门记录流量的表,页面内的每一次点击,直接记录到数据库里面,反映到页面上就是单个用户的博客流量,分别是EntryID,BlogID,DateTime,表名称叫做blog_viewcount,这个表我们现在已经到了4亿的数据,之前仅仅是优化索引和索引试图来在真实的环境中查看到底sql2005单表能负载多大的量。
最后得出结论,在sql2005中,单表的量最多不能超过200w数据。
而文章表和blog_viewcount这个表,我们现在采用2005得新特性,分区表来实现。事实上,反映还不错。以下写出创建分区表的步鄹(我们用blog_viewcount来做实例):
先根据表数据的量大小,来拆分每一个分区,保证分区之间在200w以下的数据
然后我们需要添加相应的文件组
第三步,我们需要在服务器上建立出单独的文件(涉及到的朋友可能知道,我们如果把文件分布在不同的磁盘上,可以最大限度的提高磁头的读写能力;另:这里微软建议数据库服务器最好作Raid0 + Raid1)
在数据库方面主要表现为,单单文章表,2007年1年的数据已经达到了30G的量(最后的解决方案是对把文章表分为两个表,分别存放文章相关信息和专门存放文章内容的表,然后对两个表作分区)。熟悉.Text得朋友可能知道,有一个专门记录流量的表,页面内的每一次点击,直接记录到数据库里面,反映到页面上就是单个用户的博客流量,分别是EntryID,BlogID,DateTime,表名称叫做blog_viewcount,这个表我们现在已经到了4亿的数据,之前仅仅是优化索引和索引试图来在真实的环境中查看到底sql2005单表能负载多大的量。
最后得出结论,在sql2005中,单表的量最多不能超过200w数据。
而文章表和blog_viewcount这个表,我们现在采用2005得新特性,分区表来实现。事实上,反映还不错。以下写出创建分区表的步鄹(我们用blog_viewcount来做实例):
先根据表数据的量大小,来拆分每一个分区,保证分区之间在200w以下的数据
CREATE PARTITION FUNCTION OneYearDaterangePFN(datetime)
AS RANGE LEFT FORVALUES
(
'20070131 23:59:59.997',
20070228 23:59:59.99720070331 23:59:59.99720070430 23:59:59.99720070531 23:59:59.99720070630 23:59:59.99720070731 23:59:59.99720070831 23:59:59.99720070930 23:59:59.99720071031 23:59:59.99720071130 23:59:59.99720071231 23:59:59.997
)
AS RANGE LEFT FORVALUES
(
'20070131 23:59:59.997',
20070228 23:59:59.99720070331 23:59:59.99720070430 23:59:59.99720070531 23:59:59.99720070630 23:59:59.99720070731 23:59:59.99720070831 23:59:59.99720070930 23:59:59.99720071031 23:59:59.99720071130 23:59:59.99720071231 23:59:59.997
)
然后我们需要添加相应的文件组
ALTERDATABASE newcsdnblog ADD FILEGROUP [ViewCount200701]
ViewCount200702ViewCount200703ViewCount200704ViewCount200705ViewCount200706ViewCount200707ViewCount200708ViewCount200709ViewCount200710ViewCount200711ViewCount200712]
ViewCount200702ViewCount200703ViewCount200704ViewCount200705ViewCount200706ViewCount200707ViewCount200708ViewCount200709ViewCount200710ViewCount200711ViewCount200712]
第三步,我们需要在服务器上建立出单独的文件(涉及到的朋友可能知道,我们如果把文件分布在不同的磁盘上,可以最大限度的提高磁头的读写能力;另:这里微软建议数据库服务器最好作Raid0 + Raid1)
newcsdnblog
FILE
(NAME = Nf:SmallTableViewCount200701.ndf 5MB,MAXSIZE 100MB,FILEGROWTH 5MB)
TO
f:SmallTableViewCount200702.ndff:SmallTableViewCount200703.ndff:SmallTableViewCount200704.ndff:SmallTableViewCount200705.ndff:SmallTableViewCount200706.ndff:SmallTableViewCount200707.ndff:SmallTableViewCount200708.ndff:SmallTableViewCount200709.ndff:SmallTableViewCount200710.ndff:SmallTableViewCount200711.ndff:SmallTableViewCount200712.ndf]
FILE
(NAME = Nf:SmallTableViewCount200701.ndf 5MB,MAXSIZE 100MB,FILEGROWTH 5MB)
TO
f:SmallTableViewCount200702.ndff:SmallTableViewCount200703.ndff:SmallTableViewCount200704.ndff:SmallTableViewCount200705.ndff:SmallTableViewCount200706.ndff:SmallTableViewCount200707.ndff:SmallTableViewCount200708.ndff:SmallTableViewCount200709.ndff:SmallTableViewCount200710.ndff:SmallTableViewCount200711.ndff:SmallTableViewCount200712.ndf]
第四步,创建关联
第五步,创建表和索引(我这里只列出如何创建表)
TABLE dbo.Blog_ViewCount2
(
EntryIDint NOTNULLBlogIDViewDatedatetime
)
ON OneYearDaterangePScheme (ViewDate)
GO
(
EntryIDint NOTNULLBlogIDViewDatedatetime
)
ON OneYearDaterangePScheme (ViewDate)
GO