单一世界架构初探之数据管理

海量在线，意味着海量的数据，比如10M的在线人员的个人资料。如果处理呢？依赖数据库可不行，那肯定被拉死了。更可怕的是，所有的数据还必须是实时的。当一个人从地上捡取一个金币的话，那么他的金币总额必然要增加。这个稍微简单点，因为只要在原有数据上加个值就可以了。但是，他要是捡取一个设备时，稍微要复杂点。因为要添加这个设备的部分属性到该角色上。还有更复杂的是，即时战斗中，生命或者魔法值都必须在很短时间内被处理。当一个人中了个火球，一秒钟后才被扣除生命，这个显然是个笑话。

在单一世界中，关于数据的管理，我们首先要将他按变化频率划分为几种类型：

1、活性数据，这种数据要求在很短时间被计算和更新，比如生命值，在战斗的时候，变化频率非常高的。

2、惰性数据，有种数据很少发生改变或者只能在某些情况下发生改变，比如装备。我不知道怎么定义他，所以使用惰性这个化学上概念感觉蛮合适的。

3、持久数据，还有些数据更难发生变化，比如角色名称。

其次，我们将数据的实时性划分为几种类型：

1、即时数据，这种数据在计算时，必要要求马上被得到，比如生命值。

2、延时数据，这种数据一般不参与实时计算，允许延时得到响应，比如好友列表。

3、历史数据，这种数据多数用于审计或者后续计算等，比如充值历史。

从这2大类划分，我们可以得到这么个策略。我们把历史数据、惰性数据、持久数据放入到数据库中，这没有关系。我们把即时数据、延时数据、活性数据放入到内存中。这样就很简单了，不过还有个问题，我们划分的标准是不一样的，持久数据也可能是即时数据，比如角色名，他要随时显示在角色的边上。这意味着，存在交叉情况。1、纯粹的内存数据，比如生命值；不过生命上限必须从数据库中获取。2、纯粹的数据库数据，比如充值历史。没有必要放在内存中，不过计算按时收费是要用的，比如魔兽世界的点数。3、存储在数据库中，但必须拉到内存中，比如名称或者实时点数。

说了一大堆，实际上只为了说明2点，一个是如何管理内存数据，第二个是如何管理数据库到内存的数据。这2个问题本身就复杂，如果放在海量的在线数上就更加的复杂。

我们首先探讨登录过程中，面临的海量个人资料问题，因为角色名称这个数据具有多种特性。既是持久数据，又是即时数据，他需要从数据库直接拉到内存中。当登录时候，需要个人资料，包括角色名称。在登录管理中，我们已经实现了如何分配服务器来负载均衡，这里我们要探讨海量数据的检索架构。

第一，海量数据被存储，导致磁盘阵列或者其他高级的存储架构会被采用。

第二，集群或者分布的方式，在这里是个可行的方案。特定的角色或者用户被按特定的策略被划为到某个IP的服务器上。比如，首先对角色名进行hash，得出一个值，然后存储到到和hash值相匹配的数据库上。当然，还可以更高级的策略，比如GFS等，但这种简单的策略应该是足够了。

第三、内存数据库，和传统方式的数据库，将数据存储在磁盘不同，内存数据库完成将数据存储在内存。10M的在线，需要多少内存呢？以每个在线数1K的内存使用量，那么10M只需要10G的内存，呵呵，好像也不是很大啊。

当数据导入到内存后，刷新完成可以在内存中完成，不过应该注意到，必须保证数据的一致性和故障导致的灾难。如果一台机器突然宕机了，那么内存中的数据将全部丢失，这是个很可怕的灾难。更详细的探讨，请参见我的博客，关于高可用高性能的探讨。

第四、内存数据库的一致性，这个本来是数据库的事情，但由于关系重大，所以要拿出来说。由于海量的数据，导致内存数据库必须具备分布的特性。这有2个问题，必须关注。

1、数据更新的主动通知。数据库必须记录，还有哪些其他数据库引用了本数据库的数据，一旦更新了，显然要通知他们。

2、数据的唯一检索路径。由于一份数据可能分布在多个地方。但关键数据必须只有一个地方是权威的。

1主多从，是通常被采用的处理方法，在这里可能被扩展为多主多从，但原理是一样的。对于某个特定的用户来说，依然是1主多从。我们将关键的逻辑依赖于主数据库，其他的依赖于从数据库。比如，我们更改了名称，那么所有看到该角色的人都同时看到这个角色名称的变更，但其他没有在线或者在其他地方的好友却没有必要马上看到，那么这种延时是可以容忍的。

单一世界架构初探之数据管理

相关推荐