信息专题提供信息的最新资讯内容,帮你更好的了解信息。
信息流聚合类系统(如RSS阅读器)中数据同步的架构设计 目录 1 需求 2 基于时间戳的设计 3 基于每个用户消息队列的设计 4 书签(或网盘类应用)的双向同步问题 需求 要求支持用户能够用一个账号在多台设备上同步数据(这要求同步状态存储在服务器上) 凡是需要在服务器存储用户状态数据的,需要评估存储容量的限制 要求用户标记为已阅的信息下次刷新不会再从服务器重复刷新 要求能够支持书签(或网盘类应用)
我想起之前有研究生同学曾经参与一个实习项目,他们用SQL数据库来实现一个RSS订阅聚合系统,结果遇到了扩展性问题:当RSS源达到上千的时候,并发查询性能就已经下降到不可接受。 之后我遇到的实用的信息聚合系统:Google阅读器、以及Feedly。Feedly的官方博客里说它的后台是用HBase来存的。我不禁好奇其数据架构设计到底是怎么做的。 首先,容易想到的是,为每篇博客文章关联RSS源id(博客