微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

数据库设计 – 大型搜索引擎使用哪些数据库技术?

有人知道谷歌或雅虎如何针对非常大量的数据搜索关键词吗?他们为此采用了哪种数据库或技术?

它需要几毫秒,但它们有超过十亿页索引.

解决方法

我确信有一些组合:

>严重的硬件
>大量的 – 数据在许多节点和不同的数据中心之间分布和复制

>(实际上在谷歌的情况下,至少我相信他们有成千上万的真正的低端服务器)

>缓存了许多常见查询的结果,注意他们如何预先填充您以前从未搜索过的内容的潜在搜索;他们预测你可能会搜索什么,并希望他们已经预先计算出你的结果并在某处缓存.在他们的很多情况下 – 你今天在Google上提出的搜索次数并不多,而你之前没有人问过.当他们确实得到一个新的搜索短语时,他们可能会使用像自由文本搜索这样的东西 – 我希望在首次抓取页面时在语义上提取关键字,而不是在搜索完文档后尝试在文档中查找关键字.当然,他们必须定期使这些缓存无效,重新计算页面排名,并在缓存中分发新的缓存结果 – 我相信这背后有很多严肃的工程.

原文地址:https://www.jb51.cc/mssql/79800.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐