微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

java – Neo4j索引(使用Lucene) – 组织节点“类型”的好方法?

这实际上更像是一个Lucene问题,但它是在neo4j数据库的上下文中.

我有一个数据库,它被分为50个左右的节点类型(所以“其他类型的dbs中的”集合“或”表“).每个属性都有一个需要索引的属性子集,有些属性名称相同,有些则没有.

搜索时,我总是希望找到特定类型的节点,而不是所有节点.

我可以看到三种组织方式:

>每种类型一个索引,属性自然映射到索引字段:index’foo’,’id’=’1234′.
>单个全局索引,每个字段映射到属性名称,以区分类型或者将其包含为值的一部分(‘id’=’foo:1234’)或者在返回节点后检查它们(我希望重复这些节点)非常罕见).
>单个索引,类型是字段名称的一部分:’foo.id’=’1234′.

创建后,数据库是只读的.

在便利性,大小/缓存效率或性能方面,其中之一是否有任何好处?

据我所知,对于第一个选项,neo4j将为每种类型创建一个单独的物理索引,这似乎不是最理想的.对于第三个,我最终得到的大多数lucene文档只有一小部分字段,不确定是否会影响任何内容.

最佳答案
单个索引将小于几个小索引,因为某些数据(例如术语词典)将被共享.但是,由于术语字典查找是O(lg(n))操作,因此在较大术语字典中查找可能会慢一些. (如果你有50个索引,这只需要6(2 ^ 6> = 50)个比较,你可能不会注意到任何差异.)

较小索引的另一个优点是OS缓存可能使查询运行得更快.

而不是你的选项2和3,我会索引两个不同的字段id和类型并搜索(id:ID AND type:TYPE),但我不知道是否可以使用neo4j.

原文地址:https://www.jb51.cc/java/438052.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐