我只是想知道我们是否可以在lucene中实现一些RDBMS功能.
例:
1)我有10,000个项目文档(pdf文件),必须将其内容编入索引以使其可供搜索.
2)每份文件都与单一项目有关.项目可以包含项目名称,编号,开始日期,结束日期,位置,类型等详细信息.
我必须在pdf文件的内容中搜索给定的关键字,但在显示结果时,我想显示项目元数据,如第(2)点所述.
我的想法是在索引时将名为projectId的字段与每个pdf文件相关联.一旦我们得到了,我们将再次触发搜索以获取项目元数据.
这样我们就可以避免重复数据.此外,如果我们想要更新项目元数据,我们最终只能在SINGLE PLACE更新.否则,如果我们使用所有pdf doument索引存储这个元数据,我们将最终更新所有文档,这不是我想要的方式.
请指教.
解决方法
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。