如何解决准备文档以从 Hadoop 集群摄取到 Solr
我有 200 GB 关于 S3 中不动产的非规范化结构化信息,这些信息被 Apache Hive 中的外部表引用。与我合作的团队希望将其引入 Apache Solr 等工具中。在 Hadoop 集群上准备具有嵌套子数据的 JSON 文档的最佳方法是什么。有没有办法从 Hive 做到这一点? HBase?如果我将其添加到组合中?我正在使用 Amazon 的 EMR 根据需要创建/重新创建集群。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。