如何解决使用 accumulo 进行大量摄取
使用 accumulo 1.7.4 和 cloudera HDFS 在 AWS 上进行海量数据摄取(多 TB 数据摄取)。
我没有看到大量的引用,但是利用更少的节点和更大的实例带宽和内存/cpu 和带有预拆分表的 HD 空间,或者更多的节点和更小的内存/cpu 是更好的速度吗?和更小的高清?
我最初使用 EBS 卷进行存储,发现使用本地 NVME 存储然后在操作完成时将数据快照到 EBS 更有利,所以我认为我没有触及任何 I/O 相关的边界......
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。