如何解决Cloudera可挂载HDFS是否提供重复数据删除功能
|| 研究运行基于HDFS的存储集群,并研究通过Cloudera版本使用可安装HDFS系统的简单方法。 我要问的第一个问题是这将提供自动重复数据删除吗? 我要问的第二个问题是是否将执行重复数据删除,当所有用户删除包含某个重复数据删除块的文件时,它是否真的从存储中删除了该块,或者只是从该用户的索引/引用中删除了该块? 最后,该方法是否包括Rainstor压缩方法? 感谢您的输入解决方法
不,HDFS不包括重复数据删除。
该体系结构主要集中在最佳使用顺序写/读模式上,因此它非常反对重复数据删除,因为我知道的每种重复数据删除方法都会引入一定数量的随机IO模式。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。