如何解决Parquet 为支持嵌套结构而进行的权衡 - 没有此功能的替代格式 + 其他功能
正如官方 site 中提到的,parquet 对嵌套结构的设计作为核心元素提供了广泛的支持:
Parquet is built from the ground up with complex nested data structures in mind,and uses the record shredding and assembly algorithm described in the Dremel paper. We believe this approach is superior to simple flattening of nested name spaces.
支持嵌套结构涉及哪些权衡?除了这种支持之外,是否有类似于 Parquet 的文件格式(即至少需要是柱状、二进制、类型/模式、高级压缩)?如果我只处理平面表格,使用其他格式是否会有所收获?
我对支持轻松更新和删除的文件格式特别感兴趣。我不确定不支持嵌套模式是否会在这个方向上有所帮助。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。