微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用C比较巨大的文件

我有两个大文本文件,每个文件有超过1000万行.如何使用C比较文件并在文件获取不同的行.

我尝试将一个文件加载到内存中并对内存进行排序,并使用二叉​​树逻辑来比较文件.它比较并给了我20秒的结果.但它消耗更多的内存. (文本文件大约500 MB).

我想比较两个文件而不消耗更多内存,良好的性能和对硬盘的影响最小.

解决方法

你可以使用两遍法.

第一遍,你读取文件但只存储行的哈希值和行起始位置,然后你可以根据哈希值比较文件,你只能在第二遍中读取行再次完成比较,当两行具有相同的哈希值时.这样可以节省内存消耗和cpu时间,两次读取一些行会有点损失.

原文地址:https://www.jb51.cc/c/118811.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐