微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从超过 100 亿个数字的双打流中计算运行中位数

如何解决从超过 100 亿个数字的双打流中计算运行中位数

我的应用正在接收总数量超过 100 亿的双打数据流。我需要从这些数字中计算出一些统计参数。我找到了计算平均值和众数的方法。 但我有中位数问题。 为此有最大堆/最小堆解决方案(在第一个答案中给出 Running median)。但是通过这种方式,我必须在每个堆(或更​​多)中存储 50 亿个双精度数。数组、列表或字典无法做到这一点。我该怎么做?如果我的下一个元素与 maxHeap 的元素相同,我在描述的解决方案中必须做什么?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。