微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

数据流熵计算

如何解决数据流熵计算

我正在寻找一种方法来计算流数据的香农信息熵估计 H'(X)。随机变量 X 的状态空间很大,其中数千个计算将并行运行,因此将每个 X 观测值与相应的计数器存储在内存中是不可行的,因此无法使用常规计算公式。

据我所知,互联网上没有这种算法的实现。我所能找到的只是几篇包含大量数学内容(可能还有一些伪代码)的论文,我要么无法从实际的角度解读这些内容,要么算法无法用于一般目的(例如要求流大小为知道) - 示例:[1]。

是否有任何可用的实现/可用算法或 Python 库用于我无法找到的数据流的熵估计计算?或者是否有另一种方法可以以内存友好的方式检索熵估计?提前致谢。

[1] LALL A. 等。 用于估计网络流量熵的数据流算法。 2006. [在线]。可在:https://www.cc.gatech.edu/~jx/reprints/Sigm06_entropy.pdf

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。