如何解决txt 文件或字符串中每个字符的熵是多少,以及如何在 java 中做到这一点?
我已经看到了一些与此主题相关的问题和答案。但它们实际上是与数学和python相关的。我想了解 txt 文件或字符串中字符的熵是什么意思,以及使用 Java 语言找到它的可能方法是什么。
谢谢。
解决方法
单独的单个字符不具有熵(好吧,我想我们可以说我们有 N 分之一的机会猜到它,对于 N 个可能的字符的字母表)。 “熵”是无序。因此,一个字符在上下文中越“随机”,它的熵就越高。
考虑五个字符的序列“banan”。如果下一个字符是“a”,则它的熵非常低——整个序列很可能是“香蕉”这个词。
为了通过程序确定熵,您需要了解概率。如果域是“单词”,那么您至少需要知道特定短序列中出现一个字母的可能性。或者,给定一个相当完整的字典,您可以计算该可能性。
还有更多技术说明,例如编码字符串所需的最少位数。那是你想的吗?例如,请参见 this Wikipedia page。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。