如何解决如何用 nltk 计算条件熵?
我正在研究一些 NLP 问题,现在我想计算文本的条件熵(使用 n-gram)。
我曾尝试使用 nltk.bigrams
、nltk.probability.ConditionalFreqDist
和 nltk.probability.ConditionalPorbDist
。但是,我发现 nltk.probability.ConditionalPorbDist
类不存储任何有关条件概率的信息,因此我只能获取给定条件下的熵。
是否有我在 nltk
或任何其他软件包中找不到的其他工具?当然,我可以自己写,但我想知道是否有任何现成的包可以使用(我相信应该有),因为我自己写的可能要慢得多。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。