微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

计算字符串中给定字符的概率多项式似然

如何解决计算字符串中给定字符的概率多项式似然

我有几个示例,其中每个示例都有两个字符串。一个是原始字符串,另一个是替代字符串。例如,如果您考虑以下情况(下面附加的数据框图像中的第一个示例):

org_string = 'TACCA'
alternative_string = 'CGTTG'

enter image description here

对于每个字符,我都有每个替代字符的计数和频率。例如,在原始字符串中,我们在索引0处有一个 T (在图像中为 ref 列),在替代字符串中(该列为 > alt (在所附图片中)。因为我们对其进行了18次采样(请参见附件中的 AN )。只有1次(请参见图片中的 AC ),我们获得了 C ,频率为1/18 = 0.056(请参见图片中的 AF 列)附件)。我想计算在python中每个位置给定频率下观察计数的可能性。我正在考虑在python中使用script.stats.multinomial。但是我不太了解如何在这种情况下使用它。这是多项式,因为在给定位置字符可以是 A,G,C或T 。见解会有所帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。