如何解决LBG向量量化-分裂因子
我目前正在编写语音识别程序。在使用LBG(Linde-Buzo-Gray)算法生成密码本的步骤中,我读到分裂因子epsilon = 0.01(通常)
分裂因子用于根据公式分裂语音特征的质心(训练集)
Yn + = Yn *(1 + epislon)
Yn- = Yn *(1-ε)
其中n是要分割的给定代码字/质心的indes,而Yn是代码字。
此外,在生成密码本之后,将为每个语音特征向量(训练集)搜索最近的邻居,并更新质心(基本上是特征聚类)。直到编码簿的失真小于epsilon为止。
尽管我的程序似乎运行良好,但我很想知道为什么拆分因子通常设置为0.01。
感谢您的帮助。这是我第一次使用密码本和矢量量化。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。