微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

NLP笔记之 语言模型的平滑技术

基于markov的语言模型,在遇到未登录词时,会将语法合理的句子概率计算为0.这是不合理的。

Add-one Smoothing (laplace smoothing)

P_{MLE}\left ( w_{i}|w_{i-1} \right )=\frac{c\left (w_{i-1}\cdot w_{i} \right )}{c\left (w_{i} \right )}

P_{Add-1}\left ( w_{i}|w_{i-1} \right )=\frac{c\left (w_{i-1}\cdot w_{i} \right ) +1 }{c\left (w_{i} \right ) + V}

分母上加一个V(词典大小)的一个理由,使概率之和为1.

Add-K Smoothing 

P_{Add-k}\left ( w_{i}|w_{i-1} \right )=\frac{c\left (w_{i-1}\cdot w_{i} \right ) +\boldsymbol{{\color{Red} k}} }{c\left (w_{i} \right ) + \boldsymbol{{\color{Red} kV}}}

以perplexity为优化目标,计算最优的

\boldsymbol{k}

Interpolation平滑

核心思想:计算Trigram概率时同时考虑Unigram,Bigram,Trigram出现的频次。

P\left ( w_{n}|w_{n-1},w_{n-2} \right )=\lambda _{1}P\left ( w_{n}|w_{n-1},w_{n-2} \right ) +\lambda _{2}P\left ( w_{n}|w_{n-1} \right ) +\lambda _{3}P\left ( w_{n} \right )

\lambda _{1}+\lambda _{2}+\lambda _{3}=1

Good-Turing平滑

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐