微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

ruby-on-rails – 用于文本比较的Ruby gem

我正在寻找一个可以比较两个字符串(在这种情况下是文本段落)的宝石,并且能够衡量它们在内容上相似的可能性(可能只有几个单词重新排列,更改).我相信当用户提交问题时,SO会使用类似的东西.

解决方法

我可能会使用像Diff :: LCS这样的东西:
>> require "diff/lcs"
>> seq1 = "lorem ipsum dolor sit amet consequtor".split(" ")
>> seq2 = "lorem ipsum dolor amet sit consequtor".split(" ")
1.9.3-p194 :010 > Diff::LCS.diff(seq1,seq2).length
 => 2

它使用longest common subsequence算法(使用LCS获取差异的方法the wiki page中描述).

原文地址:https://www.jb51.cc/ruby/268340.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐