我正在研究sql server 2008 DB和asp.net mvc web电子商务应用程序.
我有不同的用户将他们的产品提供给数据库,我想比较具有相似名称的产品的价格.
我知道字符串匹配是特定于域的,但我仍然需要最好的通用解决方案.
对搜索结果进行分组的最有效方法是什么?
我应该使用Levenshtien distance算法递归地比较每个记录吗?
我应该在数据库中还是在代码中执行此操作?
有没有办法为此任务实时实施SSIS模糊分组?
有没有一种有效的方法来使用sql server 2008自由文本搜索?
编辑1:
那么网络图分析呢.如果我使用Levenshtien distance算法定义矩阵,我可以使用聚类算法(例如:clauset newman moore)和单独的组,它们之间没有语音路径.
我附上了尼克约翰逊(见评论)猫狗(例如红线是簇) – 并且通过使用clauset newman moore,我正在创建2个不同的簇并从狗中分离猫.
你怎么看?
解决方法
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。