1,鉴于Apriori算法需要反复地扫描事务数据库,产生频繁项集候选的数量巨大,并且在计算支持度计数时工作量巨大。
2,为了避免在产生候选时巨大的工作量,J.Han(韩家炜),J.Pei(裴健),and Y.Yin 提出了频繁模式增长算法,即本文中要说的FP-Growth 算法。此算法最主要的有点就是避免了产生候选频繁集。
3,FP-Growth 算法利用了如下的性质:局部频繁项由短模式生长出长模式,即先求短的频繁项,然后由短的频繁项衍生出长的频繁项。
4,FP-Growth 算法主要的步骤就是构造一棵 FP 树。如下图:
5,
FP 树的优点如下:
6,条件模式基和条件FP 树:
7,FP-Growth 算法的思想和方法:
8,FP-Growth 算法 PK Apriori 算法:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。