频繁项集(frequent itemset)S是指购物篮中至少出现比例(support)为s的集合,其中s为给定的常数。只要该项集出现比例达到你给定的常数s,这些项集都是频繁项集。
设I={i1,i2…,im}为所有项目的集合,设A是一个由项目构成的集合,称为项集。事务T是一个项目子集,每一个事务具有唯一的事务标识Tid。事务T包含项集A,当且仅当AT。
如果项集A中包含k个项目,则称其为k项集。D为事务数据库,项集A在事务数据库D中出现的次数占D中总事务的百分比叫做项集的支持度(support)。如果项集的支持度超过用户给定的最小支持度阈值,就称该项集是频繁项集(或大项集)。
扩展资料:
关联规则,表示的是在某个频繁项集的条件下推出另一个频繁项集的概率。如果该关联规则的置信度大于等于最小置信度,则为强关联规则。
闭频繁项集(closed frequent itemset):当项集X是频繁项集,且数据集D中不存在X的真超集Y,使得X和Y的支持度相等,则X是闭频繁项集。闭频繁项集的表示是无损压缩,不会丢失支持度的信息。通过闭频繁项集可以反推出所有的频繁项集以及相应的支持度。
参考资料来源:百度百科-频繁项集
频繁项集(frequent itemset)S是指购物篮中至少出现比例(support)为s的集合,其中s为给定的常数。
只要该项集出现比例达到你给定的常数s,这些项集都是频繁项集。