|
|
基于关系数据库的关联规则挖掘算法DB-growth |
白似雪; 段仕林; 梅舒 |
南昌大学信息工程学院 |
|
|
摘要 从大数据中挖掘隐藏的、多维的有价值的关联规则具有广泛的应用价值。关联规则挖掘经典算法Apriori存在重复扫描数据库并产生大量候选项集的瓶颈问题,FP-growth算法虽不产生候选集,但FP-tree不支持大数据的存储与遍历,不能有效支持大数据挖掘;另外,Apriori以及FP-growth算法实施增量挖掘都需要重构关联规则,不适用于增长型事务数据挖掘。针对这些问题,设计基于关系数据库表SourceIndex的DB-growth算法,采用模式组合生成模式串的方式,更新数据库构建频繁集,有效地提高了关联规则的挖掘效率,同时对增量挖掘及深度挖掘也能得到较好的支持。 更多还原
|
|
关键词 :
关联规则挖掘,
Apriori算法,
FP-growth算法,
DB-growth算法,
增量挖掘,
深度挖掘
|
|
|
|
|