fiogf49gjkf0d
云环境下基于二进制编码聚类的并行频繁项集挖掘算法
 
刘博,李云,张晓斌,徐杰
 
本文提出了一种云环境下基于二进制编码的并行频繁项集挖掘算法,利用一种特殊的二进制编码的依赖度计量方法对原始数据集合进行编码转换及依赖度聚类,然后将数据集分布部署在云环境中,并采用共享多头表的FP-Growth并行改进算法挖掘频繁项集.实验表明,对于大规模数据集来说,本文算法可以取得良好的性能.
 
关键词:云计算;二进制编码;聚类;并行;频繁项集
 
temp_12120108551414.rar