|
摘要 密度峰值聚类算法(DPC)是近年来提出的一种新的密度聚类算法,其核心基于局部密度和相对距离。该算法在定义局部密度以及相对距离时直接用欧式距离,导致在一些稀疏差异大及长弧形的类簇聚类效果差,且一步分配策略的鲁棒性不佳。提出基于随机游走的密度峰值聚类算法(RW-DPC),即引入随机游走首次到达模型来刻画数据点之间的相似性,重新定义数据点的局部密度,且给出一种新的样本分配策略。对比在人工数据集和UCI真实数据集上与其他聚类算法的实验结果,说明对于密度不均匀及弧形类的数据集,本文算法的聚类效果优于密度峰值聚类算法以及其他算法。
|
|
关键词 :
密度峰值,
聚类,
随机游走
|
|
基金资助:国家自然科学基金资助项目(72071099)~~; |
[1] |
刘稀文段隆振段文影. 基于FCM的簇内欠采样算法[J]. 南昌大学学报(理科版), 2021, 45(5): 437-. |
[2] |
万乐闫小青张纯陈红亮. 玻璃纤维复合材料拉伸损伤的声发射信号模式识别分析[J]. 南昌大学学报(工科版), 2020, 42(1): 23-. |
[3] |
徐兵束斌. 基于模糊C-均值聚类法和粒子群优化算法的江西省无水港选址分析[J]. 南昌大学学报(工科版), 2018, 40(4): 403-. |
[4] |
杨怡君许志红. 灰关联聚类法用于CJ20接触器动态性能评价适用性[J]. 南昌大学学报(工科版), 2017, 39(04): 393-. |
[5] |
余亮曾勍炜石永革肖异瑶. 融合改进PSO和K-调和均值的混合聚类算法[J]. 南昌大学学报(工科版), 2017, 39(02): 184-. |
[6] |
刘卫东孙政揭丽琳赵志伟滕沙沙. 基于使用可靠性的空调分区保修期设计方法[J]. 南昌大学学报(理科版), 2017, 41(01): 36-. |
[7] |
熊玮; 白越; 刘爱国; 吴洁洁; 肖建. 基于改进RI方法的文本聚类[J]. 南昌大学学报(理科版), 2016, 40(05): 426-. |
[8] |
李艳红; 葛刚; 胡春华; 刘雪莹; 周晓岚. 基于聚类分析和因子分析的鄱阳湖流域水质时空变化特征及污染源分析[J]. 南昌大学学报(理科版), 2016, 40(04): 360-. |
[9] |
段文影;李向军;邱桃荣;段隆振. 一种具有自适应参数的基于密度加权的粗糙K-均值算法[J]. 南昌大学学报(理科版), 2012, 36(05): 498-. |
[10] |
朱必凤; 杨旭夫; 彭凌; 韦昭玉. 副猪嗜血杆菌外膜蛋白表型分析[J]. 南昌大学学报(理科版), 2011, 35(06): 1-. |
[11] |
彭迪云; 刘彩梅. 江西省环境与经济可持续发展状况的实证研究[J]. 南昌大学学报(理科版), 2011, 35(06): 1-. |
[12] |
彭国林; 马春曦; 杨尚凌; 邓兰. 某部海训官兵SCL-90测试结果的聚类分析[J]. 南昌大学学报(医学版), 2010, 52(09): 1-. |
[13] |
刘飞荣; 段隆振; 陈梅香; 杨艳玲. 一种基于动态模糊Kohonen网络的聚类模型及应用[J]. 南昌大学学报(理科版), 2010, 34(06): 1-. |
[14] |
江勇; 倪永年; 朱惠芳. HPLC测定酱油中的有机酸及其聚类分析[J]. 南昌大学学报(理科版), 2010, 34(05): 1-. |
[15] |
万益群; 唐莉娟. 人体尿液的三维荧光指纹图谱[J]. 南昌大学学报(理科版), 2010, 34(01): 1-. |
|
|
|