|
|
基于D-S证据理论的无监督异常检测算法 |
衷卫声 吴自望 张强 |
南昌大学先进制造学院 南昌大学信息工程学院 |
|
|
摘要 在实际应用中,当数据集缺少真实标签或正常点数据量不足时,可能导致一分类支持向量机处于无监督情况。此外,当训练集中包含异常数据时,一分类支持向量机生成的决策边界将偏斜至异常数据区域。上述问题降低了异常数据的检测率,并导致分类器的性能变差。为了解决上述问题,基于K近邻算法将数据集分为可疑正常点数据集与可疑离群点数据集。其中,可疑正常点数据集用于一分类支持向量机训练与建模,对于可疑离群点数据集则采用D-S证据理论来识别其中的正常数据。实验结果表明:基于D-S理论的无监督异常检测算法可以有效地分离正常点与异常点,该算法在整体数据集上Auc均值达到了0.83,且在可疑离群点数据集上Auc均值达到了0.883。
|
|
关键词 :
离群点检测,
一分类支持向量机,
Dempster-Shafer证据理论,
无监督学习
|
|
基金资助:国家自然科学基金资助项目(62161022); |
|
|
|