一种基于文本分类的特征选择方法
白似雪; 陆萍
南昌大学计算机科学与技术系; 南昌大学计算机科学与技术系 江西南昌330031; 江西南昌330031;
BAI Si-xue,LU Ping(Department of Computer Science and Technology,Nanchang University,Nanchang 330031,China)
摘要 文本分类中通常采用向量空间模型(VSM)来表示文本特征,如何选择最能够表达文本主题的特征词,从而减少特征空间维数,降低时空复杂度,是一个十分重要的问题。针对此问题本文提出了采用截集模糊C-均值(S2FCM)聚类进行类间特征降维,该方法以最大隶属度原则为指导,在保持模糊聚类的
关键词 :
特征词 ,
模糊聚类 ,
截集 ,
VSM
Abstract :Vector Space Model is often used to denote text feature in text classify.It is an important problem how to choice the feature words which can express the topic exactly,and consequently reduce space dimension and time complexity.For this,we put forward a m
Key words :
sectional set
feature words
fuzzy clustering;
VSM
出版日期: 2008-03-28
[1]
熊玮; 白越; 刘爱国; 吴洁洁; 肖建. 基于改进RI方法的文本聚类 [J]. 南昌大学学报(理科版), 2016, 40(05): 426-.
[2]
刘飞荣; 段隆振; 陈梅香; 杨艳玲. 一种基于动态模糊Kohonen网络的聚类模型及应用 [J]. 南昌大学学报(理科版), 2010, 34(06): 1-.
[3]
胡华碧; 赵平; 胡思贵; 杨梅. 极大前缀码的部分幂 [J]. 南昌大学学报(理科版), 2010, 34(05): 1-.
[4]
胡誉满; 王忠郴. 贷款需求量与利率关系的模糊曲线模型 [J]. 南昌大学学报(理科版), 2001, 25(01): 1-.
[5]
彭卫东; 崔晓民. 白纹伊蚊幼虫自然种群动态的模糊聚类分析 [J]. 南昌大学学报(医学版), 1992, 34(01): 1-.
[6]
游海. 模糊聚类分析在大气质量评价中的应用 [J]. 南昌大学学报(工科版), 1988, 10(02): 1-.
[7]
陈生; 张秀之. 模糊映射序列的公共不动点 [J]. 南昌大学学报(理科版), 1985, 9(02): 1-.