期刊检索

  • 2024年第56卷
  • 2023年第55卷
  • 2022年第54卷
  • 2021年第53卷
  • 2020年第52卷
  • 2019年第51卷
  • 2018年第50卷
  • 2017年第49卷
  • 2016年第48卷
  • 2015年第47卷
  • 2014年第46卷
  • 2013年第45卷
  • 2012年第44卷
  • 2011年第43卷
  • 2010年第42卷
  • 第1期
  • 第2期

主管单位 中华人民共和国
工业和信息化部
主办单位 哈尔滨工业大学 主编 李隆球 国际刊号ISSN 0367-6234 国内刊号CN 23-1235/T

期刊网站二维码
微信公众号二维码
引用本文:张晓光,孙正,徐桂云,阮殿旭.一种类内方差与相关度结合的特征选择算法[J].哈尔滨工业大学学报,2011,43(3):132.DOI:10.11918/j.issn.0367-6234.2011.03.027
ZHANG Xiao-guang,SUN Zheng,XU Gui-yun,RUAN Dian-xu.A feature selection algorithm combining within-class variance with correlation measure[J].Journal of Harbin Institute of Technology,2011,43(3):132.DOI:10.11918/j.issn.0367-6234.2011.03.027
【打印本页】   【HTML】   【下载PDF全文】   查看/发表评论  下载PDF阅读器  关闭
过刊浏览    高级检索
本文已被:浏览 1743次   下载 1138 本文二维码信息
码上扫一扫!
分享到: 微信 更多
一种类内方差与相关度结合的特征选择算法
张晓光1,2, 孙正3, 徐桂云1, 阮殿旭1
1.中国矿业大学机电工程学院;2.哈尔滨工业大学现代焊接生产技术国家重点实验室;3.枣庄学院物理与电子工程系
摘要:
为了解决现有特征选择算法没有同时考虑特征之间以及特征与类别之间的相关性,且存在计算量大、适用范围窄等问题,从均方误差最小的分类训练准则出发,并借鉴线性鉴别分析的思想,提出了一种类内方差与相关度结合的特征选择算法,并使用核方法将其推广到可以解决非线性分类的特征选择问题.该算法不仅同时考虑了样本特征之间以及特征与分类标号之间的相关性,而且使得类内方差最小,有效地提高了分类器的性能.仿真实验表明:该算法适用于对特征数量多、特征相关性强的数据集进行特征选择,其选择的特征子集能够显著提高分类精度,具有较大的优越性.
关键词:  类内方差  相关度  特征选择  LDA  分类
DOI:10.11918/j.issn.0367-6234.2011.03.027
分类号:TP301.6
基金项目:现代焊接生产技术国家重点实验室开放课题研究基金资助;江苏省高技术研究资助项目(BG2007013)
A feature selection algorithm combining within-class variance with correlation measure
ZHANG Xiao-guang1,2, SUN Zheng3, XU Gui-yun1, RUAN Dian-xu1
1.College of Mechanical and Electrical Engineering,China University of Mining and Technology,221116 Xuzhou,China;2.State Key Lab of Advanced Welding Production Technology,Harbin Institute of Technology,150001 Harbin,China;3.Physics & Electronics Engineering Department,Zaozhang University,277160 Zaozhuang,Shandong,China)
Abstract:
To solve the problems of large calculation and narrow application scope of present feature selection algorithms which do not take the correlation among sample features and that between sample features and classification labels into account,a feature selection algorithm combining within-class variance with correlation measure was proposed based on the principle of the minimum mean square error for classifier and the idea of linear discrimination analysis,then the algorithm was expanded to solve nonlinear feature selection problems by using kernel technology.The proposed algorithm can not only consider both the correlation among the features and that between the features and classification labels,but also minimize the within-class variance,effectively improving the generalization performance of classifier.The experimental results show that the proposed algorithm can be used to select important features from these data sets with numbers of correlation characteristics,and effectively improves the classification accuracy.
Key words:  within-class variance  correlation measure  feature selection  LDA  classification

友情链接LINKS