›› 2012, Vol. 34 ›› Issue (1): 119-122,147.

• 自动化、计算机技术 • 上一篇    下一篇

基于概念词的特征提取方法

何杰 朱征宇 董曙佳 于春雷   

  1. 重庆大学计算机学院,重庆 400044
  • 出版日期:2012-02-25 发布日期:2012-07-12

  • Online:2012-02-25 Published:2012-07-12

摘要:

为解决因未考虑语义关联造成的VSM描述不准确的问题,基于知网本体库计算词语间的语义相似度,采用识别完全子图的方式生成概念词列表,再用概念词替换存在密切语义关联的词语。实验表明,该方法在改进文档特征提取效果的同时也明显降低了向量空间的维度。与不经概念词处理的特征提取方法相比,该方法在分类识别率上有一定提升。

关键词: 概念词, 知网, 向量空间模型, 特征提取