]*>","")" /> 基于统计和未登录词碎片字典的未登录词识别方法

›› 2011, Vol. 33 ›› Issue (4): 574-577.

• 自动化、计算机技术 • 上一篇    下一篇

基于统计和未登录词碎片字典的未登录词识别方法

李学明 邢敏玲 张佳培   

  1. 重庆大学计算机学院,重庆 400044
  • 出版日期:2011-08-25 发布日期:2011-12-01

  • Online:2011-08-25 Published:2011-12-01

摘要: 介绍了一种基于统计和未登录词碎片字典的未登录词识别方法。该方法首先在基于分词的基础上对一篇文本进行统计识别未登录词,然后利用未登录词碎片字典识别未登录词。实验结果表明:该方法较已有的未登录词识别方法更适用于识别文本中不断涌现的新词,在未登录词的召回率和准确率性能指标上达到了较好的效果。

关键词: 分词, 统计, 未登录词, 未登录词碎片字典