延边大学学报(自然科学版)

2020, v.46;No.139(03) 260-264

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于字典树语言模型的专业课查询文本校对方法
Query text proofreading method of professional courses based on trie tree language model

李丹阳;赵亚慧;罗梦江;崔荣一;

摘要(Abstract):

针对中文文本校对技术中存在的校对准确率较低的问题,提出了一种基于字典树模型的专业课查询文本校对方法.首先,通过计算错误文本与匹配文本间的编辑距离对错误关键词进行模糊匹配;其次,采用字典树语言模型建立搜索树,以提高查询效率.最后,通过对比不同文本相似度阈值下的校对效果选取最佳文本相似度阈值.在最佳阈值下(0.5),将本文模型与传统的拼音模型和N-gram模型进行问句校对对比显示,本文方法的准确率(77.91%)、召回率(67%)、F值(72.04%)比传统的拼音模型校正方法分别提高了5.69%、23.67%和11.57%,比N-gram模型校正方法分别提高了0.64%、10.33%和7.89%.因此,本文提出的方法在专业课查询文本校对方面具有很好的应用价值.

关键词(KeyWords): 字典树;文本校对;语言模型;自动纠正

Abstract:

Keywords:

基金项目(Foundation): 国家语委“十三五”科研规划项目(YB135-76);; 延边大学外国语言文学世界一流学科建设科研项目(18YLPY13,18YLPY14)

作者(Author): 李丹阳;赵亚慧;罗梦江;崔荣一;

Email:

DOI: 10.16379/j.cnki.issn.1004-4353.2020.03.013

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享