延边大学学报(自然科学版)

2021, v.47;No.141(01) 80-87

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于机器学习的高校毕业论文课题信息分析方法
An approach to analysis of brief summary of university graduation thesis based on machine learning

李路军;赵云;崔荣一;赵亚慧;

摘要(Abstract):

为协助教师详细了解毕业论文的课题分布情况,指导学生合理选择毕业论文课题,提出了一种基于机器学习的高校毕业论文课题信息分析方法.首先,对收集的论文课题信息文本进行规范化、去重、删除无关数据、分词等预处理,并通过人工筛选建立专业术语词典;其次,基于逆文档频率和专业术语确定特征词,利用TF-IDF算法和专业术语因子计算特征词的权重并构造归一化文档向量;最后,采用DBSCAN算法进行聚类,并采用Rand指数进行聚类评价,以此提取出Top-K高频特征词,并将其作为类簇描述的关键词.实验结果表明,该方法可有效分析论文课题内容的分布情况,进而为评价和设计毕业论文课题提供有效的依据.

关键词(KeyWords): 毕业论文分析;文本聚类;DBSCAN聚类算法;Rand指数

Abstract:

Keywords:

基金项目(Foundation): 吉林省高教学会项目(JGJX2018D347);; 延边大学教育教学改革研究课题(延大教发[2020]35号)

作者(Author): 李路军;赵云;崔荣一;赵亚慧;

Email:

DOI: 10.16379/j.cnki.issn.1004-4353.2021.01.014

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享