现代电子技术

2019, v.42;No.545(18) 45-49

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于文本特征识别的电子档案自动归类系统研究
Research on electronic archive automatic classification system based on text feature recognition

王珺;

摘要(Abstract):

传统归类方法采用自动标引主题词变换成分类号实现自动分类,该方法分类过程复杂,应用性差。因此,提出一种基于文本特征识别的电子档案自动归类系统。该系统采用电子档案语料库模块根据使用者需求挖掘语料,实现语料库构建、查询、清除和维护等操作;通过电子档案排版模块,基于内容映射的方式排版电子档案;在此基础上采用有限自动机选择法和组合特征选择法选取文本内特征词,识别电子档案文本特征后,通过SVM分类器和类别识别器两次归类过程,判断电子档案最终类别归属。封闭性归类测试和开放性归类测试结果表明,该系统的平均查全率和精度都高于95%,且不同信噪比环境下,系统平均中断概率为0.17%,低于对比系统。

关键词(KeyWords): 电子档案;自动归类;特征识别;语料库模块;排版模块;归类测试

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金(61801527);; 河南省教育厅人文社会科学研究项目(2019-ZZJH-503)~~

作者(Author): 王珺;

Email:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享