现代电子技术

2019, v.42;No.543(16) 104-107+111

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

高并发汉英信息抽取系统的设计与实现
Design and implementation of high-concurrency Chinese-English information extraction system

张少迪;艾山·吾买尔;郑炅;石刚;

摘要(Abstract):

随着大数据时代的来临,如何从海量数据中抽取出最有效的信息成为人们最迫切的需要。为了能够在大数据的环境下更好更快地进行汉英文本的信息抽取,文中采用Python编程语言,Django+uWSGI+Nginx框架,基于TextRank的图排序算法实现汉英文本信息抽取系统。该系统包含文本关键词提取,文本关键短语提取以及文本摘要提取。测试结果表明,该系统能够实现大规模数据的高并发稳定调用,在兼顾抽取质量的同时,还能实现超高效率的信息抽取,具有很好的实际应用价值。

关键词(KeyWords): 大数据;高并发;信息抽取;TextRank;uWSGI;Nginx;Django

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金资助项目(61762084);国家自然科学基金资助项目(61662077);国家自然科学基金资助项目(61462083);国家自然科学基金资助项目(61331011);; 新疆多语种信息技术实验室开放课题(2016D03023)~~

作者(Author): 张少迪;艾山·吾买尔;郑炅;石刚;

Email:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享