期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向大数据短文本的高并发语种识别系统的设计与实现 被引量:1
1
作者 伊克拉木·伊力哈木 艾山·吾买尔 +1 位作者 王路路 麦麦提依明·巴吾顿 《现代计算机》 2020年第20期7-13,共7页
在如今大数据环境中包含大量不同语种的网络短文本数据,尤其是在国内多民族地区的网络环境中多种语言混杂的情况普遍存在。为了解决此类易混淆短文本的识别问题,设计一种基于编码区间判断,特征字符检测和基于N-Gram的朴素贝叶斯分类器... 在如今大数据环境中包含大量不同语种的网络短文本数据,尤其是在国内多民族地区的网络环境中多种语言混杂的情况普遍存在。为了解决此类易混淆短文本的识别问题,设计一种基于编码区间判断,特征字符检测和基于N-Gram的朴素贝叶斯分类器相结合的多策略方法,并在此基础上设计一套结合Nginx、uWSGI和Django的语种识别系统,提升系统的高并发能力。实验结果表明,该系统能高效识别网络中各类易混淆短文本的所属语种信息。 展开更多
关键词 大数据 高并发 语种识别 N-GRAM 朴素贝叶斯 uWSGI NGINX DJANGO
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部